0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

算力十问:超算智算,通算及算存比

智能计算芯世界 来源:C114通信网 2024-04-13 11:40 次阅读

算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力,主要通过算力中心等算力基础设施向社会提供服务。算力基础设施是新型信息基础设施的重要组成部分,呈现多元泛在、智能敏捷、安全可靠、绿色低碳等特征,对于助推产业转型升级、赋能科技创新进步、满足人民美好生活需要和实现社会高效能治理具有重要意义。

在第二届“华彩杯”算力大赛启动会上,中国工程院院士邬贺铨作了《算力十问》的主题演讲。

一问:如何准确衡量算力?

邬贺铨指出,现有测算方法难以精准衡量算力。国内企业服务器的出货量并不等于国内市场的使用量,而且进口国外的服务器未统计在内;服务器出货量也不等于上架量,更不等于已经加电使用量。通常服务器集群的算力不等于集群内服务器算力之和;通过问卷调研方法收集的数据也未必能全面反映目前实际使用情况。

二问:超算、通算、智算三类算力是否可以互相调剂?

超算和通算可否承担生成式大模型的训练和推理任务?智算适合承担目前超算和通算的任务吗?建设兼具三类节点能力的融合算力中心会有利于三类算力的调度吗?

三问:三类算力有无合理比例?

邬贺铨认为,不同地区需求不同,不可能有固定的比例。通常国家与区域创新中心城市对超算有较大需求;机密性和时延敏感性决定了城市政务数据和重要企业关键数据尽量在同城通算;东部地区的AI训练任务重、智算比例高;西部算力枢纽也需要增加智算能力,但一般西部地区以配置通算为主。

四问:何谓合适的算存比?

邬贺铨强调,存力与算力需配合,避免因存力短缺造成算力等待而影响处理效率。而存力按位于服务器内外分为内存与外存,对于CPU密集型计算任务,影响算力效率与性能的主要是内存,据分析合理的算存比是GFlops/GB为1;对I/O密集计算任务,需频繁访问外存,如何考虑计入外存力的算存比合理取值,值得商榷。邬贺铨同时指出,存力有HDD机械硬盘和SDD固态硬盘之分,后者可节能70%,但我国SDD仅占24.7%,不及美国一半。

五问:如何根据大模型参数量及训练数据量来设计算力需求?

AI模型参数是指深度神经网络各层神经元间连接矩阵的权重和偏置,模型输出值=权重×输入值+偏置。

算力规模(峰值Flops)≈8×训练数据(tokens Byte)×模型参数/训练时间(秒)×算力利用率(0.3~0.55)。

存力规模(Byte)≈10×模型参数×计算精度(Byte)。

理论上可以通过增加训练时长来降低对大模型训练算力的需求,但训练时长的增加意味算力芯片集群出错的次数增加,为应对出错所需存盘开销也增加,计算效率显著下降。据OpenAI的经验,模型大小和数据集大小及用于训练的算力规模三个因素同时放大才有最佳效果,据分析,当不受其他两个因素的制约时,大模型性能与单个因素都有幂律关系。

六问:如何利用边缘与终端的算力?

当边缘/终端具有70亿参数以上的推理能力时,边缘/终端可离线进行推理任务,目前手机可支持130亿参数,2024年还会出现支持千亿参数的手机。当边缘/终端仅具有10亿参数的推理能力时,需要与云端协同提供智能能力。邬贺铨提出,单终端算力小,数以亿计的终端算力集合就非常可观,但跨终端的协同计算是否可行值得商榷。

七问:异地算力节点的协同可行吗?

邬贺铨认为,将算力集群扩展到跨域,多个异地的算力节点共同承担一个计算任务,实时性的交互要求光传输系统无损和确定性时延,任何丢包和抖动都无法保证计算效率;在异属异构的场景下异地协同计算的实施可操作性更是挑战。他强调,集约化建设大型算力节点比分布异地协同能够显著提升能效和算力效率,东数西算和数据灾备都需要在异地算力枢纽间建立广域连接,但这仅是算力任务的转移而不是异地实时协同计算。

八问:算力的接入需要集中管理与指配吗?

不通过国家算力调度平台能够构建全国一体化算力网和算力大市场吗?或者可以由算力节点拥有方和需求方联合建立算力服务联盟,以市场机制来沟通供需。另外,在强调企业为主体发挥市场有效作用的前提下,还需要强化有为政府的角色,通过建立结对子等东西部联动机制强化区域间算力协同。

九问:算网协同做什么和如何做?

算力与网络往往属于不同的运营主体,跨运营商的协同调度也有管理难题。而且网络通常并不感知所承载的数据属性。当前,首先要厘清算网协同的标准与方法,发挥IPv6的分段选路、SRV6作为算网协同统一承载协议的作用,通过编程空间实现云网/算网的融通。

十问:如何解除中小企业使用算力的顾虑?

邬贺铨建议,政府站台主导建设面向中小企业的云智平台,降低企业利用算力的门槛和对安全的担心。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 超算
    +关注

    关注

    1

    文章

    109

    浏览量

    8973
  • 算力
    +关注

    关注

    1

    文章

    659

    浏览量

    14364
  • 大模型
    +关注

    关注

    2

    文章

    1543

    浏览量

    1139

原文标题:算力十问:超算智算,通算及算存比

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值 内存:16GB L
    发表于 02-28 11:21

    国资委发文鼓励、Sora开年爆火…智中心的2024注定热辣滚烫?

    中心Sora
    脑极体
    发布于 :2024年02月27日 16:11:19

    iBeLink KS MAX 10.5T大领跑KAS新领域

    有8G的显存,可以处理复杂的算法,提高挖掘稳定性。iBeLink ks max10.5T的超大特点是它的高效节能,它采用了先进的“一体”高通量芯片,专为“大型复杂”的区的块的链
    发表于 02-20 16:11

    请问用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量?

    来自一位用户的咨询,麻烦帮忙解答,越详细越好,有图有真相,可以适当提供一些英飞凌解决方案和产品推荐。 用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量? 未来电动汽车会使用SOC来代替大量MCU?
    发表于 02-02 07:16

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    请问AD芯片采集和转换时间怎么啊?

    请问AD芯片采集和转换时间怎么啊?就是输入到单片机之前,采集完所有通道并完成转换的时间,以AD7994为例,能不能介绍下?
    发表于 12-21 07:32

    AD7192转换速率怎么

    大家好! 请问AD7192的转换速率怎么啊? 手册上提到15.5位无噪声分辨率(2.4 kHz, G = 128) 和输出数据速率:4.7 Hz至4.8 kHz 上边的2.4k指的是转换速率么? AD7192每秒钟最快转换多少次啊?谢谢!
    发表于 12-19 07:06

    线速度怎么

    怎么? 公式:线速度=转速*周长 这里有个两个问题, 1,这周长是哪个的周长?? 2,大辊轴的转速是不是等于减速机??还要不要再做一个200:45的减速比?
    发表于 11-13 07:44

    ESP32,ESP8266SOC吗?

    ESP32,ESP8266SOC吗,都是什么内核的MCU。如果具有MCU,那是不是有些不需要太多IO的应用可以直接用ESP32或8266来做,既有了MCU逻辑控制,也有了自身的WIFI连接功能。
    发表于 11-06 07:02

    c语言时间for延时,怎么时间?

    c语言时间 for延时,怎么时间?for(i=;;)
    发表于 10-08 07:46

    stm32f103的float和double计算时间哪个快?

    stm32f103的float和double计算时间哪个快
    发表于 09-26 07:25

    C语言定时器如何时间?

    C语言定时器如何时间,比如我要定时一个定时要怎么写,请大神指导一下。
    发表于 09-25 08:16

    蜂鸟内核怎么正余弦函数?

    我想问一下蜂鸟内核怎么正余弦函数
    发表于 08-12 07:52

    请问PWM捕获测量脉宽最大值怎么

    就是测量最长的脉宽怎么?可不可以标记一下,比如说一个计数周期后
    发表于 06-20 07:27

    FPGA实现MPU6050姿态解

    一. 简介 在之前的文章中(很久之前了,已经通过FPGA获取到了MPU6050的六轴数据: 三轴加速 和 三轴角速度,但是没有对它进行然后处理。那么在本篇文章中,将利用Cordic算法来进行姿态解
    发表于 06-08 13:49