0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息Owen ZHU:大模型百花齐放,算力效率决定速度

全球TMT 来源:全球TMT 作者:全球TMT 2023-09-01 06:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2023年8月31日/美通社/ -- 与狭义的人工智能相比,通用人工智能通过跨领域、跨学科、跨任务和跨模态的大模型,能够满足更广泛的场景需求、实现更高程度的逻辑理解能力与使用工具能力。2023年,随着 LLM 大规模语言模型技术的不断突破,大模型为探索更高阶的通用人工智能带来了新的曙光。通用人工智能进入了快速发展期,在中国,大模型已经呈现出百花齐放的态势,各种大模型层出不穷。

要想在"百模争秀"的时代占得先机,AI开发团队需要着力化解算力、算法、数据层面的巨大挑战,而开发效率和训练速度是保障大模型市场竞争力的核心关键因素,也是未来的核心发力点。近日,浪潮信息人工智能与高性能应用软件部 AI 架构师Owen ZHU参与首届由CSDN、《新程序员》联合主办的NPCon大会,发表重要技术演讲,分享面向新一轮AIGC产业革命,AI大模型的算力系统解决之道,并强调算力、算法、数据和系统架构等多个方面的综合优化对大模型训练到了至关重要的作用。

以下为Owen ZHU在NPCon大会的演讲实录整理:

"百模争秀"时代的算力瓶颈

大模型研发的核心技术是由预训练与Alignment组成的,第一部分就是预训练,需要用大量的数据使模型收敛速度更快、性能更好。第二部分则是Alignment,Alignment不完全等于强化学习,其通过使用多种方式/策略优化模型输出,让AI在和人的交流反馈中学会如何沟通表达,这两部分是提升大模型质量的核心要素。

目前来看,模型基础能力取决于数据、模型参数量和算力。模型参数量越大、投入的训练数据越大,模型泛化能力越强。由于资源限制,在两者不可兼得的时候,应该如何进行取舍呢?OpenAI的研究结论认为,与增加数据量相比,先增大模型参数量受益则会更好,用一千亿的模型训练两千亿的Token和两千亿模型训练一千亿的Token,后者的模型性能会更高。

由此可见,参数量是衡量模型能力的一个重要指标,当模型参数量增长超过一定阈值时,模型能力表现出跃迁式的提升,表现出来语言理解能力、生成能力、逻辑推理能力等能力的显著提升,这也就是我们所说的模型的涌现能力。

模型规模多大能产生涌现能力呢?现在来看,百亿参数是模型具备涌现能力的门槛,千亿参数的模型具备较好的涌现能力。但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如GPT-3的每个参数基本上只训练了1-2个Token,DeepMind的研究表明,如果把一个大模型训练充分,需要把每个参数量训练20个Token。所以,当前的很多千亿规模的大模型还需要用多10倍的数据进行训练,模型性能才能达到比较好的水平。

无论是提高模型参数量还是提升数据规模,算力依旧是大模型能力提升的核心驱动力:需要用"足够大"的算力,去支撑起"足够精准"模型泛化能力。当前大模型训练的算力当量还在进一步增大,从GPT-3到GPT-4算力当量增长了68倍。算力当量越大,交叉熵越小,模型能力越强。随着训练的token数、模型参数、计算量的增加,语言模型的loss在平滑下降,这就意味着大语言模型的精度可以随着计算量、参数规模、token数扩展进一步提升。

wKgaomTxFz2AJ6zhAAC74zxmQzk557.jpg


欲炼大模型,先利其器

大模型能力来源于大量工程实践经验,预训练的工程挑战巨大,这表现在如下几个方面:首先,AI大模型的演化对于集群的并行运算效率、片上存储、带宽、低延时的访存等也都提出了较高的需求,万卡AI平台的规划建设、性能调优、算力调度都是很难解决的难题;其次,大规模训练普遍存在硬件故障、梯度爆炸等小规模训练不会遇到的问题;再次,工程实践方面的缺乏导致企业难以在模型质量上实现快速提升。

作为最早布局大模型的企业之一,浪潮信息在业界率先推出了中文AI巨量模型"源1.0",参数规模高达2457亿。千亿参数规模的大模型创新实践,使得浪潮信息在大模型领域积累了实战技术经验并拥有专业的研发团队,为业界提供AI算力系统参考设计。在算力效率层面,针对大模型训练中存在计算模式复杂,算力集群性能较低的情况,源1.0在大规模分布式训练中采用了张量并行、流水线并行和数据并行的三维并行策略,训练耗时约15天,共计训练了180 billion token,并将模型最后的loss值收敛至1.73,显著低于GPT-3等业界其他语言模型。首次提出面向效率和精度优化的大模型结构协同设计方法,围绕深度学习框架、训练集群IO、通信开展了深入优化,在仅采用2x200G互联的情况下,源1.0的算力效率达到45%,算力效率世界领先。在集群高速互联层面,基于原生RDMA实现整个集群的全线速组网,并对网络拓扑进行优化,可以有效消除混合计算的计算瓶颈,确保集群在大模型训练时始终处于最佳状态。

为大模型良好生态发展寻找最优解

当前,中国和业界先进水平大模型的算力差距依然较大,从算力当量来看,GPT-4的算力当量已经达到了248,842PD,而国内大多数主流的大模型算力大量仅为数千PD,差距高达近百倍。

同时,中国和业界先进水平大模型在算法、数据方面也存在巨大差距。在算法方面,虽然开源为国内大模型发展带来了弯道超车的良机,但LLaMA等开源大模型相比GPT4等顶级水平自研模型的性能,开源模型的能力存在"天花板"。

在数据方面,中文数据集和英文数据集相比较,在规模、质量上均存在显著差距,相较于动辄数千亿单词量级的英文数据,中文大模型的数据量级仅为百亿左右,而且开源程度较低,封闭程度较高。

开发大模型、发展通用人工智能是一项非常复杂的系统工程,我们亟需从系统层面为未来大模型的良好生态发展寻找最优解。从实战中走来,通过构建高效稳定的智算系统,加速模型开发效率提升。

日前,浪潮信息大模型智算软件栈OGAI(Open GenAI Infra)——"元脑生智"已正式发布。浪潮信息正通过"工具化、系统化、全链条"的全栈赋能能力,让炼大模型省时、省力,让大模型更快、更稳、更智能,助力百模真正实现"竞速AIGC"。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41360

    浏览量

    302737
  • 人工智能
    +关注

    关注

    1821

    文章

    50372

    浏览量

    267082
  • 大模型
    +关注

    关注

    2

    文章

    3804

    浏览量

    5280
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海光主板,3450G强加快数智技术创新

    数字经济浪潮席卷全球,数智技术创新已成为驱动产业升级、推动社会进步的核心引擎,而力作为数智时代的“核心生产”,直接决定了数智创新的速度
    的头像 发表于 03-31 14:08 349次阅读
    海光主板,3450G强<b class='flag-5'>算</b><b class='flag-5'>力</b>加快数智技术创新

    国产工业操作系统选型指南:硬实时、功能安全与生态怎么选

    、能源电力等关键领域的连续运行,都离不开一款适配场景、性能过硬的工业操作系统。 当前,国产工业操作系统百花齐放,但企业选型时往往陷入“参数堆砌”的误区,忽略了硬实时性能、功能安全等级与生态兼容性三大核心诉求——这三
    的头像 发表于 03-04 09:48 1158次阅读

    京东方华灿光电MPD技术打造新型显示创新生态

    在刚刚落幕的ISE 2026展会上,COB、COG、MiP等多条技术路线百花齐放,全面覆盖专业显示、商用显示、家用终端及创意显示等多元应用场景。值得注意的是,近30 家行业标杆企业集中展出 Micro 大屏量产方案,标志着 Micro 显示正式迈入规模化、产业化新阶段。
    的头像 发表于 02-25 16:37 1572次阅读
    京东方华灿光电MPD技术打造新型显示创新生态

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种密度下,散热怎么解决?而且昇腾的生态适配
    发表于 10-27 13:12

    公布2025年中国十大智能电表厂家品牌排行榜

    随着能源数字化转型的加速,智能电表作为电网智能化的重要基石,其技术与市场格局备受关注。2025年,中国智能电表行业在政策支持与技术迭代的双重驱动下,呈现出百花齐放的竞争态势。本文将结合行业数据、技术实力及用户口碑,为您揭晓本年度最具影响的十大智能电表品牌排行榜。
    的头像 发表于 10-22 15:48 4466次阅读
    公布2025年中国十大智能电表厂家品牌排行榜

    研华三维曲面AI检测方案有什么亮点

    2025工博会正如火如荼进行中,各家展台争奇斗艳,工业自动化百花齐放。研华三维曲面控制AI检测方案在其中悄然盛开。
    的头像 发表于 09-30 10:36 921次阅读

    中国智能规模增长将超40%

    表示预计在2025年,中国智能规模增长将超过40%。 据中国信息通信研究院副院长 魏亮表示:目前,中国平台实现了100多个
    的头像 发表于 08-25 19:28 1074次阅读

    浪潮信息发布&quot;元脑SD200&quot;超节点,面向万亿参数大模型创新设计

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器"元脑SD200"。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上
    的头像 发表于 08-08 22:17 795次阅读
    <b class='flag-5'>浪潮信息</b>发布&quot;元脑SD200&quot;超节点,面向万亿参数大<b class='flag-5'>模型</b>创新设计

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    模型轻量化部署方案。用户通过远程平台预置的模型镜像与AI工具,仅需50%的GPU即可解
    的头像 发表于 07-30 21:44 1080次阅读

    浙江移动携手华为全面推进AI+赋能应用百花齐放

    AI作为新质生产的核心驱动力,正加速浙江移动自有业务的数智化转型。浙江移动携手华为,全面推进AI+赋能应用“百花齐放”,赋能一线工作提质提效,支撑公司生产经营全面转型。
    的头像 发表于 07-28 10:07 1031次阅读

    瑞芯微生态百花齐放,我在第九届开发者大会看到了未来!

    个新生态正在加速崛起。 一,百花齐放的瑞芯微生态 走进福州海峡国际会展中心大会主展厅,硕大的展区分区展示着不同的产品和场景,一台台搭载瑞芯微芯片的设备正在展示着它们在不同领域的应用:机器视觉、服务机器人、工业控制系
    的头像 发表于 07-25 10:09 1513次阅读
    瑞芯微生态<b class='flag-5'>百花齐放</b>,我在第九届开发者大会看到了未来!

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI的三要素,是、算法和数据。而AI
    的头像 发表于 07-23 12:18 1986次阅读
    一文看懂AI<b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    飞利信与浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息与北京飞利信电子技术有限公司等22家战略合作伙伴达成签约,其中将面向北京人工智能应用大市场,在产品技术共创、行业场景深化及区域
    的头像 发表于 06-24 17:37 1259次阅读

    基于魔方的智能文档信息提取方案

    的进步,使得自动化和智能化的文档信息提取成为现实。本方案结合了Intel OpenVINO平台的性能优化优势与度飞桨(PaddlePaddle)提供的PP-OCRv4模型,旨在开发一款高性能、高精度的智能文档处理系统。
    的头像 发表于 05-15 10:37 741次阅读
    基于<b class='flag-5'>算</b><b class='flag-5'>力</b>魔方的智能文档<b class='flag-5'>信息</b>提取方案