0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型对算力需求指数级增长,集群成必然选择

Carol Li 来源:电子发烧友网 作者:李弯弯 2024-01-23 00:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)近年来,AIGC技术的火爆,代表着AI正在从感知理解世界向生成创造世界跃迁。在近日举办的全球人工智能算力论坛上,宝德计算信创BU副总裁邓克武谈到,AIGC产业发展创新正在加速,预计到2030年市场规模会到达万亿。然而随着AI技术的飞速发展,算力也成为了制约AI大模型应用普及的关键因素。

大模型重塑产业格局

在邓克武看来,AIGC产业发展预计将会经历三个阶段。第一个阶段是2023年到2025年,属于培育摸索期,该阶段主要以遵循指令性加工和拼接式为主,例如,播报类(语音合成的电子书)、数字人(支持多种类型任务的数字人)、营销推广等。

第二个阶段是2025年到2027年,这个时期会是AIGC的应用蓬勃期,该阶段主要以人机联合共创的模式为主,例如,各种类型的生成任务,以AI生成为基础进行迭代;行业生态完善,底层大模型对外开发。

第三阶段是2028年以后,这个时期为AIGC增长期,到这个时候,产业链逐渐完善,商业化场景持续拓展拓深,深入变革各行业,预计2030年市场规模超万亿。

邓克武认为,大模型将重构人工智能生产范式。他还提到“人工智能行业的二八定律”,即进入大模型时代,未来软件80% 的价值将由AI大模型提供,剩余20% 会由提示工程和传统业务开发组成。

同时,他认为,MaaS将重构商业化生态,大模型“训练基础设施-底层技术-基础应用-垂直应用”发展路线逐渐清晰。MaaS,即Model as a Service,模型即服务,能够降低AI应用开发门槛,重构AI产业的商业化结构生态,激发新的产业链分工和商业模式不断涌现。MaaS将可能成为未来大模型的主流商业模式。

wKgaomWuQcWAK2UiAAOkfzX9rA0549.jpg

随着大模型的发展,其应用也会逐步拓展,从初期To C现象级应用向通用To B应用,再向场景化To B应用发展。当然,这个过程也面临不同的挑战,To C应用的挑战在于用户商业付费挑战大:使用门槛较低,用户量大且接受度高,落地及成长速度快,但客户付费意愿偏低,商业闭环挑战大。To B应用的挑战在于和行业数据&应用的深度融合:行业数据积累、模型调测和行业应用集成均需要时间,但客户付费能力强,未来增长及盈利空间广阔。

wKgZomWuQc2AR164AANGfIPU7Rc847.jpg

算力集群化发展是必然趋势

目前,国内已有超100+企业在战略布局大模型机会。对于企业来说,需要准备迎接产业变革,构筑新的竞争优势。如何做呢?其一,对内提升自身业务效率与感知,即与自身行业、业务特点和需求等深度结合;其二,面向中小企业提供AI模型服务,通过API/三方插件吸引更多应用及数据,通过提供模型开发服务,深度切入行业,掌握行业经验和数据;其三,面向AI创业者/企业提供算力服务,满足企业AI算力需求,构筑数字基础设施格局。

算力方面,大算力集群是业界厂家AI模型开发的共同选择,如腾讯数万卡规模的星星海AI集群,阿里巴巴12EFLOPS的灵骏AI集群,百度4EFLOPS 百舸AI集群,商汤3.7EFLOPS AIDC集群,华为数万卡规模昇腾AI集群等。

在邓克武看来,大模型对算力的需求将指数级增长,AI算力将从单机走向集群时代。据邓克武介绍,大模型算力需求每两年以750倍增长,而硬件算力供给每两年仅增长3倍。比如,从ResNet-50(2500万参数),到GPT-1(1.7亿参数),再到GPT-4(万亿级参数),计算需求需要十倍,到千倍的增长,存储需求经历百倍,到千倍的增长。AI算力和数据中心集群发展,可以加速产业创新。

wKgaomWuQdeAEc6VAAMNjqXMsYk852.jpg

宝德计算作为中国领先的计算产品方案提供商,构建了自强昇腾高密算力平台,以支撑大模型系统工程建设。在上述论坛上,邓克武详细介绍了公司的两款服务器:PR420KI G2训练服务器和PR410EI 训练服务器。

PR420KI G2训练服务器CPU采用了4颗鲲鹏920处理器,NPU采用了8颗昇腾910,节点内互联采用HCCS Full mesh互联高速网络;PR410EI 训练服务器CPU采用2颗第四代Intel至强可拓展处理器Sapphire Rapids,NPU采用8颗昇腾910,节点内互联采用HCCS Full mesh互联高速网络。

同时,他还介绍了公司的Pod集群组网,以256台训练服务器为例,共计2048颗Ascned910芯片。分成16组,每组16台服务器,里面放置一个完整的模型,每组之间采用数据并行;每组16台服务器,采用模型并行,每台服务器放1/16的模型。

wKgZomWuQeGAHZa7AANDrZbF8yY786.jpg

据邓克武介绍,宝德面向多种大模型部署方式,还构建了差异化解决方案。此外,公司联合生态伙伴不断深化合作,成功实践了100多个AI项目,涵盖了电力、安平、教育、金融、互联网、智慧城市等行业,宝德将继续探索更多行业和细分领域智能化实践,共同加速AI行业智能化升级和落地。

写在最后

经过一年多时间的发展,大模型商业化应用已经成为业界探索的焦点,并且已经进展明显。与此同时,随着大模型训练和部署的持续加速,这对算力的需求也会大幅增长。为了满足大模型训练和部署需求,集群成为厂家模型开发的共同选择。而能够为各种大模型部署提供算力支持的企业也必然会乘风而起。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38184

    浏览量

    296963
  • 算力
    +关注

    关注

    2

    文章

    1389

    浏览量

    16566
  • AIGC
    +关注

    关注

    1

    文章

    391

    浏览量

    3153
  • 大模型
    +关注

    关注

    2

    文章

    3454

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    “四合一”平台,芯片国产化率超九,兼容8种国产AI芯片

    调度平台可支持每天上亿次的调用,能调度全国1/6的规模,网一体化效率提升20%。   为什么要搭建这个“四
    的头像 发表于 04-13 00:03 3593次阅读

    积木+3D堆叠!GPNPU架构创新,应对AI推理需求

    电子发烧友网报道(文/李弯弯)2025年,人工智能正式迈入应用推理时代。大模型从实验室走向千行百业,推理需求指数爆发。然而,高昂的推理成本与有限的
    的头像 发表于 12-11 08:57 3990次阅读

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    “超节点+集群”:华为撞出来的之路

    “超节点+集群”,成为彻底解决AI困局的契机
    的头像 发表于 09-24 10:55 828次阅读
    “超节点+<b class='flag-5'>集群</b>”:华为撞出来的<b class='flag-5'>算</b><b class='flag-5'>力</b>之路

    杭州灵汐类脑智集群实现大模型快速推理

    电信具体承担集成建设。该集群部署在中国电信杭州智中心,规模超200POPS。这也是类脑智集群
    的头像 发表于 08-18 16:06 698次阅读

    壁仞科技联合三方打造国产集群落地

    近日,由浙江联通、壁仞科技、中兴通讯、优云科技四方联合打造的国产集群,在浙江乌镇智中心正式点亮。该集群项目的建成,不仅极大地丰富了浙江
    的头像 发表于 08-01 15:26 1158次阅读

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI的三要素,是、算法和数据。而AI
    的头像 发表于 07-23 12:18 997次阅读
    一文看懂AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>集群</b>

    热插拔集群

    热插拔集群指在无需停机的情况下,动态增减计算节点或硬件的基础设施,其核心价值在于实现资源的弹性伸缩和业务连续性。以下从关键技术、应用
    的头像 发表于 06-26 09:20 715次阅读

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的突破

    近年来,随着千亿参数模型的崛起,AI训练对需求呈现指数
    的头像 发表于 04-24 09:27 616次阅读

    施耐德电气发布数据中心高密度AI集群部署解决方案

    在人工智能(AI)驱动的产业革命浪潮中,数据中心正迎来深刻变革。面对迅猛增长的人工智能需求,部署高密度AI集群已成为数据中心发展的
    的头像 发表于 04-19 16:54 1261次阅读
    施耐德电气发布数据中心高密度AI<b class='flag-5'>集群</b>部署解决方案

    智能最具潜力的行业领域

    智能最具潜力的行业领域 一、金融行业 智能风控与精准服务‌:大型银行通过集群(6.27万台服务器)支撑AI
    的头像 发表于 04-11 08:20 1041次阅读
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潜力的行业领域

    DeepSeek推动AI需求:800G光模块的关键作用

    类型和功耗选项,是数据中心向800G带宽扩展的理想选择。 市场前景广阔: 随着AI需求的不断增长,尤其是在超大规模数据中心和AI
    发表于 03-25 12:00

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 806次阅读

    国产智集群黑马!曦源一号SADA集群综合评测表现优异

    近日,加佳科技曦源一号SADA集群项目一期顺利通过工信部中国软件评测中心权威评测认证。本次测试涵盖了项目一期已上线的1024张沐曦高性能GPU加速卡集群。评测结果显示,该
    的头像 发表于 12-25 11:16 1190次阅读
    国产智<b class='flag-5'>算</b><b class='flag-5'>集群</b>黑马!曦源一号SADA<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>集群</b>综合评测表现优异