0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

昇腾AI云服务,中国AI的翼翼长城

脑极体 来源:脑极体 作者:脑极体 2025-05-20 09:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgZO2grHWmACv5BAAepNNO1j1g055.jpg

过去几天,中美经贸关系发生着极速变化。而变化的主基调是,美国希望从贸易战的短期冲撞,重新回到长期进行,同时也更加残酷的科技绞杀上。

5月12日中美双方发布联合声明,决定大幅下降关税。紧随其后的5月14日,美国政府亮出了瞄准中国AI的“獠牙”,美国商务部工业与安全局(BIS)突然宣布,即日起在全球范围内禁用中国先进集成电路

美国出招绝非无的放矢,就在一个月前,华为发布了CloudMatrix384 超节点,该技术通过384张卡构建超节点集群,超级云服务器,最高提供300Pflops的算力规模。这意味着,美国通过N卡禁售来限制中国AI算力发展的技术围堵,或将被彻底打破。

从DeepSeek的算法层突破,到CloudMatrix384的算力层突围,中国AI正以系统性创新,弥补单芯片制程差距,美国发现其“卡脖子”逻辑正在失效。

接下来,美国必然会进一步打压中国AI的任何生存空间,更证明了模型自主与算力自强的重要性。昇腾云算力就是出路,就是防线。

wKgZPGgrHWqAOu3uAAQSAuy96Ls028.jpg

5月16日,华为云AI峰会中,华为云副总裁黄瑾又进一步披露了更多CloudMatrix 384 超节点的创新技术细节。CloudMatrix 384 超节点持续壮大,把“杀不死你的必会让你更强大”写进现实。

wKgZO2grHWuAcXXXAAGi_jMpPTY067.jpg

过去的8年里,单卡硬件的算力增长了40倍,但是节点内的总线带宽只增长了9倍,跨节点的网络带宽只增长了4倍。集群网络通信成为当前大模型训练和推理的最大挑战,也是科技竞逐的焦点之一。

514美国禁令的恐惧根源,或许就在于昇腾的架构创新,破解了网络带宽拓展比单卡算力增长更滞后的技术难题,使CloudMatrix384 实现了集群稳定性,中国AI的算力长城,正在CloudMatrix384的基石上崛起。

具体来说,CloudMatrix 384 超节点实现了MatrixLink超节点网络服务。这项技术能够通过扩展训练集群实现大模型的训推性能提升20%,从而在网络侧满足最为苛刻的模型推训需求。

突破了内外部通信瓶颈的CloudMatrix 384,实现了AI算力资源的集约式高效利用,以及超大规模AI训练集群可云上获取,支撑昇腾AI云服务以更高的算力利用率、更高的算力可用度、更高的吞吐率以及更低的成本,为千行百业智能化提供充沛且普惠的云上AI算力服务,从而为中国AI算力争取到了长足的领先空间与发展窗口。

更值得一提的是,当产业从万卡向十万卡集群演进,超节点修筑AI算力长城的脚步也并未停下。华为云AI峰会上,华为云公布了CloudMatrix 384 超节点的创新技术优势。

wKgZPGgrHWuACpvWAAHL2mAqQGM639.jpg

昇腾云和CloudMatrix 384 超节点,实现了MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大科技创新,这些创新如同“技术砖石”,稳固支撑AI 产业发展更进一步,成为AI时代理想的基础设施。

为什么这么说?这就要提到各行各业的AI训推需求,要求云上算力,竖起三道重要的防线:

一是算力充沛的性能防线。

正如杰文斯悖论所说的,Deepseek虽然降低了单个模型对算力的需求,但随着应用AI的用户越来越多,算力资源的总需求量非但没有减少,反而进一步增加了。这一背景下,国产AI算力面临双重困境,一是单卡性能落后英伟达最新产品,二是多卡集群会“打群架”,堆卡但不增效。而提升算力集群的资源利用率,需要存储(存力)、网络(运力)的共同做功,来适配最新的计算架构。

简单来说,在DeepSeek的推动下,MoE已经成为主流大模型共同追求的实践路径,所谓MoE架构,就是从GPT4这样的少量大专家的超大规模参数模型,变成了大量小专家的模式,在每张卡上都部署多个小专家。但传统架构下,MoE模型容易因为专家负载不均、AllToAll通信延迟等,导致算力浪费,降低资源利用率。

CloudMatrix 384 超节点的分布式推理平台可以说是专为MoE大模型而生,具有MoE亲和的技术特性。对比一卡多专家的“小作坊模式”,超节点通过高速互联总线,降低跨机通信损耗,从而实现一卡一专家高效分布式推理,单卡的MoE计算和通信效率都大幅提升。通过联接力打破单点算力的性能制约,最大限度地释放算力共振的能力,也体现了超节点以网强算的技术优势。

除了网络通讯,显存容量不高也会制约MoE模型的开发。大模型推理的不同阶段,对计算/访存的资源需求其实并不一致,比如prefill阶段需要高算力,而decode阶段需要高防存,但传统“存算绑定”的模式不够灵活,就限制了资源利用和性能吞吐。

解决MoE模型的“存力”难题,华为云首创了EMS弹性内存存储,通过内存池化技术,实现显存和算力解绑。一方面,用EMS替代NPU中的显存,可使得首Token时延降低,最高降幅可达80%;另一方面,当NPU的显存不足时,EMS独立扩容,不必再通过堆NPU以获得更多内存。同时,EMS还支持算力卸载,这也使得系统吞吐量提升100%。

提高运力以网强算、提高存力以存强算,合力提高综合计算性能,从而为各行各业应用Deepseek等MoE模型,提供澎湃算力,正是CloudMatrix 384 所筑起的性能防线。

二是算力可靠的稳定防线。

解决了性能问题,接下来还解决多卡集群“打群架”的可靠性问题。千卡乃至万卡级算力集群的运维挑战,已经成为算力的关键瓶颈。集群规模增大,故障频发,导致训练中断,模型开发团队不得不频繁执行检查点checkpoint保存操作,这不仅延长了大模型训练周期,还会导致计算资源浪费,开发成本增高。

构建高可靠性的智能运维体系,已成为云上算力长城的必要职责。对此,华为开发了昇腾云脑运维“1-3-10”标准,即1分钟感知、3分钟定界、10分钟内恢复,从而具备了保障长稳大模型训练的能力。

也意味着,中国AI有了更具韧性的算力基础设施。

三是算力普惠的成本防线。

DeepSeek到来之后,AI推理侧的任务激增,而训练侧的算力需求则在下降。对于云服务商来说,针对用户访问的潮汐特征(日间推理峰值远远大于夜间),做好算力资源的动态平衡,可以进一步优化资源利用效率,避免算力闲置,这样能够实现综合成本最优,最终让成本优势变成价格优势、普惠能力,为行业和用户提供像“水电”一样实时、普惠、灵活的算力。

目前,华为云已经在全国三大枢纽数据中心——乌兰察布、贵安和芜湖完成了超节点规模布局,支持百TB级的带宽互联,10毫秒时延圈覆盖全国19个城市群,让行业用户不需要自建数据中心,可以像水电气一样,第一时间享受到即开即用的AI算力资源。

同时,华为云通过“训推共池”“灵活调度”两大技术,实现朝推夜训,白天进行模型推理,晚上闲时进行模型训练,实现了全国超节点算力资源的“错峰用电”,算力资源利用率可提升30%以上。

通过性能、稳定、普惠的三道防线,华为云CloudMatrix 384 超节点可以更好地守护各行各业的智能化需求,成为中国AI巍然挺立的坚实基础设施。

正如长城的出现,守护了古代中国的国土安全。超节点通过多项技术特征的加持,让以卡为单位的分散式AI算力,走向了集中式AI计算底座,成为真正意义上的下一代AI基础设施,一座坚固的云上算力长城。

wKgZO2grHW2AUGslAAGxKOc9y50716.jpg

更宏观的角度来看,超节点技术不仅仅是一项工程性创新,它还彻底改变了芯片制造领域的技术对垒格局。

英伟达最新推出了基于第五代NVLink技术的NVL72,并且将其局限在自身生态当中,客观上构成了对中国AI算力的发展制约。但实际上,我们真正需要的不是芯片本身,而是算力。通过重新定义AI基础设施,超节点技术为AI算力的供给提供了前所未有的澎湃动力,进而突破了被芯片制程锁死的AI进程。

在当前国际博弈的大背景下,超节点的出现,正是中国应对挑战、把握AI机遇的有力证明。

除了超节点之外,华为云还在大模型、AI生态等领域进行了持续升级,持续迭代的盘古大模型,已经在30多个行业、400多个场景中应用,在制造、金融、政务、医疗、制药、汽车、气象等七个行业保持市场规模领先。

在算力底座、资源调度、推理服务及集群可靠四个方面,华为云全面升级昇腾AI云服务,协助客户进行模型的开发、训练、托管和应用。目前,昇腾AI云服务已适配包含DeepSeek在内的160多个第三方大模型,并面向政府、金融、互联网、零售等行业服务600多家创新先锋企业。

就像美国的贸易冲击,掀不翻中国经济的汪洋大海,美国的一纸禁令,也禁不了昇腾这座云上AI算力长城。

当山姆·奥特曼在国会参议院建议要加大AI基础设施投入的时候,昇腾AI云服务已经通过超节点的建设,以及更多技术、产品、资源的汇集,为接下来的中国AI应用大爆发做好了准备——下一代AI基础设施,就是中国AI走向强大的内因。

wKgZO2grHW6AXiuWAAGSt1o7yW4601.jpg

2025年5月16日,被制裁整整六年的华为依旧在茁壮生长,并且在这些年里拿出了MetaERP、数据库、软硬件工具链等等核心技术突破。如今超节点的加入,让这六年中所有的故事都更加熠熠生辉。

华为的故事在反复提醒着一件事:我们除了强大,无路可走。

曾几何时,先进AI算力必然来自西方,被认为是一个“铁律”。但CloudMatrix 384 超节点的突破,不仅证明了中国可以有自主化的可靠AI算力基础设施,更证明了中国AI算力可以实现系统性领先,甚至可以改变企业用户的AI算力获取方式,给全球AI一个更好的算力选择。

近几个月,所有国际新闻都在提醒我们,只有当自身足够强大,能够给自己和他人提供选择,我们才有话语权,才有交流和谈判的空间,才能为多元、开放与平等添加一份保障。

从这个意义来说,CloudMatrix 384 超节点就如同AI世界中的长城。它伫立在那里,确保了全球AI的自由勃发与平等成长。

巍巍昆仑,翼翼长城。一些源于中国文化的智慧,一些来自中国科技的态度,此刻正无言流淌在奔腾的AI算力中,相信它们很快会被世界读懂。

wKgZO2grHW-AY96SAAG23sBDw_I658.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    35800

    浏览量

    260731
  • 云计算
    +关注

    关注

    39

    文章

    8003

    浏览量

    143112
  • 昇腾
    +关注

    关注

    1

    文章

    175

    浏览量

    7295
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16566
  • 昇腾AI
    +关注

    关注

    0

    文章

    87

    浏览量

    902
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI赋能未来:2025AI技术研讨会·深圳站圆满召开!

    10月25日,由华为技术有限公司&华强半导体集团主办,深圳市小眼睛科技有限公司和尖信息技术有限公司协办的“2025AI技术研讨会·深圳站”在深圳市福田区华强科创广场成功举办。本次
    的头像 发表于 10-31 11:00 1116次阅读
    <b class='flag-5'>昇</b><b class='flag-5'>腾</b><b class='flag-5'>AI</b>赋能未来:2025<b class='flag-5'>昇</b><b class='flag-5'>腾</b><b class='flag-5'>AI</b>技术研讨会·深圳站圆满召开!

    国产AI芯片真能扛住“算力内卷”?海思的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    智能客服驱动效率和体验升级,上海电信+AI的一次民生应用实践

    上海电信+AI的一次民生应用实践
    的头像 发表于 07-30 23:44 2706次阅读
    智能客服驱动效率和体验升级,上海电信+<b class='flag-5'>昇</b><b class='flag-5'>腾</b><b class='flag-5'>AI</b>的一次民生应用实践

    迅龙软件参加 AI 开发者创享日・广东站,为开发者打造沉浸式实操体验

    7月18日,线下顶尖人才汇聚的开发者盛会——AI开发者创享日・广东站在广州举行。活动以“创未来享非凡”为主题,聚焦广东本地产业特点,分享前沿AI创新技术,搭建生态交流平台,帮助开发
    的头像 发表于 07-23 17:18 1102次阅读
    迅龙软件参加<b class='flag-5'>昇</b><b class='flag-5'>腾</b> <b class='flag-5'>AI</b> 开发者创享日・广东站,为开发者打造沉浸式实操体验

    从新一代AI服务,俯瞰AI算力的上变局

    AI时代,要听龙鸣
    的头像 发表于 06-23 10:43 982次阅读
    从新一代<b class='flag-5'>昇</b><b class='flag-5'>腾</b><b class='flag-5'>AI</b><b class='flag-5'>云</b><b class='flag-5'>服务</b>,俯瞰<b class='flag-5'>AI</b>算力的<b class='flag-5'>云</b>上变局

    华为开发者大会2025(HDC 2025)亮点:华为发布盘古大模型5.5 宣布新一代AI服务上线

    HarmonyOS、AI服务、盘古大模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为
    的头像 发表于 06-20 20:19 3935次阅读
    华为开发者大会2025(HDC 2025)亮点:华为<b class='flag-5'>云</b>发布盘古大模型5.5 宣布新一代<b class='flag-5'>昇</b><b class='flag-5'>腾</b><b class='flag-5'>AI</b><b class='flag-5'>云</b><b class='flag-5'>服务</b>上线

    中软国际推出金融AI解决方案和一体机v1.0

    近日,中软国际重磅推出金融AI解决方案和一体机v1.0,该方案基于AI基础软硬件平台,完
    的头像 发表于 03-28 17:05 1009次阅读

    创思远达与合作推动AI PC应用创新

    近日,端侧智能领域创新者创思远达携手,基于算力平台正式发布一系列AIPC应用。双方深度融合了
    的头像 发表于 03-25 10:22 1065次阅读

    (原创)310B(8T/20T)算力主板定制方案

    310B(20T)算力主板规格书 1.功能、性能与接口a)310B 20T算力处理器, 4个64位TAISHAN V200M处理器核,最高主频1.8GHz,计算加速器如下:1)
    发表于 03-16 21:43

    AI服务平台可以干什么

    当今,AI服务平台,作为连接技术与应用的桥梁,正以其广泛的功能覆盖和深度应用场景,逐步渗透到社会经济的各个角落。下面,AI部落小编带您详细了解AI
    的头像 发表于 02-27 10:11 1045次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>云</b><b class='flag-5'>服务</b>平台可以干什么

    湖南 DeepSeek+腾云技术应用沙龙成功举办,拓维信息助力 AI 新范式探索

    人工智能技术如何赋能产业升级,DeepSeek与腾云服务技术融合及行业应用前景。作为华为“鲲鹏/AI+大模型/
    的头像 发表于 02-26 18:23 994次阅读
    湖南 DeepSeek+<b class='flag-5'>昇</b>腾云技术应用沙龙成功举办,拓维信息助力 <b class='flag-5'>AI</b> 新范式探索

    推理服务器+DeepSeek大模型 技术培训在图为科技成功举办

    2月17日,华为政企业务团队受邀莅临图为科技深圳总部,并成功举办了一场聚焦于《推理服务器+DeepSeek大模型》的专业知识培训。 此次培训活动不仅深化了双方的技术交流,更标志着
    的头像 发表于 02-26 17:38 1048次阅读
    <b class='flag-5'>昇</b><b class='flag-5'>腾</b>推理<b class='flag-5'>服务</b>器+DeepSeek大模型 技术培训在图为科技成功举办

    研华发布AI Box及Deepseek R1模型部署流程

    近日,随着深度求索(DeepSeek)大模型的发布在行业内掀起热议,研华科技正式推出了基于Atlas平台的边缘AI Box MIC-ATL3S,并同步发布了与Deepseek R1模型的部署流程
    的头像 发表于 02-19 10:41 1086次阅读

    轴科技ZStack智塔携手AI实现DeepSeek模型部署

    DeepSeek为人工智能AI产业带来一场革命,为企业级AI应用私有化部署场景(Private AI)注入强劲动力。作为企业级私有化AI Infra平台,
    的头像 发表于 02-18 09:59 1246次阅读
    <b class='flag-5'>云</b>轴科技ZStack智塔携手<b class='flag-5'>昇</b><b class='flag-5'>腾</b><b class='flag-5'>AI</b>实现DeepSeek模型部署

    软通动力亮相福建AI产业发展论坛

    近日,福建AI产业发展论坛在厦门举办。软通动力应邀出席,并作为“福建人工智能自主创新联合体”重要成员,与华为及生态伙伴等多方机构共同宣布了联合体的成立,旨在积极布局福建省人工智能产业,培育人工智能新业态,为数字经济注入崭新活
    的头像 发表于 12-23 13:52 852次阅读