0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中软国际智算中心成功完成华为EP方案验证

中软国际 来源:中软国际 2025-07-14 14:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在大模型迈向规模化应用的新阶段,推理性能成为决定AI落地成败的关键因素。中软国际智算中心积极响应国产智算体系建设战略,率先完成华为昇腾“大规模专家并行”(EP)推理方案验证,在DeepSeek-R1模型推理任务中实现3倍单卡吞吐性能提升,树立国产高效推理的新标杆。

大规模专家并行推理(Large-Scale Expert Parallel Inference)是一项面向混合专家(MoE)架构大模型的高效推理技术,能够将模型内部多个“专家”子网络部署至不同AI卡,借助并行计算与智能路由机制,实现高吞吐、低延迟的模型推理能力。

中软国际智算中心联合昇腾团队,围绕高并发推理和低延迟响应的关键诉求,进行了深度适配与系统级优化,充分释放昇腾AI芯片的专家并行能力,实现资源利用率与推理性能的双重突破,完成以下三大核心技术挑战的突破:

通信开销瓶颈:

通过专家亲和部署策略,减少跨卡高频通信,显著降低等待时间;

专家负载失衡:

结合智能任务调度算法,动态实现负载均衡,避免“明星专家”过载;

系统协同复杂:

搭建模块化调度与容错机制,支撑大规模专家系统稳定高效运行。

性能提升+多行业场景适配

技术业务创新、打造高性价比AI推理新模式

为充分释放EP架构的潜力,项目团队在系统架构与算子执行层面引入多项关键优化手段,释放推理潜能。

推理优化:

大规模专家并行+PD分离,64大规模专家并行,3倍单卡吞吐性能提升

并行优化:

多专家动态均衡专家热点均衡、亲和部署,资源利用率提升20%

通信优化:

AI to AI 低时延通信多算力协同、双流通信掩盖,整网性能提升100%

算子优化:

PA + MLAPO 融合算子Vector和Cube计算并行,计算耗时降低70%

本次EP方案验证完成后,中软国际智算中心已具备基于昇腾平台提供高效推理服务的能力,可适配多行业场景,打造高性价比AI推理新模式。在互联网与内容行业:面向智能客服、短视频生成、AI搜索推荐等高并发场景,具备极强支撑能力;在金融、政企行业:支持私有化部署与国产化软硬件组合,推理性能不降反升,AI卡投入节省达40%;在科研、教育领域:可作为模型调试、算法验证的高性能推理平台,提升研发效率与响应速度。通过EP推理方案,显存资源占用显著下降,用户请求并发能力提升,同时硬件成本降低超过50%,大幅缩短AI部署ROI回收周期。

基于EP验证成果

智算中心AI服务更快、更省、更强

更快:

卓越算力加速提升响应能力。中软国际智算中心的昇腾算力租赁与AI推理云服务,依托华为EP方案的高效并行策略,实现分钟级开通和高并发推理,显著提升算力响应速度。

更省:

高效资源节约显著降低成本。通过华为EP方案加速后,单卡并发量提升,Tokens输出和算力利用率更高,结合按量计费,大幅降低企业自建AI集群成本。

更强:

推理性能全面提升能力更强。中软国际智算中心支持高效Expert Parallelism并行策略与主流大模型适配,显著提升推理准确率和复杂AI任务性能。

同时,提供基于EP的创新技术赋能服务,包括EP推理系统从零部署、环境搭建、任务调度、容错优化等全过程的实施与培训服务,帮助客户培养自己的推理系统运维与调度团队,打造自主可控的AI基础设施能力。

中软国际智算中心成功实现华为EP方案,不仅是技术上的重大突破,也是和昇腾合作共赢的典范。我们将持续以稳定、高效、开放的智算服务,为更多企业提供更低成本、更高性能的推理解决方案,携手昇腾,共建国产AI智能推理新范式。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36163

    浏览量

    262638
  • 中软国际
    +关注

    关注

    0

    文章

    744

    浏览量

    8207
  • 智算中心
    +关注

    关注

    0

    文章

    123

    浏览量

    2598

原文标题:中软国际智算中心成功完成华为EP方案验证,实现大模型推理性能显著提升

文章出处:【微信号:CSI00354,微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国际联合华为发布多个解决方案

    3月20日,在华为中国合作伙伴大会2026华为ICT解决方案伙伴峰会中,国际凭借在智慧园区领
    的头像 发表于 03-24 10:57 278次阅读

    国际荣获华为云两项大奖

    近日,在华为全联接大会2025“华为云之夜”国际荣获
    的头像 发表于 09-28 14:04 1356次阅读

    国际携手华为赋能千行万业智能化升级

    在第十届华为全联接大会期间,国际华为公共事业军团联合发布了“行业智
    的头像 发表于 09-28 12:45 1115次阅读

    国际基于华为MetaERP打造新型ERP解决方案

    华为全联接大会2025上,国际战略业务系统部副总裁李军发表主题演讲。面对电力行业数字化转型的深水区,
    的头像 发表于 09-28 11:45 1702次阅读

    国际亮相2025华为全联接大会

    近日,在第十届华为全联接大会(HUAWEI CONNECT 2025)“全球合作伙伴峰会暨优秀合作伙伴颁奖典礼”国际凭借在产品组合
    的头像 发表于 09-19 14:16 1920次阅读

    国际携手华为发布医药联合解决方案

    近日,在华为全联接大会2025“智慧园区与智圆桌”活动上,国际华为技术与解决
    的头像 发表于 09-19 14:16 1093次阅读

    国际携手华为云成立浙江AI先锋计划服务团

    9月16日,浙江省“十链百场万企”系列对接活动之“鸿启新程・赋浙商”第四届828企业家活动在浙江省人民大会堂盛大启幕。活动国际联合
    的头像 发表于 09-18 15:10 951次阅读

    国际鸿蒙生态“应用+智慧场景”的创新实践

    8月31日,2025鸿蒙生态大会在深圳福田会展中心精彩继续。应用的繁荣是鸿蒙生态发展壮大的基石,国际已支撑各行业超800款应用完成鸿蒙化
    的头像 发表于 09-03 17:01 1258次阅读

    国际教育携手华为打造一站式AI+教育解决方案

    国际教育科技集团(以下简称“国际教育”)与华为
    的头像 发表于 08-16 16:49 2189次阅读

    国际出席华为昇腾计算产业发展峰会

    的重大开源举措,深入探讨开源开放的昇腾生态建设大计,携手加速AI领域的创新与发展浪潮。国际执行总裁彭江,
    的头像 发表于 08-07 18:14 1725次阅读

    国际签约成为华为昇腾大模型一体机伙伴

    ,昇腾计算整机业务总监胡宣春,中国区政企昇腾生态总监陈关喜;国际高级副总裁、华为技术与解决方案集团总裁刘刚,云智能业务集团总裁闫国栋,副
    的头像 发表于 07-30 09:42 1592次阅读
    <b class='flag-5'>中</b><b class='flag-5'>软</b><b class='flag-5'>国际</b>签约成为<b class='flag-5'>华为</b>昇腾大模型一体机伙伴

    国际全场景AI实践

    ,回顾了国际华为云以云原生技术为基石、AI 为驱动力的深度协同历程,印证了社会对 AI 技术确定性的共识,同时也直面落地挑战 —— 客户付费意愿、概念
    的头像 发表于 07-24 16:32 1172次阅读

    国际文旅SaaS平台成功落地“乐游威海”项目

    近日,华为开发者大会(HDC2025)隆重启幕。国际受邀出席6月21日的华为云生态伙伴发展高峰论坛,携手威海文旅局向广大开发者分享《
    的头像 发表于 06-27 16:30 1504次阅读

    国际携手华为发布海外智慧城市解决方案

    此前,2025年6月20日-22日,华为开发者大会(HDC 2025)期间,国际作为华为全球业务伙伴,携手
    的头像 发表于 06-26 17:44 2370次阅读

    国际AI深度应用创新论坛成功举办

    近日,2025华为开发者大会期间,国际成功举办AI深度应用创新论坛,发布全栈AI战略,分享研讨了公司打造的全场景最新人工智能领域产品与服
    的头像 发表于 06-26 14:22 1126次阅读