0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技联合华为昇腾实现超节点适配多项创新

商汤科技SenseTime 来源:商汤科技SenseTime 2025-09-05 15:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,商汤大装置SenseCore与昇腾384超节点率先完成全面适配。

在功能、性能验证上达到预期目标,为加速国产AI算力从“可用”迈向“好用”取得了重点突破,为大模型高效训练与推理提供了坚实支撑。

超节点(SuperPod)是一种通过高速互联技术,将多个GPU/NPU整合为统一计算单元的新型架构,解决AI大模型训练中的算力协同与通信效率问题。

昇腾384超节点(Atlas 900 A3 SuperPoD)是华为推出的业界最大规模超节点方案,凭借创新的“全对等架构”,实现高速互联总线的关键突破——把总线从服务器内部扩展到整机柜、甚至跨机柜,最终将CPU、NPU、DPU、存储和内存等资源全部互联和池化,形成一台“超级计算机”,实现更大的算力密度和互联带宽。

商汤联合华为昇腾,实现超节点适配多项创新

华为昇腾推出的这一全新方案架构,对软件栈的升级和平台调度优化提出了更高要求,让它能“跑得快、跑得稳”。

作为AI云原生平台,商汤大装置SenseCore致力于为用户提供敏捷、灵活、可靠的全栈AI基础设施服务,以极致性价比推动大模型技术的高效落地与规模化应用。

基于商汤大装置SenseCore与昇腾384超节点的特点,双方团队联合攻关,在调度优化、系统稳定性以及故障恢复等方面提出多项行业创新:

调度优化:在调度能力上,除了支持POD内单机和多机调度、跨POD多机调度、亲和性调度等基础能力,SenseCore平台配合模型并行策略实现了逻辑超节点自动划分,使EP/TP等大通信策略可以充分利用灵衢网络,提升模型训练效率。

跨POD训练稳定性:另外SenseCore团队提交了多个MR修复多POD场景下master/work任务rank乱序问题,从根本上解决了跨POD训练任务概率性失败的问题。

多维度故障检测与恢复:在故障检测能力上覆盖了从服务器硬件、高速互联总线、RoCE网络到任务、进程软硬件多维度检测,结合检测能力实现Job/Pod/进程多级恢复机制,全面提升昇腾384超节点在训练场景下的可靠性与容错性。

此次商汤大装置SenseCore与昇腾384超节点的成功适配,让多租户、大规模、弹性AI云服务成为可能。同时,商汤大装置已经完成了某客户的交付,具备了昇腾384超节点从液冷集群到AI平台端到端的交付能力。

未来,双方还将探索更多应用场景,包括大模型推理加速、智能体应用部署、面向垂直行业的大模型训练与推理优化等,进一步加速基于SenseCore的昇腾384超节点在各行各业的应用落地。

商汤科技大装置事业群CTO宣善明表示:“商汤大装置非常重视并深度参与国产化算力生态建设。SenseCore成为首批完成昇腾384超节点适配的AI云平台,不仅得益于SenseCore平台的开放性、完善的功能和丰富的应用实践,更是国产AI基础设施融合发展的重要里程碑。SenseCore通过与昇腾的深度融合,充分释放昇腾算力潜能,为产业界提供更加敏捷、智能、可靠的算力底座,商汤也将在此基础上打造面向各行业的AI解决方案,共同推动千行百业的智能化升级”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    35826

    浏览量

    260916
  • AI
    AI
    +关注

    关注

    90

    文章

    38356

    浏览量

    297492
  • 商汤
    +关注

    关注

    0

    文章

    83

    浏览量

    4272

原文标题:商汤大装置×华为昇腾384超节点:成功适配

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    最全!一文看懂华为芯片和节点最新演进路线

    ,尤其是对中国人工智能发展而言。此次大会上,徐直军公布了未来三年芯片演进路线(Ascend 950、Ascend 960、Ascend 970将陆续推出)、鲲鹏处理器升级规划,并同时发布了多款
    的头像 发表于 09-20 07:22 1w次阅读
    最全!一文看懂<b class='flag-5'>华为</b><b class='flag-5'>昇</b><b class='flag-5'>腾</b>芯片和<b class='flag-5'>超</b><b class='flag-5'>节点</b>最新演进路线

    国产AI芯片真能扛住“算力内卷”?海思的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种算力密度下,散热怎么解决?而且的生态适配速度能
    发表于 10-27 13:12

    华为发布全球最强算力节点和集群

    华为全联接大会2025(HUAWEI CONNECT 2025)上,华为发布最强算力节点和集群,并表示将发展生态作为公司核心战略,提升到前所未有的战略高度。在计算领域,鲲鹏
    的头像 发表于 10-10 17:29 1924次阅读

    华为与全球开发者共赢生态

    华为全联接大会2025期间,华为计算业务总裁张迪煊发表了“以开发者为中心,加速自主创新,共赢
    的头像 发表于 09-20 15:57 1659次阅读

    软通动力亮相福建计算产业发展大会

    近日,软通动力与华为技术有限公司、同泰怡科技集团、百信信息技术有限公司及福建升腾资讯有限公司联合主办的“万里 开创未来 共筑数智福建——福建
    的头像 发表于 09-04 09:26 642次阅读

    中软国际出席华为计算产业发展峰会

    的重大开源举措,深入探讨开源开放的生态建设大计,携手加速AI领域的创新与发展浪潮。中软国际执行总裁彭江,中软国际华为技术与解决方案集团副总裁、智算中心总经理李晨光代表公司出席会议。
    的头像 发表于 08-07 18:14 1358次阅读

    重磅!华为384节点真机登场,中兴携厂商首秀GPU节点实力

    作为中国自主的算力核弹,华为384节点真机首次亮相。中兴通讯、上海仪电、曦智科技、壁仞科技联合
    的头像 发表于 07-29 00:45 1.1w次阅读
    重磅!<b class='flag-5'>华为</b><b class='flag-5'>昇</b><b class='flag-5'>腾</b>384<b class='flag-5'>超</b><b class='flag-5'>节点</b>真机登场,中兴携厂商首秀GPU<b class='flag-5'>超</b><b class='flag-5'>节点</b>实力

    华为开发者大会2025(HDC 2025)亮点:华为云发布盘古大模型5.5 宣布新一代AI云服务上线

    HarmonyOS、AI云服务、盘古大模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为云计算CEO张平安宣布基于CloudMa
    的头像 发表于 06-20 20:19 4024次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b>云发布盘古大模型5.5 宣布新一代<b class='flag-5'>昇</b><b class='flag-5'>腾</b>AI云服务上线

    有关 AI 算力,华为刷新行业记录

    节点,有效降低了故障概率。在训练业务方面,实现分钟级 RTO(恢复时间目标);在高频 HBM 场景下,故障恢复时间缩短至 30 秒级,成功将万卡级训练集群可用度提升至 95% 以上。   此外,该文件还涵盖硬件管理、故障感知
    的头像 发表于 06-16 01:08 5842次阅读
    有关 AI 算力,<b class='flag-5'>华为</b><b class='flag-5'>昇</b><b class='flag-5'>腾</b>刷新行业记录

    华为人工智能伙伴峰会成功举行

    近日,在华为中国合作伙伴大会期间,人工智能伙伴峰会在深圳正式召开。会上,华为计算业务总裁
    的头像 发表于 04-01 15:38 1164次阅读

    大华股份亮相华为中国合作伙伴大会2025 星汉×推动行业创新发展

    以“因聚而生 众智有为”为主题的“华为中国合作伙伴大会2025”在深圳国际会展中心举办。作为华为的生态合作伙伴,大华股份受邀出席峰会,亮相多展区并携手
    的头像 发表于 03-25 17:43 2413次阅读
    大华股份亮相<b class='flag-5'>华为</b>中国合作伙伴大会2025 星汉×<b class='flag-5'>昇</b><b class='flag-5'>腾</b>推动行业<b class='flag-5'>创新</b>发展

    创思远达与合作推动AI PC应用创新

    近日,端侧智能领域创新者创思远达携手,基于算力平台正式发布一系列AIPC应用。双方深度融合了
    的头像 发表于 03-25 10:22 1084次阅读

    软通动力携手吉布森生物科技推出智能医疗诊断平台

    华为中国合作伙伴大会2025期间,软通动力联合吉布森生物科技有限公司正式发布“智能医疗诊断平台”,该平台基于
    的头像 发表于 03-24 15:47 817次阅读

    润和软件将持续深化“+DeepSeek”技术路线

    近日,“+DeepSeek 智算引擎创新行”江苏省首站活动在南京成功举办,本次活动由南京江北新区产业技术研创园指导,江苏省人工智能学会、江苏鲲鹏·
    的头像 发表于 03-08 09:39 1144次阅读

    迅龙软件出席华为APN伙伴大会,获APN钻石伙伴授牌及两项大奖

    和战略思考。作为华为的重要合作伙伴,迅龙软件受邀参加此次会议,并以其出色的创新能力和丰富的产品线,获得
    的头像 发表于 02-17 17:04 1416次阅读
    迅龙软件出席<b class='flag-5'>华为</b><b class='flag-5'>昇</b><b class='flag-5'>腾</b>APN伙伴大会,获<b class='flag-5'>昇</b><b class='flag-5'>腾</b>APN钻石伙伴授牌及两项大奖