0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为联合信通院成功立项《AI数据中心网络建设指导意见》

华为数据通信 来源:未知 2023-11-29 18:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群







近日,2023开放数据中心冬季全会(简称:ODCC 2023)在银川召开,华为联合信通院在新技术与测试组共同申报的《AI数据中心网络建设指导意见》立项成功,该项目旨在促进行业数智化转型、推动产业升级合作,为各行业构建面向AI时代的数据中心网络提供参考。


华为数据通信产品线数据中心网络领域
产业营销副总监胡秀丽


AI算法迈入万亿参数大模型时代,算力需求增长近十万倍,大规模计算需要高效协同数万张AI处理器,网络基础设施是长稳训练的关键之一。国内外已有对传统数据中心网络建设的指导和规范,但AI业务与传统数据中心业务对网络诉求差异较大,亟待优化网络架构,革新网络技术,《AI数据中心网络建设指导意见》指出,AI数据中心网络的建设可从组网规模、通信效率、高可用性三方面着手:



组网规模:

传统三层网络存在网络层数多,网络吞吐率低的问题,建议优化网络架构,采用两层框盒或框框组网,规模提升4倍以上,可满足大规模万卡AI集群,大幅度降低组网成本约30%。华为打造端到端200GE/400GE设备,构建大带宽AI无损网络,4倍于业界规模,完美匹配AI场景诉求。





通信效率:

组网规模从千卡向万卡演进,大流量模型下网络负载不均衡,严重影响AI训练效率。解决流量负载不均,可将AI训练场景下搜集到的整网信息作为创新算路算法的输入,从而得到最优的流量转发路径,实现AI训练场景下整网流量100%的均衡度,提升网络带宽利用率。华为独创网络负载均衡技术,提升网络吞吐至98%,同等服务器规模下AI训练效率提升20%。





高可用性:

AI任务的训练要求网络具有超高的稳定性,训练过程中一旦链路异常就可能导致任务训练中断,要保证网络有足够的容错能力,不影响AI相关业务,高可用网络需要考虑:训前主动识别链路亚健康,确保训前网络0风险;训中出现任务异常后,需要能一键自动识别卡间的路径和路况,做到分钟级诊断网络问题点,提升排障效率。华为网络数字地图提供可视化运维方案,高精度采集数据,实现网络一键式故障诊断,训中排障效率提升90%。





本次立项将针对AI场景下的网络新需求,于2024年上半年完成不同集群规模选项、网络负载均衡、网络高可用等技术的探索,并输出建设原则指导书,为构建面向AI时代的高性能网络建设提供参考。华为也希望与众多合作伙伴一起,推动技术的发展和应用场景的拓展,实现人工智能技术的可持续发展和社会的共同繁荣。


点击“阅读原文”,了解更多华为数据通信资讯!


原文标题:华为联合信通院成功立项《AI数据中心网络建设指导意见》

文章出处:【微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260712

原文标题:华为联合信通院成功立项《AI数据中心网络建设指导意见》

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    “一多区”网络实现跨数据中心业务无缝迁移

    面对跨区协同、数据安全与未来扩展等核心挑战,大连经济技术开发区医院携手锐捷网络,共同 打造医疗数据中心网与新一代园区网络示范样板 ,
    的头像 发表于 10-22 16:51 411次阅读
    “一<b class='flag-5'>院</b>多区”<b class='flag-5'>网络</b>实现跨<b class='flag-5'>院</b>区<b class='flag-5'>数据中心</b>业务无缝迁移

    华为成功举行数据中心基础设施峰会

    行业智能化,共同探讨数智基础设施在绿色低碳的新技术、新实践。华为数字能源还展示了绿色低碳全场景数字能源解决方案及成功案例,与业界携手智赢AI时代,共筑高质量安全可靠数据中心
    的头像 发表于 09-20 10:01 968次阅读

    华为星河AI高算效数据中心网络亮相ODCC 2025

    以“拥抱AI变革 点燃算网引擎”为主题的2025开放数据中心大会(以下简称“ODCC 2025”)在北京国际会议中心召开。在这场汇集了数据中心领域专家学者、科研机构代表、行业大咖的产业
    的头像 发表于 09-16 14:54 2387次阅读
    <b class='flag-5'>华为</b>星河<b class='flag-5'>AI</b>高算效<b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>亮相ODCC 2025

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI
    发表于 08-13 19:01

    华为面向拉美地区发布全新星河AI数据中心网络方案

    华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分
    的头像 发表于 08-11 10:42 1999次阅读

    华为星河AI高算效数据中心网络方案荣获智算网络测评五星认证

    国内首个配套N卡算力测评!华为星河AI高算效数据中心网络方案荣获智算
    的头像 发表于 06-28 17:50 1590次阅读

    华为面向亚太地区发布全新星河AI数据中心网络方案

    华为数据通信创新峰会2025亚太站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分
    的头像 发表于 06-11 11:11 1090次阅读

    华为面向中东中亚地区发布全新星河AI数据中心网络

    近日,在华为数据通信创新峰会2025中东中亚站期间,以“星河AI数据中心网络,赋AI时代新动能”
    的头像 发表于 05-21 15:49 678次阅读

    华为荣获数据中心自智网络基础能力解决方案检测证书

    2025年云网智联大会首日,中国信息通信研究(简称“”)向华为技术有限公司(以下简称“华为”)等首批获得《
    的头像 发表于 04-25 16:00 662次阅读

    适用于数据中心AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动
    发表于 03-25 17:35

    华为携手中控技术打造全国数据中心网络创新示范项目

    华为中国合作伙伴大会2025期间,华为与中控技术股份有限公司(以下简称“中控技术”)联合发布星河AI数据中心
    的头像 发表于 03-24 14:51 797次阅读

    华为全新升级星河AI数据中心网络

    华为中国合作伙伴大会2025期间,以 “星河AI数据中心网络,赋AI时代新动能”为主题的数据中心
    的头像 发表于 03-24 14:46 850次阅读

    华为携手EANTC启动数据中心网络ADN分级测评认证

    近日,华为联合EANTC(THE EUROPEAN ADVANCED NETWORKING TEST CENTER)正式启动数据中心网络ADN分级测评认证。
    的头像 发表于 03-20 16:00 1064次阅读

    华为发布新一代站点能源架构及AI数据中心建设理念

    SitePower"及AI数据中心建设原则RASTM,旨在加速运营商成为能源产消者,打造更优ICT能源基础设施,把握AI新时代机遇。 华为
    的头像 发表于 03-13 15:38 635次阅读
    <b class='flag-5'>华为</b>发布新一代站点能源架构及<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b><b class='flag-5'>建设</b>理念

    华为发布新一代站点能源架构及AI数据中心建设原则

    在MWC25巴塞罗那期间举办的产品与解决方案发布会上,华为数据中心能源及关键供电产品线总裁何波发布新一代站点能源架构“Single SitePower”及AI数据中心
    的头像 发表于 03-06 11:16 916次阅读