0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为联合信通院成功立项《AI数据中心网络建设指导意见》

华为数据通信 来源:未知 2023-11-29 18:15 次阅读






近日,2023开放数据中心冬季全会(简称:ODCC 2023)在银川召开,华为联合信通院在新技术与测试组共同申报的《AI数据中心网络建设指导意见》立项成功,该项目旨在促进行业数智化转型、推动产业升级合作,为各行业构建面向AI时代的数据中心网络提供参考。


华为数据通信产品线数据中心网络领域
产业营销副总监胡秀丽


AI算法迈入万亿参数大模型时代,算力需求增长近十万倍,大规模计算需要高效协同数万张AI处理器,网络基础设施是长稳训练的关键之一。国内外已有对传统数据中心网络建设的指导和规范,但AI业务与传统数据中心业务对网络诉求差异较大,亟待优化网络架构,革新网络技术,《AI数据中心网络建设指导意见》指出,AI数据中心网络的建设可从组网规模、通信效率、高可用性三方面着手:



组网规模:

传统三层网络存在网络层数多,网络吞吐率低的问题,建议优化网络架构,采用两层框盒或框框组网,规模提升4倍以上,可满足大规模万卡AI集群,大幅度降低组网成本约30%。华为打造端到端200GE/400GE设备,构建大带宽AI无损网络,4倍于业界规模,完美匹配AI场景诉求。





通信效率:

组网规模从千卡向万卡演进,大流量模型下网络负载不均衡,严重影响AI训练效率。解决流量负载不均,可将AI训练场景下搜集到的整网信息作为创新算路算法的输入,从而得到最优的流量转发路径,实现AI训练场景下整网流量100%的均衡度,提升网络带宽利用率。华为独创网络负载均衡技术,提升网络吞吐至98%,同等服务器规模下AI训练效率提升20%。





高可用性:

AI任务的训练要求网络具有超高的稳定性,训练过程中一旦链路异常就可能导致任务训练中断,要保证网络有足够的容错能力,不影响AI相关业务,高可用网络需要考虑:训前主动识别链路亚健康,确保训前网络0风险;训中出现任务异常后,需要能一键自动识别卡间的路径和路况,做到分钟级诊断网络问题点,提升排障效率。华为网络数字地图提供可视化运维方案,高精度采集数据,实现网络一键式故障诊断,训中排障效率提升90%。





本次立项将针对AI场景下的网络新需求,于2024年上半年完成不同集群规模选项、网络负载均衡、网络高可用等技术的探索,并输出建设原则指导书,为构建面向AI时代的高性能网络建设提供参考。华为也希望与众多合作伙伴一起,推动技术的发展和应用场景的拓展,实现人工智能技术的可持续发展和社会的共同繁荣。


点击“阅读原文”,了解更多华为数据通信资讯!


原文标题:华为联合信通院成功立项《AI数据中心网络建设指导意见》

文章出处:【微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    215

    文章

    33619

    浏览量

    247151

原文标题:华为联合信通院成功立项《AI数据中心网络建设指导意见》

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    华为联合中国信通院发布《华为星河AI数据中心网络测试报告》

    2024 开放数据中心委员会(以下简称ODCC)春季全会在江西婺源顺利召开,全会由ODCC副主席李洁博士主持。全会期间,华为联合中国信通院云大所数据中心团队发布《
    的头像 发表于 04-02 09:25 293次阅读

    一图看懂星河AI数据中心网络,全面释放AI时代算力

    华为中国合作伙伴大会 | 一图看懂星河AI数据中心网络,以网强算,全面释放AI时代算力
    的头像 发表于 03-22 10:28 169次阅读
    一图看懂星河<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>,全面释放<b class='flag-5'>AI</b>时代算力

    华为联合Tolly发布L4数据中心自动驾驶网络方案测试报告

    MWC24 巴塞罗那期间,华为联合Tolly Group在“IP Club技术菁英汇”峰会上,面向全球发布L4数据中心自动驾驶网络方案测试报告。
    的头像 发表于 02-29 09:37 221次阅读

    华为联合赛迪发布《中小数据中心基础设施可靠性关键要素白皮书》,助力打造高可靠中小数据中心

    2023年12月21日,由中国通信标准化协会绿色网格标准推进委员会(TGGC)主办的2023绿色网格低碳论坛在北京成功举办。论坛期间,华为与赛迪顾问联合发布《中小数据中心基础设施可靠性
    的头像 发表于 12-21 18:55 435次阅读
    <b class='flag-5'>华为</b><b class='flag-5'>联合</b>赛迪发布《中小<b class='flag-5'>数据中心</b>基础设施可靠性关键要素白皮书》,助力打造高可靠中小<b class='flag-5'>数据中心</b>

    祝贺!《超融合以太网络总体技术要求》行业标准立项成功

    数据中心存在通用计算、存储、超算和AI智算多种业务场景,传统数据中心网络使用不同的网络技术承载不同业务,如存储使用FC
    的头像 发表于 11-28 19:05 304次阅读

    适用于数据中心AI 时代的网络

    十多年来,传统的云数据中心一直是计算基础设施的基石,满足了各种用户和应用程序的需求。然而,近年来,为了跟上技术的进步和对 AI 驱动的计算需求的激增,数据中心进行了发展。 本文探讨了网络
    的头像 发表于 10-27 20:05 250次阅读
    适用于<b class='flag-5'>数据中心</b>和 <b class='flag-5'>AI</b> 时代的<b class='flag-5'>网络</b>

    HNS 2023 | 华为数据中心网络软硬实力全新升级,赋AI时代新动能

    [德国,慕尼黑,2023年10月26日]华为数通创新峰会2023欧洲站期间,主题为“CloudFabric3.0,超融合数据中心网络,赋AI时代新动能”的
    的头像 发表于 10-27 19:35 260次阅读
    HNS 2023 | <b class='flag-5'>华为</b><b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>软硬实力全新升级,赋<b class='flag-5'>AI</b>时代新动能

    GITEX Global 2023 | 超融合数据中心网络,赋AI时代新动能

    王武伟发表了“超融合数据中心网络,赋AI时代新动能”的主题演讲,他指出,随着AI应用加速、云化架构不断升级,数据中心已经迈入了智能算力和通用
    的头像 发表于 10-17 23:30 276次阅读

    华为全联接大会2023|超融合数据中心网络全新升级,赋AI时代新动能

    网络,赋予AI时代新动能。 华为数据通信产品线数据中心网络领域总裁 王武伟 发布超融合
    的头像 发表于 09-21 19:25 418次阅读

    ODCC 2023 | 超融合数据中心网络,赋AI时代新动能

    、专家学者、行业大咖的产业盛会上,华为数据通信产品线数据中心网络领域总裁王武伟发表了主题为《超融合数据中心
    的头像 发表于 09-14 18:15 355次阅读

    ODCC 2023 | 华为数据中心网络荣膺2023开放数据中心大会三项大奖

    [中国,北京,2023年9月13日] 9月13日,华为数据中心网络在2023开放数据中心大会(简称:ODCC)上,斩获十周年携手同行奖、十周年卓越项目-无损
    的头像 发表于 09-13 19:35 456次阅读

    HNS 2023 | CloudFabric3.0,高运力400GE数据中心网络,赋AI时代新动能

    [雅加达,印度尼西亚,2023年8月15日] 华为数通创新峰会2023期间,主题为“CloudFabric3.0,高运力400GE数据中心网络,赋AI时代新动能”的
    的头像 发表于 08-16 19:50 403次阅读

    易华录与华为联合打造的易简预制模块化数据中心解决方案在2023全球数据中心产业论坛发布

    的新机遇、新需求、新挑战。 易华录与华为联合打造的“易简预制模块化数据中心解决方案”,作为华为本次发布的三大解决方案之一——FusionDC生态解决方案,在本次论坛一起发布 基于202
    的头像 发表于 07-10 10:05 617次阅读

    分享数据中心机房建设应该注意哪些方面-科兰

    的问题。分享数据中心机房建设应该注意哪些方面。 数据中心机房建设应该注意哪些方面? 1、数据中心将建在哪里? 兴建和维护
    的头像 发表于 05-30 11:35 580次阅读

    数据中心中存在的问题

    、甘肃、宁夏等4个节点启动建设国家枢纽节点,同时正联合有关部门深入论证京津冀、长三角、粤港澳大湾区、成渝等4个节点的建设方案。在集群和集群之间,建立高速数据中心直联
    发表于 05-17 14:42 0次下载