0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮网络助力打造面向AIGC的“三超”网络

全球TMT 来源:全球TMT 作者:全球TMT 2023-08-19 15:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从内容生成、游戏开发、到自动化助手、机器人控制……AIGC这项"黑科技",正在更多领域发挥着作用,并逐渐向行业渗透。例如,在数字政府场景,通过融合AIGC和数字人技术,可以提供个性化的政务服务和咨询,优化政府与公民的互动方式,提升政务服务的质量和效率。目前,AIGC主要聚焦在大模型训练、MaaS模型服务、AIGC推理三大应用场景,其中大模型训练是各新兴企业竞相争逐的主要场景。

"没有好网络,别玩大模型。" 要建设大规模训练模型集群,除了需要GPU服务器、网卡等基础组件,也需要解决网络搭建的问题。网络对于大模型集群的算力释放和可靠运行至关重要,如何构建符合大模型集群计算要求的网络系统,是推进AIGC发展的关键之一。

AIGC大模型训练 对网络系统的"三超"要求

在大模型训练过程中,有三种流量模型,分别是张量并行、流水线并行、数据并行。人们熟知的ChatGPT3,采用128台A100服务器,共计1024个A100卡训练,这样单服务器节点需要4个100G网络通道;而ChatGPT4、ChatGPT5等其它大模型,对于网络的需求会更高。浪潮网络认为大模型训练对于网络的要求可用"三超"网络来概括,即:超大规模、超高带宽、超强可靠,以保障网络稳定、可靠运行,为大模型训练提供强有力的支持。

而要解决"三超"网络的挑战,就需要着重思考如何建设符合大规模训练的组网方案。从组网架构上看,当前AIGC组网一般多采用胖树架构,具有高带宽、低延迟的特性,以及较好的可拓展性。而在组网协议上,当前业界主流的是基于IB、及RoCE两种无损网络技术,两种技术都可以很好的满足大规模训练高带宽、低延迟的要求。IB的延迟足够低,而RoCE在开放性、性价比、及易维护性几方面更胜一筹。

浪潮网络融合趋势与驱动 打造基于RoCE的智能无损网络解决方案

浪潮网络作为云边协同智慧网络引领者,密切关注市场发展及变化,推出了基于RoCE的智能无损网络解决方案,助力AIGC"三超"网络的打造,其具备如下优势:

一是多协议、多场景的融合。在大规模集群中,往往存在通用计算集群、AI/HPC集群、存储等多种场景,传统方案是部署以太网、IB、FC等多套网络及多种协议,各协议之间互不兼容,大大增加了管理和维护的难度。而浪潮网络基于RoCE的智能无损网络解决方案,可以适配通用计算、AI/HPC、存储等多种场景,并实现以太/IB/FC三网融合。这样从维护多张网络到维护一张网络,大大降低了整体建设和维护成本。

二是智能弹性、动态调整。在大规模集群训练中,要求整个集群可以快速部署与交付,在节约训练时间的同时,尽可能减少宕机等故障的发生。在浪潮网络基于RoCE的智能无损网络解决方案中,通过数字化网络引擎IDE可以实现集群网络的自动化部署,加速业务上线。并实时监控设备与链路的负载和健康状态,如CRC错包,端口带宽百分比、队列缓存,CNP及Pause反压帧等,完成故障的快速定位及智能分析,实现基于业务的网络跟踪。此外,还可以提供北向标准API接口,能够与上层计算平台进行对接,实现算网联动,更好的释放集群算力。

此前,浪潮网络基于RoCE的智能无损网络解决方案,已在教科研客户项目中得以应用,方案可充分满足通用计算集群、GPU加速集群、异构计算集群、分布式存储集群、全闪存存储集群等多场景,对于网络的高带宽、低延迟连接需求,帮助客户构建满足AIGC发展的整体网络架构。

未来,浪潮网络将持续优化基于RoCE的智能无损网络产品方案能力,同时深入研究基于UEC的网络并创新引领支持UEC的产品,帮助客户成功。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25316
  • AIGC
    +关注

    关注

    1

    文章

    391

    浏览量

    3161
  • 大模型
    +关注

    关注

    2

    文章

    3470

    浏览量

    5013
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA Jetson系列开发者套件助力打造面向未来的智能机器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 开发者套件,助力打造面向未来的智能机器人。
    的头像 发表于 12-13 10:20 1784次阅读

    华为如何通过大模型技术打造智能IP网络

    2025年非洲通信展在南非开普敦召开,华为数据通信产品线NCE数据通信领域总裁王辉受邀参加“Telecoms For Tomorrow”论坛,发表题为“拥抱AI时代,打造面向未来的智能IP网络”的演讲,分享华为如何通过大模型技术
    的头像 发表于 11-14 16:39 1219次阅读

    华为面向拉美地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向拉美地区发布全新升级的星河AI数据中心网络方案。该方案依托AI大脑、AI联接、AI网元
    的头像 发表于 08-11 10:42 2021次阅读

    华为携手沙特Jeraisy打造面向AI时代的新一代网络安全服务

    Electronic Services凭借敏锐的市场洞察与持续的技术革新,成为沙特领先的互联网服务提供商(ISP)。面对沙特“2030愿景”推进和2024年沙特国家网络安全战略的发布,Jeraisy再度迈出战略升级步伐,联手华为打造
    的头像 发表于 08-11 10:35 931次阅读

    华为面向中东中亚地区升级星河AI网络

    面向中东中亚地区发布星河AI网络最新产品及解决方案,通过全面升级园区、广域、数据中心及网络安全等场景的产品与方案,以“AI-Powered智慧联接”助力当地把握智能化发展新机遇,提升数
    的头像 发表于 05-21 15:55 768次阅读

    华为面向中东中亚地区发布全新星河AI数据中心网络

    联接、AI网元网络架构,为企业构建智联满载算力,业务永续护航的数据中心网络助力中东中亚地区网络基础设施升级与业务创新。
    的头像 发表于 05-21 15:49 704次阅读

    华为面向中东中亚地区发布全新星河AI园区网络

    华为数据通信创新峰会2025中东中亚站期间,华为面向中东中亚地区发布全新升级的星河AI园区网络,通过AI提升网络的安全体验、应用体验、无线体验及运维体验,助力客户数智化转型。
    的头像 发表于 05-21 15:45 689次阅读

    华为亮相第届中国AIGC产业峰会

    届中国AIGC产业峰会在北京召开,峰会以“万物皆可AI”为主题,华为数据通信产品线NCE数据通信领域总裁王辉受邀参会,并发表题为《当AI成为网络守护者:技术向善,守护共生》的演讲,提出以AI之力应对AI引发的
    的头像 发表于 04-22 11:34 727次阅读

    网安融合:打造网络+安全一体化的预期体验

    市场总监沈世海发布了“ 打造网络+安全一体化的预期体验 ”的主题报告。报告围绕让“ 让渠道交付更简单、让渠道服务更轻松 ”全面展开, 旨在为合作伙伴打造从交付到运维全生命周期的
    的头像 发表于 04-21 09:39 430次阅读
    网安融合:<b class='flag-5'>打造</b><b class='flag-5'>网络</b>+安全一体化的<b class='flag-5'>超</b>预期体验

    华为打造全球智慧酒店网络解决方案创新示范项目

    酒店网络解决方案创新示范项目,助力Meliá酒店集团实现数字化、智慧化转型升级,为全球酒店行业提供可借鉴的优秀实践。   华为ICT Marketing与解决方案销售副总裁史振钰、Meliá国际酒店
    的头像 发表于 03-08 09:35 961次阅读

    华为面向海外全面升级星河AI网络

    MWC25巴塞罗那期间,在“星河AI网络,全面跃升行业智能化”IPClub技术菁英汇峰会上,华为面向海外全面升级星河AI网络助力客户加速企业数智化转型。
    的头像 发表于 03-06 11:18 1295次阅读

    #新年新气象,大家新年快乐!#AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、生成对抗网络(GAN)等
    发表于 01-13 10:46

    AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、生成对抗网络(GAN)等
    发表于 01-13 10:32

    工业智能网关助力打造新型工业网络

    近日,工业和信息化部印发《打造“5G+工业互联网”512工程升级版实施方案》(下称《实施方案》),提出到2027年,“5G+工业互联网”广泛融入实体经济重点行业领域,网络设施、技术产品、融合
    的头像 发表于 01-06 13:39 762次阅读
    工业智能网关<b class='flag-5'>助力</b><b class='flag-5'>打造</b>新型工业<b class='flag-5'>网络</b>

    小鹏大众将携手合力打造中国最大的快充网络

    小鹏汽车和大众汽车集团(中国)宣布签署谅解备忘录(MOU),将合力为客户打造中国最大的快充网络,双方相互将开放各自专有的、行业领先的快充网络
    的头像 发表于 01-06 09:46 1339次阅读