0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

认识一下AI算力应用中的光模块产品

易飞扬通信 来源:易飞扬通信 2023-12-29 16:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以ChatGPT为代表的AI大模型应用普及将推动算力需求快速增长,服务器产业链是其中重要的受益环节之一,AI计算的普及将推动服务器产业链光模块向800G升级提速。

算力网络驱动下光模块市场需求预测

光模块是数据中心内部互连和数据中心相互连接的核心部件。100G和400G是主流产品,800G过去主要用在超算等领域。据LightCounting预计,2023年800G全球普及率仅0.62%。而以ChatGPT为代表的AI大模型,对数据中心内外的数据流量都提出了新要求,有望推动光模块加速向800G升级。800G光模块将从2025年底开始主导光模块市场。

2adbcdbe-a622-11ee-8b88-92fbcf53809c.png

根据LightCounting的数据,2016年至2020年,全球光模块市场规模从58.6亿美元增长到66.7亿美元,预测2025年全球光模块市场将达到113亿美元,为2020年的1.7倍。从结构上看数通市场占60%,电信市场占40%左右。

2ae89026-a622-11ee-8b88-92fbcf53809c.png

AI算力场景光模块应用情况

首先我们以英伟达的SuperPOD为例测算单颗GPU与光模块的比例。测算仅考虑IB网络对应的光模块需求。以140个节点的集群为例,每台举例服务器需要8颗GPU芯片,共需140×8=1120颗芯片;集群中每20台服务器组成一个SU(scalable units,可扩展单元),共7个SU。IB网络架构下实现了完整的胖树(Fat-Tree)拓扑结构,胖树架构在训练场景中最优的配置是上下行端口数一样,即无阻塞的网络,具体来看:

第一层:每个SU 中配置8台叶交换机,共有56台叶交换机;

第二层:每10台脊交换机组成一个交换机组Spine Group( SG),每个SU 的第一个叶交换机连接到SG1中的每个交换机,每个SU的第二个叶交换机连接到SG2中的每个交换机,共有80个脊交换机;

第三层:每14台核心交换机组成一个交换机组Core Group(CG),对应共28个核心交换机。

使用系统的对应计算侧和存储侧线缆全部采用AOC有源光缆,因此每个端口对应一个光模块,即每条光缆对应2个光模块,因此计算侧和存储侧共需要(1120+1124+1120)×2+(280+92+288)×2=8048个光模块,即单颗GPU对应所需200G光模块数量约为1:7.2

DGX GH200超级计算机搭载256个超级芯片,每个超级芯片可视为一个服务器,通过交换机进行互联。从结构上来看,超级计算机采用两层的胖树拓扑结构,第一、二层分别使用96个、36个交换机,每台交换机拥有32个速率为800G的端口;此外超级计算机还配备了24个IB交换机用于IB网络。按照端口进行估算,L1层距离较近因此假定使用铜缆进行连接不涉及光模块,L2层36个交换机在无收敛胖树架构下,第二层交换机端口向下与L1层交换机上行端口互联,因此共需要36×32×2=1152个800G光模块;IB网络架构下,24台交换机需要24×32=768个800G光模块;则DGX GH200超级计算机共需要1152+768=1920个800G光模块,对应每颗芯片12个800G光模块。则GPT-3单日完成训练需要8万颗以上200G光模块,如果考虑到FLOPS的利用率约为20%-30%,则需要光模块的数量将约为35万颗。

易飞扬应用于算力场景的光模块

AI发展促进了海量光模块需求,易飞扬则已于2023年完成800G/400G AI应用光模块产线建设任务,新建成的生产线主要用于4×100G PAM4和8×100G PAM4光模块和有源光缆的生产。

2b17d886-a622-11ee-8b88-92fbcf53809c.png

2b297ae6-a622-11ee-8b88-92fbcf53809c.png

得益于供应链的支持,易飞扬的系列AI光模块量产顺利,公司本身的产品多样化设计能力、订单能力和供应链能力形成了较好的匹配关系。可以为中小客户提供灵活有效的需求交付和样品测试。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 交换机
    +关注

    关注

    23

    文章

    2868

    浏览量

    103914
  • 光模块
    +关注

    关注

    82

    文章

    1583

    浏览量

    61873
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6394
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10071

原文标题:AI算力应用中的光模块产品

文章出处:【微信号:gigalight_yifeiyang,微信公众号:易飞扬通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺
    发表于 10-27 13:12

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:26 1145次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的
    的头像 发表于 09-19 15:25 428次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    睿海光电 400G 模块:以技术突破引领全球 AI 基建升级

    睿海光电 400G 模块:以技术突破引领全球 AI 基建升级 在人工智能大模型训练、高性能计算集群扩容与全球数据中心算
    的头像 发表于 08-19 15:02 985次阅读

    400G QSFP-DD SR4 模块:构筑 AI网络的高速互联核心

    在数字化转型与 AI 需求爆发的叠加驱动,400G QSFP-DD SR4 模块凭借短距
    的头像 发表于 08-19 10:07 668次阅读

    睿海光电:引领400G模块技术创新,驱动全球AI基建升级

    睿海光电:引领400G模块技术创新,驱动全球AI基建升级 在全球数字化浪潮和AI技术迅猛发
    的头像 发表于 08-18 13:54 867次阅读

    睿海光电800G模块助力全球AI基建升级

    在全球数字化转型加速的背景,超高速模块作为数据中心与AI网络的核心部件,正经历从400G
    发表于 08-13 19:05

    睿海光电领航AI模块:超快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效底座

    AI革命催生光模块新需求,睿海光电以技术优势抢占制高点 人工智能、超大规模数据中心和云计算的高速发展,对光
    发表于 08-13 19:03

    加速AI未来,睿海光电800G OSFP模块重构数据中心互联标准

    在人工智能需求呈指数级增长的2025年,数据传输效率已成为制约AI发展的关键瓶颈。作为全球AI模块
    发表于 08-13 16:38

    成本直降2美元/tops!国产芯如何颠覆割草机器人格局?

    的完美融合。 除了割草机,随着AI的发展,机器人需要大量传感器接入,今天就带大家认识一下让机器人看懂世界的视觉中枢。世强方案里的全新AI SOC芯片,8核A55架构搭载10Tops
    的头像 发表于 07-31 17:22 491次阅读
    成本直降2美元/tops!国产芯如何颠覆割草机器人<b class='flag-5'>算</b><b class='flag-5'>力</b>格局?

    文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI
    的头像 发表于 07-23 12:18 964次阅读
    <b class='flag-5'>一</b>文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    AI网络模块市场发展分析

    AI需求激增推动模块技术迭代加速,800G模块
    的头像 发表于 05-26 16:50 978次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>网络<b class='flag-5'>光</b><b class='flag-5'>模块</b>市场发展分析

    DeepSeek推动AI需求:800G模块的关键作用

    集群的部署过程,带宽瓶颈成为制约发挥的关键因素,而光模块的速率跃升成为突破这瓶颈的核心
    发表于 03-25 12:00

    企业AI租赁模式的好处

    构建和维护个高效、可扩展的AI基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI
    的头像 发表于 12-24 10:49 1657次阅读