0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI算力应用中的光模块产品

易飞扬通信 来源:易飞扬通信 作者:易飞扬通信 2024-01-02 15:32 次阅读

以ChatGPT为代表的AI大模型应用普及将推动算力需求快速增长,服务器产业链是其中重要的受益环节之一,AI计算的普及将推动服务器产业链光模块向800G升级提速。

算力网络驱动下光模块市场需求预测

光模块是数据中心内部互连和数据中心相互连接的核心部件。100G和400G是主流产品,800G过去主要用在超算等领域。据LightCounting预计,2023年800G全球普及率仅0.62%。而以ChatGPT为代表的AI大模型,对数据中心内外的数据流量都提出了新要求,有望推动光模块加速向800G升级。800G光模块将从2025年底开始主导光模块市场。

wKgZomWTvB6ABUeHAAFeabqIMvw245.png

根据LightCounting的数据,2016年至2020年,全球光模块市场规模从58.6亿美元增长到66.7亿美元,预测2025年全球光模块市场将达到113亿美元,为2020年的1.7倍。从结构上看数通市场占60%,电信市场占40%左右。

wKgaomWTvB-AWz3zAAC-Zc-MRkw735.png

AI算力场景光模块应用情况

首先我们以英伟达的SuperPOD为例测算单颗GPU与光模块的比例。测算仅考虑IB网络对应的光模块需求。以140个节点的集群为例,每台举例服务器需要8颗GPU芯片,共需140×8=1120颗芯片;集群中每20台服务器组成一个SU(scalable units,可扩展单元),共7个SU。IB网络架构下实现了完整的胖树(Fat-Tree)拓扑结构,胖树架构在训练场景中最优的配置是上下行端口数一样,即无阻塞的网络,具体来看:

第一层:每个SU 中配置8台叶交换机,共有56台叶交换机;

第二层:每10台脊交换机组成一个交换机组Spine Group( SG),每个SU 的第一个叶交换机连接到SG1中的每个交换机,每个SU的第二个叶交换机连接到SG2中的每个交换机,共有80个脊交换机;

第三层:每14台核心交换机组成一个交换机组Core Group(CG),对应共28个核心交换机。

使用系统的对应计算侧和存储侧线缆全部采用AOC有源光缆,因此每个端口对应一个光模块,即每条光缆对应2个光模块,因此计算侧和存储侧共需要(1120+1124+1120)×2+(280+92+288)×2=8048个光模块,即单颗GPU对应所需200G光模块数量约为1:7.2

DGX GH200超级计算机搭载256个超级芯片,每个超级芯片可视为一个服务器,通过交换机进行互联。从结构上来看,超级计算机采用两层的胖树拓扑结构,第一、二层分别使用96个、36个交换机,每台交换机拥有32个速率为800G的端口;此外超级计算机还配备了24个IB交换机用于IB网络。按照端口进行估算,L1层距离较近因此假定使用铜缆进行连接不涉及光模块,L2层36个交换机在无收敛胖树架构下,第二层交换机端口向下与L1层交换机上行端口互联,因此共需要36×32×2=1152个800G光模块;IB网络架构下,24台交换机需要24×32=768个800G光模块;则DGX GH200超级计算机共需要1152+768=1920个800G光模块,对应每颗芯片12个800G光模块。则GPT-3单日完成训练需要8万颗以上200G光模块,如果考虑到FLOPS的利用率约为20%-30%,则需要光模块的数量将约为35万颗。

易飞扬应用于算力场景的光模块

AI发展促进了海量光模块需求,易飞扬则已于2023年完成800G/400G AI应用光模块产线建设任务,新建成的生产线主要用于4×100G PAM4和8×100G PAM4光模块和有源光缆的生产。

wKgZomWTvB-AWaavAAAxZYpJhRM309.png

wKgaomWTvB-Aay2pAAA1M0y3A5I336.png

得益于供应链的支持,易飞扬的系列AI光模块量产顺利,公司本身的产品多样化设计能力、订单能力和供应链能力形成了较好的匹配关系。可以为中小客户提供灵活有效的需求交付和样品测试。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264061
  • 光模块
    +关注

    关注

    71

    文章

    1134

    浏览量

    58100
  • 算力
    +关注

    关注

    1

    文章

    659

    浏览量

    14356
收藏 人收藏

    评论

    相关推荐

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值 内存:16GB L
    发表于 02-28 11:21

    iBeLink KS MAX 10.5T大领跑KAS新领域

    —KHeavyHash。在市场上,有一款挖掘机可以满足这个要求,那就是iBeLink ks max 10.5T。 iBeLink ks max 10.5T是一款专为Kaspa挖掘而设计的挖掘机,它的
    发表于 02-20 16:11

    请问用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量?

    来自一位用户的咨询,麻烦帮忙解答,越详细越好,有图有真相,可以适当提供一些英飞凌解决方案和产品推荐。 用强大的SOC来控制汽车是不是能够大幅减少MCU的使用数量? 未来电动汽车会使用SOC来代替大量MCU?
    发表于 02-02 07:16

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    认识一下AI算力应用中的光模块产品

    以ChatGPT为代表的AI大模型应用普及将推动算力需求快速增长,服务器产业链是其中重要的受益环节之一,AI计算的普及将推动服务器产业链光模块向800G升级提速。
    的头像 发表于 12-29 16:14 498次阅读
    认识一下<b class='flag-5'>AI</b>算力应用中的光<b class='flag-5'>模块</b><b class='flag-5'>产品</b>

    强劲的AI边缘计算盒子# 边缘计算

    AI边缘计算
    成都华江信息
    发布于 :2023年11月24日 16:31:06

    英码科技精彩亮相火爆的IOTE 2023,多面赋能AIoT产业发展!

    地结合业务需求生成算法,并结合国产AI边缘计算算设备进行移植优化,是解决AI产品国产化,并
    发表于 09-25 10:03

    模块问题第一篇:模块不兼容怎么办?# 模块# 数据中心# 综合布线

    模块
    一只冷包子
    发布于 :2023年09月12日 10:00:58

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    面向多媒体 AI 增强场景的 RISC-V 全栈软硬件平台。 该平台将 RISC-V 扩展性的新型 Vector、Matrix 及第三方硬件进行抽象,并接入 OpenCV 与 CSI-NN 等弹性
    发表于 08-26 14:14

    关于高功率模块故障第一篇:为什么高速率模块故障率?

    模块
    一只冷包子
    发布于 :2023年07月25日 10:00:10

    模块设备端口不亮?可能有哪些原因?快来查看!# 光纤跳线# 模块

    模块
    一只冷包子
    发布于 :2023年05月31日 10:59:16

    模块静电损伤?看看你有没有忽视这几个问题!

    模块
    一只冷包子
    发布于 :2023年05月31日 10:55:52

    好米配好锅!规范PCB设计助力RK3588硬件产品一路畅通

    产品应用方向,覆盖AIoT千行百业。而瑞芯微RK3588的6TOPS AI,使其在智能座舱芯片中具备显著优势。 从综合性能来比较,瑞芯微RK3588也是目前市面上为数不多的有强大智
    发表于 05-12 11:46