0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI的I/O瓶颈,或许可以用光子IC来突破

E4Life 来源:电子发烧友网 作者:周凯扬 2023-10-13 00:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)从回答问题对话到写文章,ChatGPT这类应用已经帮我们展示了生成式AI带来的第一波震撼,从OpenAI的路线也可以看出,他们已经在努力把处理对象从单纯的文字,转换成图片、音频乃至视频了。但这也意味着待处理的数据大小以数量级提升,毕竟再长的文本和视频文件大小比起来还是相去甚远。

I/O瓶颈

要想进一步提升生成式AI的处理性能,我们就不得不看下背后为其提供动力的基础设备,也就是GPU、AI加速器、高带宽内存和光模块。AI模型发展的早期,只需单个GPU甚至是CPU就能处理简单的AI模型,而如今这些先进的AI模型,没有大型机柜组成的服务器和成千上万个GPU,是很难运行起来的。

比如特斯拉老版的自动驾驶训练超算,就是由720个节点的8x英伟达A100 GPU构成的,算力高达1.8 EFLOPS。小鹏于去年建成的智算中心扶摇算力规模高达600PFLOPS,预计也用到了上千块GPU。

尽管部署大量GPU是扩展算力的最直接途径,但与此同时传统的互联方案还是创造了巨大的I/O瓶颈,严重影响了GPU的性能利用率,导致更多的时间花在了等待数据而不是处理数据上。

为此,常用的方案变成了添加更多的GPU来弥补性能和计算效率上的损失,可这样的趋势已经在逐渐被淘汰,因为从减少碳足迹的角度来看,全球范围内各个国家都在开始考虑减少数据中心的能源损耗了。

光子IC

除此之外,另一解决方案就是利用光模块来解决速度慢的节点间电气连接,然而光模块成本较高、密度较低,所以需要更高速、端到端又能降低成本互联方案,即芯片到芯片之间的光学I/O。

利用更高带宽的光学连接取代诸多并行和高速串行I/O通道,这一愿景促使了行业对近封装光学和共封装光学的追求。相较外部可插拔的管模块,光子IC可将光学I/O集成到GPU封装内部,用来与其他的GPU节点进行直接通信,进一步提高了AI算力的扩展效率,满足了当下持续增长的AI需求。

近期,Sivers Semiconductors就在欧洲光通信展览会上展出了他们打造的八波长分布式反馈(DFB)激光器阵列,该阵列集成在了Ayar Labs的SuperNova多波长光源中,支持GPU之间最高4TB/s的数据传输。根据Ayar Labs提供的数据,新的光源配合它们的TeraPHY封装内光学I/O Chiplet,还提供了低上10倍的延迟和8倍的传输能效。

这样的表现无疑极大地提升GPU的性能利用效率,解决当下生成式AI在I/O性能瓶颈上的燃眉之急。尽管光子计算芯片目前尚不能替代传统的电子半导体器件,但从解决带宽和延迟需求上已经有了长足的进步。

写在最后

面对生成式AI模型大小的指数级上涨,以及逐渐庞大起来的推理数据量,传统的I/O性能必然会面临淘汰,而光子IC为高性能的AI芯片提供了一条更快更高效的通路。不过仍然需要注意的是,光子IC与传统IC还有设计与制造上的区别,比如需要特定的设计工具以及工艺等。因此要想发展光子IC跟上这一波趋势,就必须从EDA和晶圆代工厂开始抓起。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IC
    IC
    +关注

    关注

    36

    文章

    6478

    浏览量

    186369
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    无法为 iseled 许可生成,怎么解决?

    和使用新的 S32 Design Studio for S32 Platform IDE。 当我尝试安装 SW32K1-ISELED-RTM-5.0.0 时,我需要一个许可证文件。当我尝试生成许可证时,我收到一条消息,指出它已过
    发表于 04-22 08:28

    JCMsuite应用:空心光子晶体光纤

    。Matlab循环允许在位移位置或修改形状生成多个对象。关于该机制的完整描述可以在Matlab®Interface中找到,并且超出了本例的范围,本例仅用于演示嵌入脚本的能力。这个例子的project.jcmp
    发表于 04-15 08:09

    友思特方案 | 突破 Jetson平台的接口性能瓶颈,Gidel 基于FPGA的高速边缘AI视觉系统

    友思特合作伙伴Gidel FantoVision 成功突破 Jetson I/O 性能瓶颈,助力开发者毫无妥协地将像素数据转化为智能算力,实现边缘视觉
    的头像 发表于 01-13 10:22 2116次阅读
    友思特方案 | <b class='flag-5'>突破</b> Jetson平台的接口性能<b class='flag-5'>瓶颈</b>,Gidel 基于FPGA的高速边缘<b class='flag-5'>AI</b>视觉系统

    陀螺形体材料,突破光子芯片瓶颈

    电子发烧友网综合报道 在人工智能、物联网与大数据技术驱动下,全球数据量正以指数级速度增长。传统电子芯片受限于电子传输的物理瓶颈,已难以满足未来计算对速度与能效的严苛需求。在此背景下,以光子为信息载体
    的头像 发表于 11-23 07:14 1w次阅读
    陀螺形体材料,<b class='flag-5'>突破</b><b class='flag-5'>光子</b>芯片<b class='flag-5'>瓶颈</b>

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接生成
    发表于 09-17 11:45

    智能体化AI生成AI的区别

    生成 AI 的核心是“生成内容” —— 比如用大模型写报告,是对输入指令的被动响应。而智能体化 AI(Agentic
    的头像 发表于 08-25 17:24 1902次阅读

    从材料到集成:光子芯片技术创新,突破算力瓶颈

    电子发烧友网报道(文/李弯弯)在全球科技竞争的浪潮中,光子芯片作为突破电子芯片性能瓶颈的核心技术,正逐渐成为各方瞩目的焦点。它以光波作为信息载体,通过集成激光器、调制器、探测器等光电器件,实现了低
    的头像 发表于 08-21 09:15 9600次阅读

    生成 AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效生成极端天气等长尾场景?本文为您系统梳理
    的头像 发表于 08-06 11:20 5383次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 重塑自动驾驶仿真:4D 场景<b class='flag-5'>生成</b>技术的<b class='flag-5'>突破</b>与实践

    SAP生成AI助手Joule是什么?从虚拟同事到智能团队全面提升企业生产力!

    SAP Joule 作为前沿生成 AI 助手,化身企业「数字员工」,以自动化流程处理、智能决策支持打破业务增长瓶颈
    的头像 发表于 06-27 17:45 913次阅读
    SAP<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>助手Joule是什么?从虚拟同事到智能团队全面提升企业生产力!

    谷歌新一代生成AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1309次阅读

    使用NVIDIA Earth-2生成AI基础模型革新气候建模

    NVIDIA 正通过 cBottle(Climate in a Bottle 的简称)为这项工作带来新的突破,这是全球首个专为以公里尺度分辨率模拟全球气候而设计的生成 AI 基础模型
    的头像 发表于 06-12 15:54 1454次阅读

    MAX7325 I²C端口扩展器,提供8路推挽I/O和8个漏极开路I/O技术手册

    MAX7325 2线串行接口外设具有16路I/O端口。其中8路为推挽输出,另外8路为I/O端口,带有可选择的内部上拉和瞬态检测功能。8路I/
    的头像 发表于 05-22 15:27 1128次阅读
    MAX7325 <b class='flag-5'>I</b>²C端口扩展器,提供8路推挽<b class='flag-5'>式</b><b class='flag-5'>I</b>/<b class='flag-5'>O</b>和8个漏极开路<b class='flag-5'>I</b>/<b class='flag-5'>O</b>技术手册

    ADP5588移动I/O扩展器和QWERTY键盘控制器技术手册

    ADP5588是一款I/O端口扩展器和键盘矩阵,适用于需要大型键盘矩阵和扩展I/O线路的QWERTY型电话。I/
    的头像 发表于 05-22 11:37 1231次阅读
    ADP5588移动<b class='flag-5'>I</b>/<b class='flag-5'>O</b>扩展器和QWERTY键盘控制器技术手册

    ADP5589键盘解码器和I/O扩展器技术手册

    ADP5589是一款19通道GPIO(通用输入/输出)端口扩展器,内置键盘矩阵解码器、可编程逻辑、复位逻辑和PWM发生器。该IC支持QWERTY键盘和GPIO扩展。I/O扩展器IC适用
    的头像 发表于 05-22 09:35 1167次阅读
    ADP5589键盘解码器和<b class='flag-5'>I</b>/<b class='flag-5'>O</b>扩展器技术手册

    ADP5585键盘解码器和I/O扩展器技术手册

    ADP5585是一款10I/O端口扩展器,内置键盘矩阵解码器、可编程逻辑、复位发生器和PWM发生器。I/O扩展器IC适用于便携
    的头像 发表于 05-22 09:21 1178次阅读
    ADP5585键盘解码器和<b class='flag-5'>I</b>/<b class='flag-5'>O</b>扩展器技术手册