0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

类ChatGPT训练需高性能芯片大规模并联,高速接口IP迎红利时代

lPCU_elecfans 来源:电子发烧友网 2023-03-10 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近段时间,ChatGPT的火热重新掀起人工智能产业热潮,尤其是AIGC(指利用人工智能技术来生成内容)领域,已经进入到狂飙姿态,头部科技企业争分夺秒地寻求抢先发布类ChatGPT应用。

众所周知,类ChatGPT应用是一个吞金兽,微软公司为了训练ChatGPT使用了1万张英伟达的高端GPU。“从训练的角度来看,计算性能再好的GPU芯片比如A100如果无法集群在一起去训练,那么训练一个类ChatGPT的大模型可能需要上百年。因此,AI大模型的训练对高速接口IP是一个巨大的挑战,也是一个巨大的机遇。”奎芯科技市场及战略副总裁唐睿在接受电子发烧友网采访时表示。

奎芯科技成立于2021年,该公司的口号是“芯粒高速互联,海量算力源泉 ”。目前,奎芯科技已经推出的高速接口IP组合包括USB、PCIe、SATA、SerDes、MIPIDDRHDMI、DP、HBM等丰富的类型。

类ChatGPT带动接口IP发展

半导体产业分布来看,IP是底层技术,接口IP同样如此,因此关键性和重要性是不言而喻的。那么在AIGC产业里,接口IP能够发挥哪些作用呢?唐睿提到了以下几点。

首先是芯片上的互联接口,也就是Die to Die类型的互联接口IP,包括UCIe等,用以扩充单芯片的计算能力;其次是Chip to Chip类型的互联接口IP,包括SerDes/PCIe/CXL等,能够加快芯片之间的互联和数据交换,满足更高带宽的需求;此外还有内存接口IP,包括SATA、DDR、HBM等,能够用于打造更高性能的存储产品,帮助类ChatGPT存储和交换大规模的数据;再上一层就是数据通讯接口的接口IP。因此,从训练的角度来看,类ChatGPT应用的爆发,能够带来非常大的接口IP需求。

在此前的预测里,有市场调研机构的数据显示,2022年至2026年高速互联IP的市场规模有望以75%的年复合增长率快速成长。“接口IP市场的增长一定是跟随整个高性能计算芯片大趋势的,包括芯片运算性能、内存和带宽方面的提升都需要接口IP的帮助,因此芯片用量的提升一定会带来更大的接口IP用量。”唐睿认为,“同时计算芯片性能的提升已经受限于摩尔定律放缓的影响,单芯片的性能会逐渐遇到瓶颈,那么互联组成算力集群就是一个有效的手段,这也会加快推动接口IP的发展。”

虽然产业热潮来临,不过唐睿并不担心一下子会涌入很多同行或者友商,造成国内接口IP产业内卷。“市场竞争的激烈程度会增加,但接口IP是高门槛的领域,目前国内做高速混合电路的人才其实并不多,特别是在先进制程上做高速模拟电路设计的人才更少,因此从零组建团队进入这个领域是非常困难的。”他对此讲到。

国产厂商的布局和追赶

从全球产业格局来看,在接口IP方面,目前新思科技和楷登电子等EDA厂商以及其他国际上的接口IP厂商还处于领先位置。相关数据显示,截止到2021年,国产接口IP的自给率还不足10%。

“目前,从技术上来看,国产接口IP厂商确实还处于追赶的位置,不过这种差距已经越来越小。”唐睿指出,“2023年,奎芯科技将会推出一系列性能达到国际领先水平的接口IP产品,包括HBM3以及其他领先的D2D类型的互联接口IP。”

同时,他还讲到,在服务国内客户方面,实际上也会存在很多本地化的需求,需要根据这些需求结合晶圆厂的工艺特色,提供IP解决方案。奎芯科技很多IP产品,在研发的过程中或者研发之前,就得到了客户方的问询,围绕客户的芯片架构,有非常清晰的需求。奎芯科技联合自己的下游客户成立了多个产业联盟,通过这些联盟将不同类型的计算芯片公司联合在一起,协同发展,围绕数据中心应用把国产方案搭建好,弥补国内这一块的空白。

当前,AI大模型训练所用到的算力集群基本上都是基于英伟达通用算力芯片来打造,在这方面国产通用算力芯片还存在一定的性能差距。唐睿表示,国产高性能计算芯片还是有机会的,AI大模型并不是一个近期出现的新鲜事物,近些年国内AI产业已经在跟进这一趋势,只是类ChatGPT类型应用背后的大模型参数规模更大。针对这方面的需求,国内芯片产业也早就启动了这方面的布局,包括奎芯科技所在的接口IP赛道,都在向这个方向努力。不过,从IP研发到芯片设计,再到应用落地,这中间会有一个时间差。实际上,国外的公司也是在用之前的芯片通过互联在做这方面的硬件支持。

“还需要特别提出的是,AIGC是一个软硬件结合的应用。软件方面,算法模型的体量也是一个值得研究去突破的方向。目前,国外开源的AIGC算法里,也并非只有Open AI的GPT算法,通过介绍信息来看,也有一些参数更小的模型能够实现类ChatGPT应用。我们实际上可以借鉴这些模型,以减少软件对硬件的需求压力。”唐睿最后讲到。

小结

IP对半导体产业有巨大的撬动力量,在全球范围内,约60多亿美元的IP销售额,带动的是5000亿美元的全球半导体市场销售额。对于***而言,短期内实现单芯片性能暴增的难度非常大,不过通过高速接口IP,用算力集群的方式,也能够逐步进入类ChatGPT的红利市场。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

原文标题:类ChatGPT训练需高性能芯片大规模并联,高速接口IP迎红利时代

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    推荐高性能存储psram芯片

    智能穿戴、物联网设备和端侧AI应用快速发展,PSRAM伪静态随机存储器,正成为越来越多嵌入式系统的优选方案,如何选择一个高性能、小尺寸与低功耗的psram芯片是一个值得思考的问题。由EMI自主研发
    的头像 发表于 11-18 17:24 108次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、芯片

    大规模互连。在这方面,超导体和超导器件具有无损耗特性,可用作神经形态网络中的低功耗互连器件。此外,超导器件还具有前所未有的低功耗和超高速开关特性。 利用超导体或非超导低温器件来模拟大规模生物神经元网络
    发表于 09-17 16:43

    网线接口能插六网线吗

    网线接口(RJ45)可以插六网线,但实际使用效果结合具体场景和设备综合判断。以下是详细分析: 一、物理兼容性:接口通用,但需注意细节
    的头像 发表于 09-08 10:32 3168次阅读

    基于大规模人类操作数据预训练的VLA模型H-RDT

    近年来,机器人操作领域的VLA模型普遍基于跨本体机器人数据集预训练,这类方法存在两大局限:不同机器人本体和动作空间的差异导致统一训练困难;现有大规模机器人演示数据稀缺且质量参差不齐。得益于近年来VR
    的头像 发表于 08-21 09:56 771次阅读
    基于<b class='flag-5'>大规模</b>人类操作数据预<b class='flag-5'>训练</b>的VLA模型H-RDT

    10CX150YF672E5G现场可编程门阵列(FPGA)芯片

    10CX150YF672E5G 是Intel(原 Altera)推出的 Cyclone® 10 GX 系列高性能、低功耗 FPGA 芯片,选用 20nm 工艺技术,具备 150,000 个逻辑单元
    发表于 08-21 09:15

    差分输出 × 超低抖动:打造高速稳定的大型数据同步时脉

    随着云服务、AI训练、超大规模分布式存储的兴起,大型数据中心对时钟源提出更高标准:需要支持超高频率、极低抖动、宽温运行与高可靠性。FCO 系列差分晶体振荡器提供完整封装(25207050)、电压兼容
    发表于 07-16 11:32

    高速互联时代,如何精准测试PCIe M.2接口

    关键功能,而其底层的高速物理传输能力,正面临前所未有的挑战。M.2接口高性能轻量化的代表M.2是基于PCIExpress总线的物理接口标准,兼顾高带宽、低延迟、小尺
    的头像 发表于 07-10 14:20 753次阅读
    <b class='flag-5'>高速</b>互联<b class='flag-5'>时代</b>,如何精准测试PCIe M.2<b class='flag-5'>接口</b>?

    IBM Spectrum LSF如何助力半导体企业应对AI时代高性能芯片需求

    上万个作业,可能会瞬间挤爆计算资源。那如何把成千上万个作业有序的调度到大规模的集群中呢?这时候,就得请出 HPC(高性能计算)调度界的“大宗师”—— IBM Spectrum LSF!
    的头像 发表于 05-27 15:18 821次阅读

    大模型时代的深度学习框架

    作者:算力魔方创始人/英特尔创新大使刘力 在 CNN时代 ,AI模型的参数规模都在百万级别,仅在单张消费显卡上即可完成训练。例如,以业界
    的头像 发表于 04-25 11:43 650次阅读
    大模型<b class='flag-5'>时代</b>的深度学习框架

    AI原生架构升级:RAKsmart服务器在超大规模模型训练中的算力突破

    近年来,随着千亿级参数模型的崛起,AI训练对算力的需求呈现指数级增长。传统服务器架构在应对分布式训练、高并发计算和显存优化等场景时逐渐显露瓶颈。而RAKsmart为超大规模模型训练提供
    的头像 发表于 04-24 09:27 608次阅读

    大规模硬件仿真系统的编译挑战

    引言随着集成电路设计复杂度的不断提升,硬件仿真系统在现代芯片设计流程中扮演着越来越重要的角色。基于FPGA(现场可编程门阵列)的商用硬件仿真系统因其灵活性、全自动化、高性能和可重构性,成为验证
    的头像 发表于 03-31 16:11 1222次阅读
    <b class='flag-5'>大规模</b>硬件仿真系统的编译挑战

    适用于数据中心和AI时代的800G网络

    ,成为新一代AI数据中心的核心驱动力。 AI时代的两大数据中心:AI工厂与AI云 AI时代催生了两数据中心架构: AI工厂:用于大规模模型
    发表于 03-25 17:35

    高性能计算,名副其实的“算力皇冠”

    近年来,从金融到汽车、从教育到医疗,人工智能技术,特别是以ChatGPT为代表的生成式人工智能,正在给整个世界带来颠覆性体验。在如今这个“人工智能时代”,人工智能技术的发展离不开服务于AI算法训练
    的头像 发表于 02-08 14:27 1280次阅读
    <b class='flag-5'>高性能</b>计算,名副其实的“算力皇冠”

    乾瞻科技发布车用高速接口IP系列,助力AI与自动驾驶

    神盾集团旗下子公司乾瞻科技(InPsytech, Inc.),作为高速接口IP领域的全球领导者,近日同步发布了两项具有划时代意义的技术成果,旨在推动车用半导体与AI
    的头像 发表于 12-25 16:06 836次阅读

    【「大模型启示录」阅读体验】+开启智能时代的新钥匙

    那些拥有数十亿甚至数千亿参数的大规模模型成为了现实可能。Transformer 等机制模型架构的横空出世,彻底改变了模型训练的效率和性能。 我有时在想国外为何能够在大模型上能有这样的突破,除了漂亮国
    发表于 12-24 13:10