0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIGC催动异构集成浪潮,为本土产业带来历史性机遇

奇异摩尔 来源:奇异摩尔 2023-07-04 14:58 次阅读

以“智联世界 生成未来”为主题的2023世界人工智能大会,即将在本周(7月6日)拉开帷幕。从今年的大会主题不难看出,生成式人工智能(AIGC),正是当下人工智能学术界、产业界的最大热点,可以想见,大会期间,各家厂商的自研大模型将上演一场名副其实的“百模大战”。

回顾AIGC走红的过程,2018年谷歌发布Transformer模型无疑是一个关键里程碑。由于舍弃了NLP领域自回归计算范式的LSTM/GRU传统算法,从CV领域借用已较为成熟的注意力机制,以位置信息取代时序信息,Transformer得以充分利用GPUSIMD架构处理器硬件的并行处理能力,实现了令人惊艳的工程效果,并使大型语言模型(LLM)成为其后迅速走向主流的研究路径,工程实践与能力涌现的良性循环,最终为ChatGPT、Midjourney等产品的现象级传播奠定了基础。

当下这场无人甘于错失的AI淘金热中,大算力AI芯片,顺理成章成为衡量各家AIGC业务能力的最重要标尺之一,得到了空前关注。不过在公众舆论场中,这一极具解析价值的议题似乎被简单粗暴地等同于“囤积了多少块英伟达A100/H100”。有鉴于此,集微网特意对国内外开发大算力AI芯片的科技公司概况进行了整理,以期为读者提供一幅AI“大芯片”全景图谱。

通用还是定制,AI芯片体系结构“天问”

1991年,当黄仁勋还未创立英伟达之时,深度学习“三巨头”之一的杨立昆(Yann LeCun),就已经在贝尔实验室开发了卷积神经网络专用训练芯片ANNA,初步验证了为AI训练、推理任务开发的领域专用架构在算力、能效上的优越性。

635c798e-1993-11ee-962d-dac502259ad0.png

2015年前后,在AlexNet、AlphaGO的震撼下,大批企业涌入AI芯片市场,掀起了这一细分赛道的第一波创投热潮。作为AI芯片中最为高端的品类之一,面向数据中心市场的AI大算力芯片也吸引了众多新老玩家。集微网所梳理的主要厂商,彼时普遍押注于两大技术路线,即英伟达为代表的GPGPU路线,和谷歌TPU为代表的定制ASIC路线。

63d48af0-1993-11ee-962d-dac502259ad0.png

数年后的今天,英伟达GPGPU无疑依然占据着市场主导地位。

根据集微咨询(JW Insights)统计,AI类芯片在2022年352亿美元的市场规模中,GPGPU占比接近60%,TrendForce则预测,2023年AI服务器(包含搭载GPU、FPGA、ASIC定制芯片)出货量近120万台,其中英伟达GPU市占率约60-70%,云计算巨头自研AI芯片占比约20%。

64217702-1993-11ee-962d-dac502259ad0.png

在英伟达高端产品一卡难求的同时,不少曾经的AI芯片独角兽则已悄然退场,连续收购Habana、Nervana、Movidius等AI芯片明星创企的英特尔,近期也传出加速计算产品线被大幅削减的消息。

定制大算力AI芯片的“骨感”现实,一方面源于AI模型、算法、用例本身极为快速的迭代,使针对特定模型的硬件优化往往面临问世即过时的可能,通用芯片与软件优化的组合有其内在合理性,并且谷歌及一众初创企业实践的ASIC路线依靠乘加器脉动阵列来训练神经网络,往往面临流水线头尾开销大,计算资源利用率不足的问题。

更重要的是,对需求端的AI开发者而言,英伟达不仅意味着一个加速卡硬件品牌,更是完整AI开发平台的代名词。从杨立昆、辛顿(Geoffrey Hinton)等人的开创性工作开始,英伟达CUDA并行计算框架,已经成为事实上的AI学术界、工业界通用标准,在AI开发者社区形成了明显的网络效应,恰如英特尔在CPU领域的统治力来源于IBM PC机所培育的终端用户生态。

当然,ASIC路线暴露出的不足,也刺激了进一步的技术、架构探索,自FPGA起源的可重构计算,近年来又向由数据流驱动的空间计算(Spatial computing)演进,涌现出Tenstorrent、特斯拉、Cerebras等新秀。

AIGC空前热潮下,英伟达之外的新老玩家在大算力AI芯片领域技术与产品布局正在加速。

以全球三大云计算厂商为例,亚马逊近期主动对外表态,对AMD为数据中心AI负载开发的新一代MI300 APU表示了明确兴趣;全球第二大厂微软,也在近期被曝出代号Athena的自研AI芯片项目,据称已有部分样品供微软和OpenAI员工试用,第三朵“大云”谷歌,刚刚公开了TPUv4号称“登月工程”的Pods架构设计。定制大算力AI芯片,缘何“风云再起”?

旧瓶新酒,定制AI芯片拥抱Chiplet

要理解供给端的技术与产品潮流变化,首先应当在需求端寻找线索。生成式人工智能的基本特征之一,无疑是对计算、存储、IO带宽能力堪称永无止境的需求。

64541ffe-1993-11ee-962d-dac502259ad0.png

为了命中市场需求新的“甜蜜点”,各大厂商也展开了堪称八仙过海的多元探索,而这样的探索,显然不会是上一轮AI芯片竞争的简单重复。

在英伟达、谷歌等厂商致力于挖掘集群PodRack层面系统工程潜力的同时,更多AI芯片开发者在性能“军备竞赛”中,将目光投向了Chiplet(芯粒)工程方法,将之作为构建大规模、可扩展、高能效异构算力集群的基石,为了满足AI云端训练、推理任务对计算性能和内存带宽的需求,CPU/GPU/FPGA/ASIC通过Chiplet实现异构集成的实践已不断涌现。

如老牌巨头AMD推出的MI300系列APU,集成晶体管数量近1500亿颗,通过三种Chiplet芯粒(Base layer、GPU GCDS、CPU CCDs)与不同规格HBM灵活搭配,可以形成丰富的产品组合,覆盖客户差异化需求,研发成本和量产成本都极具优势。

再如近期被诸多巨头追捧的AI大芯片初创企业Tenstorrent,就明确以Chiplet作为产品迭代方向,并已经与LG电子达成具体产品合作意向。

64832d80-1993-11ee-962d-dac502259ad0.png

大体而言,业界当前对Chiplet的技术与商业价值已形成广泛共识。

在计算性能上,芯粒的立体堆叠能够突破光刻掩膜尺寸极限,大幅提高集成晶体管密度并降低数据传输资源开销,不同体系结构的计算核可灵活组合,形成高内聚、低耦合、可配置、可伸缩的“超级芯片”,适应各类AIGC算法优化需求,实现从System on Chip到System of Chips的转变,在算力集群的系统层面继续推进摩尔定律。而在商业上,Chiplet更有望大幅减少开发量产成本及周期,进一步降低AI算力硬件开发、制造门槛。

65362796-1993-11ee-962d-dac502259ad0.png

此外,如果说海外用户还可以坐观各家差异化方案成败,那么在中国这一全球最二大AI支出市场,大算力AI芯片“另辟蹊径”,更可以说是“Must be”的紧迫要求。未来海外高端GPU/APU即便还可继续“特供”,在互连带宽等关键参数限制下,也将实质性失去处理更大规模模型的能力。

从产业视角看,Die-to-Die(D2D)互连,则堪称Chiplet走向商业应用的最关键环节,同样已成为Chiplet产业链创新创业的热点。

Tenstorrent公司CEO、芯片设计大师Jim Keller就曾谈到,当前Chiplet加速成熟,一个重要因素就是封装技术已能够提供较为理想的D2D信号链路,满足芯粒互连的带宽、功耗需求。

在这一产业环节,除了传统互连IP供应商延申拓展其布局,目前国内外也已涌现出Blue Cheetah、奇异摩尔(Kiwimoore)、Eliyan等新锐厂商,并呈现出十分旺盛的创新活力。

国内代表性厂商奇异摩尔成立于2021年初,是全球首批基于 Chiplet 架构,提供“通用互联芯粒产品及系统级解决方案”的公司。核心产品涵盖高速互联IO Die、高性能互联底座Base Die两类芯粒,以及一系列 Die2Die IP 和 Chiplet 软件设计平台等全链路软硬件产品。公司面向由 AIGC 驱动的数据中心、自动驾驶、个人计算平台等高性能计算市场,通过提供以互联芯粒为核心的 chiplet 系统级解决方案,助力客户更快、更容易的做出复杂高算力芯片。

Blue Cheetah,则是海外目前风头最盛的D2D互连技术供应商之一,在BOW和UCIe联盟均十分活跃,其BlueLynx D2D互连IP已经在多代工艺节点完成硅验证,并已经被DreamBig、Apex等企业应用于其数据中心网络芯片产品。

某种意义上看,这些企业在新赛道上的竞争,也将会决定其所在区域Chiplet产业生态的发展水平。

Chiplet,大规模异构算力集群基石

新一代人工智能技术中,无论是NLP领域的大模型(LLMDM),还是搜广推领域兴起的DLRM模型,各种更新换代的AI工作负载已经明显超出单卡存、算极限,因此在单个芯片规格不断进步的同时,也势必需要由大量异构计算核心组合成算力集群进行处理,以高效完成AI模型训练、推理、迭代等各类生产流程。

AIGC对硬件算力越来越高的要求,使用户日益关注作为一个整体的计算集群能效、费效表现,由大量异构计算核心组成的算力集群,无疑已成为AIGC产业的重要竞争维度。

正如上文所述,AIGC模型参数、数据集的超大规模,使得批处理过程中数据吞吐量极高,为了提升访存带宽,片内封装HBM几乎成为所有AI大算力芯片的必选项,而Tenstorrent等新锐企业的空间计算范式创新,同样内嵌着异构众核的先进封装需求,正因如此,Chiplet已被广泛视为构建大规模、可扩展、高能效异构算力集群的基石。

有鉴于此,集微网也联系到奇异摩尔这一本土Chiplet产业代表厂商,邀请其分享了来自行业前沿的观察。

奇异摩尔联合创始人兼产品及解决方案副总裁祝俊东表示,当前超大规模计算集群的发展有着三大驱动因素:

第一,从单芯片本身的维度来看,对其性能依然有非常高的要求,各家厂商无不在继续致力于提升单片性能规格,不过传统的SoC方式已经逼近极限,怎样做一颗更大的芯片就成为挑战;

第二,从AI角度着眼,不同类型的AI应用其实对于算子/算力的要求千差万别,既要兼顾在不同情况下的通用性,也要满足适度的专用性,例如对于Transformer的优化;

第三,数据驱动的生成式人工智能,在运用中涉及大量预处理/前处理工作,已不适合纯用GPU处理,需要用到异构计算架构去处理。

算力集群的持续扩展和异构集成,也带来多重技术挑战,互连是其中尤为关键的瓶颈,在祝俊东看来,超大规模异构如果在板卡级或者集群级实现,互连带宽势必会成为瓶颈,尤其是东西向带宽随着节点规模扩大,在总带宽难以提升的情况下,更成为瓶颈,这也是业界推崇在芯片级异构Chiplet的原因所在,片内异构集成在带宽、延时、功耗上能够带来更为优越的表现。

算力投资热潮下,Chiplet产业也已经步入加速普及阶段,根据研究机构Yole预测,狭义口径的Chiplet(2.5D/3D封装芯片)产品,正在迎来出货量与市场规模的跃迁,2023、2024、2024年产品产值预计将分别达到70亿、480亿、990亿美元。

656dfb62-1993-11ee-962d-dac502259ad0.png

如此惊人的跳跃式增长,既受益于需求端AI/HPC大芯片等热门应用的“拉力”,也有供应端先进制程技术演进带来的“压力”。

半导体行业权威性的IRDS 2022版光刻技术路线图中就明确警告,如果高NA EUV在2025年成功实用化,将导致当前的EUV***最大单次曝光面积进一步缩小一半,掩模尺寸必须更小,因此当高NA设备被引入时,monolithic芯片的“解耦”(disaggregation)几乎不可避免,Chiplet势必将从可选项向必选项转变。

综上所述,Chiplet在数据中心市场的加速渗透普及已经是一个不可逆扭转的趋势,各个巨头的中高端产品里已经普遍使用Chiplet工程方法。

跨越鸿沟,Chiplet产业生态嬗变

如同二十年前的SoC技术,“小荷才露尖尖角”的Chiplet,产业链仍然处于发育的早期阶段,目前在高端处理器领域的代表性产品,依然多为芯片与系统大厂内部自研。对于当下想要试水Chiplet的其他芯片开发团队,依然面临着多方面的技术与商业挑战:

第一,在前端设计上原有SoC/ASIC方法学及EDA工具链面临重构,以适应基于D2D互连的Chiplet架构;

第二,Chiplet产品总体性能并不简单等同于芯粒的堆叠规模,需要一套有效的D2D互联架构及算法以实现高带宽、低延时、低功耗,解决物理分离LLC的NUMA(非统一内存访问),更进一步看,D2D互联还需要形成行业标准,以实现不同厂商芯粒的互连互通;

第三,异构乃至异质芯粒封装引入新的约束,后端设计面临热、力、电磁仿真及可测试性的全新挑战;

第四,目前能够提供可靠良率的成熟Chiplet工艺方案依然有限,台积电CoWoS/InFO近乎居于垄断地位,其他拥有先进封装工艺能力的厂商,往往在PDK工艺库与EDA设计工具的结合上依然滞后,导致Chiplet芯片设计与制造能力无法有效对接。

对此,祝俊东也向集微网感言,传统芯片公司对于封装环节工艺细节普遍缺乏掌握,封装厂则需要客户提供其对先进封装工艺的需求,同样不了解相关技术如何在产品中发挥作用,因此产业环节对接还有很大的鸿沟,确实是一个有待解决的挑战。

基于上述原因,对国内外大部分公司而言,想要尽早布局新兴赛道,就必须借助于第三方厂商的服务,而与SoC产业链上的IP/设计服务厂商相比,Chiplet服务商覆盖的产业链条不但更长,其在整合产业生态上的作用也更为关键。

以在北美市场极为活跃的Palo Alto Electron为例,该公司可为客户完成基板和系统设计、CHIPLET设计与验证、原型和PDK开发,结合生态合作伙伴的芯粒库和代工服务,形成了工程服务的“闭环”。

国内企业中,奇异摩尔也是这一新兴产业环节的代表,除了完善的芯粒库,该公司还可提供软件设计平台,可快速完成Chiplet 系统设计、验证、仿真等工作。

国内Chiplet产业发展同样堪称有声有色,在产品层面,华为公司早在2019年前后就已经完成五大基础Chiplet设计,包括CPU-Compute Die、AI-ComputeDie、Compute-lO Die、NIC-IO Die和Wireless-ACC Die,基础Chiplet之间共享公共联接,并遵循共同物理设计规则,可基于不同的Chiplet搭配组合出服务器CPU、AI加速期、Smart-NIC等多种数据中心大芯片产品,而在供应链上,设计服务、代工制造环节本土企业也正在加速崛起,以奇异摩尔为例,该公司目前除了完善的芯粒库、软件设计平台外,还与本土IC供应链巨头润欣科技达成合作,可望进一步形成turnkey式的完整解决方案交付能力。

从英特尔、AMD到PAe、奇异摩尔,大小公司、新老势力的活跃身影,共同勾勒出Chiplet当下在大算力AI芯片领域掀起的变革浪潮,令人犹如置身千禧年之初SoC大兴的年代,对于半导体产业人而言,能够在一场重大“范式转移”的现场亲眼见证,无疑是一种幸运。正如SoC大潮成就了以高通为代表的众多Fabless企业,深刻改变了全球半导体产业生态,Chiplet的兴起,同样已经预示了大算力芯片市场的重大机遇。

凭借着毫不逊色于海外厂商的本土Chiplet产业生态,在这一宝贵的机遇窗口,大算力AI芯片产业链的自主创新将会涌现更多、更大的突破,也必将更有力支撑我国生成式人工智能全产业链发展。有理由期待,即将开幕的世界人工智能大会,将为我们带来一系列惊喜。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    436

    浏览量

    10057
  • AI芯片
    +关注

    关注

    17

    文章

    1657

    浏览量

    34406
  • 奇异摩尔
    +关注

    关注

    0

    文章

    32

    浏览量

    3203
  • AIGC
    +关注

    关注

    1

    文章

    262

    浏览量

    913
  • 芯粒
    +关注

    关注

    0

    文章

    48

    浏览量

    64

原文标题:AIGC催动异构集成浪潮,为本土产业带来历史性机遇

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中国汽车产业来历史性时刻——中国新能源车市场渗透率首超燃油车。

    新能源行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年04月25日 09:28:04

    晶合集成打造国产OLED显示驱动芯片,助力产业链升级

    晶合集成,作为显示驱动芯片制造的领头羊,已经抓住了这一机会,努力推动本土产业的自给自足。3月,其自主研发的采用40纳米高压技术的OLED显示驱动芯片首次亮相,体积减小,各项功能增强,反应速度快,能耗低,工艺技术达到世界先进水平
    的头像 发表于 04-19 09:26 119次阅读

    火了这么久的大模型,到底能为模组产业带来什么?

    AIGC时代浪潮下,美格智能也与芯片厂商及众多下游客户协同,不断开展AIGC应用的研发和推广,通过大模型与千行百业的深度融合,为传统IoT、车载、机器人等行业创造新的价值。
    的头像 发表于 03-15 17:43 177次阅读

    【换道赛车:新能源汽车的中国道路 | 阅读体验】1.汽车产业大变局

    机遇和挑战。一方面,新技术汽车产业带来了更多的创新空间,另一方面,也需要汽车产业适应新的市场环境和技术趋势,不断推陈出新,满足消费者的需求。 对于汽车
    发表于 03-04 07:28

    华芯邦科技开创异构集成新纪元,Chiplet异构集成技术衍生HIM异构集成模块赋能孔科微电子新赛道

    华芯邦科技将chiplet技术应用于HIM异构集成模块中伴随着集成电路和微电子技术不断升级,行业也进入了新的发展周期。HIM异构集成模块化-
    的头像 发表于 01-18 15:20 254次阅读

    2024年aigc应用层十大趋势

    这三波进步浪潮共同推动了AIGC技术的发展,使其从理论研究走向实际应用,从单一功能向全面智能化转变,并在不断深化与业务场景的融合中,为产业变革和经济发展提供了强大的动力。
    的头像 发表于 01-10 09:32 418次阅读
    2024年<b class='flag-5'>aigc</b>应用层十大趋势

    异构集成 (HI) 与系统级芯片 (SoC) 有何区别?

    异构集成 (HI) 与系统级芯片 (SoC) 有何区别?
    的头像 发表于 11-29 15:39 543次阅读
    <b class='flag-5'>异构</b><b class='flag-5'>集成</b> (HI) 与系统级芯片 (SoC) 有何区别?

    什么是异构集成?什么是异构计算?异构集成异构计算的关系?

    异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部,以增强功能性和提高性能。
    的头像 发表于 11-27 10:22 3000次阅读
    什么是<b class='flag-5'>异构</b><b class='flag-5'>集成</b>?什么是<b class='flag-5'>异构</b>计算?<b class='flag-5'>异构</b><b class='flag-5'>集成</b>、<b class='flag-5'>异构</b>计算的关系?

    重磅发布!浪潮高性能分布式存储平台AS15000G7加速产业数智化变革

    AS15000G7重磅发布 ,以在性能、管理、融合和效率方面追求极致的智慧存储新品,构筑智慧世界基石,推进AI产业化数智变革。 AI大模型对数据存储产业带来机遇与挑战 AIGC是当前
    的头像 发表于 08-31 13:50 403次阅读
    重磅发布!<b class='flag-5'>浪潮</b>高性能分布式存储平台AS15000G7加速<b class='flag-5'>产业</b>数智化变革

    一文了解全球AIGC模型

    文章转自「首席数字官」ID:ChiefDigitalOfficer2022年9月6日,一幅由AI生成的画作《太空歌剧院》点燃了AIGC星星之火;ChatGPT的横空出世使AIGC浪潮以燎原之势席卷
    的头像 发表于 08-23 15:19 569次阅读
    一文了解全球<b class='flag-5'>AIGC</b>模型

    浪潮网络助力打造面向AIGC的“三超”网络

    从内容生成、游戏开发、到自动化助手、机器人控制……AIGC这项"黑科技",正在更多领域发挥着作用,并逐渐向行业渗透。例如,在数字政府场景,通过融合AIGC和数字人技术,可以提供
    的头像 发表于 08-19 15:01 912次阅读

    异构计算场景下构建可信执行环境

    的模式会发生变化。总之,短期内异构将成为主流。 备注:图片来自于公开资料 同时,人工智能(AI)推动产业结构优化升级,产业智能化趋势即将颠覆传统产业。而要想更好的运用AI,首先需要对
    发表于 08-15 17:35

    aigc是什么意思啊 aigc和chatGPT的区别

    全球人工智能产业发展的非盈利性组织。它致力于推动人工智能技术和创新应用,加强全球AI技术合作,促进AI产业的可持续发展。AIGC在全球范围内开展各种与人工智能技术相关的活动,例如学术交流、技术培训
    的头像 发表于 08-03 16:48 6262次阅读

    混合键合将异构集成提升到新的水平

    芯片异构集成的概念已经在推动封装技术的创新。
    的头像 发表于 07-03 10:02 1732次阅读
    混合键合将<b class='flag-5'>异构</b><b class='flag-5'>集成</b>提升到新的水平

    展望时代增量 “AIGC浪潮与算力变革”媒体沙龙在京召开

    近日,由中兴通讯与百度APP、百度百家号、好看视频联合举办的“AIGC浪潮与算力变革”媒体沙龙在北京召开。本次活动围绕数字经济中算力与AIGC产业关系、发展
    的头像 发表于 06-25 14:30 202次阅读
    展望时代增量 “<b class='flag-5'>AIGC</b><b class='flag-5'>浪潮</b>与算力变革”媒体沙龙在京召开