0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

驱动云/边缘侧算力建设的高性能互联接口方案

jf_pJlTbmA9 来源:奎芯科技 作者:奎芯科技 2023-11-23 16:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月14-15日,2023全球AI芯片峰会(GACS 2023)在深圳正式举行。奎芯科技应邀出席大会,副总裁王晓阳发表主题为《驱动云/边缘侧算力建设的高性能互联接口方案》的演讲。在演讲中,王晓阳分享了AIGC产业算力需求引发的芯片互联趋势,并对算力芯片瓶颈进行了分析,提出了奎芯内存互联解决方案和Chiplet方案落地案例。

AIGC引爆的芯片互联趋势

最近几年AI模型快速发展,模型规模每年差不多10倍速度增长,当令人惊讶的1750亿参数的GPT3已成为过去式,迎来更大体量的万亿参数时代,AI系统算力需求也随之增加,几乎每季度翻倍增长。最近几年体系结构讨论最多的问题之一就是如何破解两堵墙:内存墙和I/O墙。多年来通过工艺进步,计算架构设计革新等方法,理论算力的增长速度是惊人的,但是内存带宽,互联带宽的增长却相对缓慢,造成了巨大的落差,最近业界也在尝试很多方法来缩小这些差距比如:增加缓存,多级缓存架构,堆叠缓存;尽量提高单节点算力减少互联的overhead;用高速的芯片互联和系统互联的SerDes做芯片互联等等。

wKgZomVda3WAdBIBAADwKs34-fA147.jpg

英伟达GH200非常重点的强调HBM带宽,LPDDR容量,以及NVLINK的速度。AMD发布的MI300X对算力指标提都不提,只提内存容量、内存带宽以及互联带宽。因此可以看到在LLM的游戏规则下,内存容量、内存带宽以及互联带宽成了最核心的竞争力,而算力的重要性相对下降。

算力芯片瓶颈分析

目前主流AI大芯片采用HBM为主,它的价格相对其他内存要贵,但单位带宽成本较低。

HBM使用有诸多限制,其一是因为HBM的颗粒必须和SOC的Die要对齐,合封在一起,所以它是一个紧耦合的状态,会带来如下限制:在HBM数量方面,SoC与HBM必须保持贴合,导致HBM颗粒数量受限于芯片边缘长度;在热管理方面,DRAM的温度敏感性会限制SoC的工作频率,从而影响性能,而SoC与HBM之间的热交互对测试提出了更高的要求;在设计实施方面,HBM IP的布局和适配性相对不够灵活;另外,工艺限制要求SoC与HBM HOST IP必须采用相同的工艺制程;最后,需要注意的是SoC的面积占用问题,在12纳米工艺下每个HBM HOST IP大约占据30mm2,限制了计算单元的面积。

其二是主流HBM的应用还是以先进封装为主,包括Silicon interposer 或者Silicon Bridge等,也带来了不少限制:Interposer尺寸受限制,最大只能有3到4个曝光面积;2.5D封装的成本较高,与标准封装相比价格高出4倍,近期台积电的CoWoS单价上涨了20%;采用uBump作为连接点时,测试覆盖率有限,当封装中包含超过6个HBM和2个ASIC时,良率明显下降;最后,CoWoS产能有限,台积电的CoWoS产能紧缺,国内2.5D封装技术还不够成熟。

奎芯基于UCIe接口的HBM互联方案

针对这些问题,奎芯科技打造一站式解决方案—M2LINK,用于将HBM和SoC解耦。基本做法是利用一颗Chiplet将HBM接口协议转成UCIE接口协议,然后用RDL interposer 把Chiplet和HBM内存封装成一个标准模组,最后通过普通基板来和主SoC进行封装。这样主SoC和标准模组间距离预计可以拉远到2.5cm,克服了原先主SoC和HBM紧耦合和绑定的限制,同时也无需受限于先进封装的高成本和Si Interposer的有限尺寸。除此之外还有诸多好处,比如以UCIe IP取代HBM IP,节省了主芯片面积,主芯片成本降低;单位边长可以连接更多的HBM标准模组,内存容量和带宽都可以得到提升等等。

wKgZomVda3yAHPvGAAELq7n1XT0168.jpg

以目前主流芯片为例,SoC近HBM的边长为30mm的话,可以摆放6个HBM颗粒,利用M2LINK方案的话,双边共可以摆放8个HBM模组,同等大小的SoC可利用面积增大44%,内存容量带宽增加1/3, 最大封装面积可以增加一倍以上。

奎芯Chiplet落地解决方案

奎芯科技作为国内领先的互联IP产品及Chiplet产品供应商,国产自研内存及互联解决方案,奎芯LPDDR5X接口速率可达8533Mbps,业界领先。奎芯D2D接口则具有高速率、低功耗、低延迟等优势。而奎芯HBM接口可支持国产工艺 PHY+ Controller 全套方案,速率可达6.4Gbps。目前,奎芯已经有70件知识产权申请,以及16件荣誉奖项。

wKgaomVda4KAaU6LAAEMlVw-uU0487.jpg

奎芯科技基于对于整个封装供应链的整合能力,目前和客户一起打造一款标准的带HBM3的2.5D全国产封装大芯片,将会提供包含HBM IP, interposer设计,2.5D封装的设计的完整的turn key solution。

wKgZomVda4mALNNIAAEB_o5y5LI780.jpg

同时,奎芯科技基于D2D(UCIe)解耦SoC和HBM HOST的思路不仅适用于云端训练和推理的大算力芯片,在端侧已经有具体实践的案例,目前在给客户打造的是一款低功耗计算产品的IO die。对于此场景,客户希望计算部分用最先进的制程,考虑到昂贵的成本,客户还是希望解耦内存接口放到成熟工艺上实现,因此我们给客户打造一颗包含 LPDDR host 的完整IO die, 实现内存接口解耦,降低成本,为客户未来产品升级增加灵活性。

奎芯科技致力于建立开放生态的一站式Chiplet服务平台,提供接口IP,Chiplet,系统设计和先进封装设计等服务,配套强大的供应链资源及高效的系统整合服务,为客户提供完整的一站式解决方案。

来源: 奎芯科技

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54630

    浏览量

    470892
  • AI芯片
    +关注

    关注

    17

    文章

    2181

    浏览量

    36886
  • 算力
    +关注

    关注

    2

    文章

    1772

    浏览量

    16857
  • chiplet
    +关注

    关注

    6

    文章

    501

    浏览量

    13670
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    向成电子XC3588E+卡:3W低功耗,25 TOPS硬核算,重塑AI视觉边缘生态

    边缘AI视觉遇上低功耗高性能,一场工业与智能场景的革命正悄然发生。向成电子XC3588E高性能工控主板,凭借旗舰级RK3588芯片与工
    的头像 发表于 05-16 10:07 468次阅读
    向成电子XC3588E+<b class='flag-5'>算</b><b class='flag-5'>力</b>卡:3W低功耗,25 TOPS硬核算<b class='flag-5'>力</b>,重塑AI视觉<b class='flag-5'>边缘</b>生态

    尖信息正式推出G7866 X6 8U16卡服务器 破解行业困境

    尖信息正式推出全新一代G7866 X6 8U16卡服务器。该产品以“高性能硬件配置+创新架构设计”为核心,通过8U机架高度集成16块高性能
    的头像 发表于 05-06 11:07 1111次阅读

    可运行 30B 大模型!高性能 RISC-V 边缘计算盒:AIBOX-K3

    AIBOX-K3是基于进迭时空最新一代RISC-V处理器K3打造的高性能边缘终端,采用CPU+AI核融合设计,兼具强悍通用运算能力与端AI加速能力,可提供130KDMIPS通用
    的头像 发表于 04-22 16:46 623次阅读
    可运行 30B 大模型!<b class='flag-5'>高性能</b> RISC-V <b class='flag-5'>边缘</b>计算盒:AIBOX-K3

    面向边缘AI视觉的高性能模组解决方案 ——杰和科技LM2-100-V0深度解析

    高性能边缘AI加速方案。1.卓越的表现该模组搭载了专为边缘计算场景优化的NPU(神经网络处
    的头像 发表于 04-21 13:37 1571次阅读
    面向<b class='flag-5'>边缘</b>AI视觉的<b class='flag-5'>高性能</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组解决<b class='flag-5'>方案</b>  ——杰和科技LM2-100-V0深度解析

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    Station的出现,标志着边缘AI不再仅仅是“云端的缩水版”,而是具备独立生命周期的“边缘原生”节点 。它不仅能在本地完成推理,还能通过丰富的
    发表于 03-10 14:19

    阿里全光互联架构,突破AI瓶颈

    构建高性能AI网络的关键。   近期阿里、腾讯均推出NPO(近封装光学)重大成果,其中阿里全光Scale-up网络架构UPN512通过光互连直接连接xPU与交换机,采用单层CLOS拓扑实现512颗xPU的全互联,该
    的头像 发表于 02-27 09:19 2660次阅读
    阿里<b class='flag-5'>云</b>全光<b class='flag-5'>互联</b>架构,突破AI<b class='flag-5'>算</b><b class='flag-5'>力</b>瓶颈

    华为AI WAN解决方案推动互联网高质量发展

    出,人工智能规模化应用驱动部署需求全面升级,华为AI WAN解决方案凭借持续的技术创新突破,有效解决了跨域
    的头像 发表于 12-25 15:17 846次阅读

    从云端集中到边缘分布:边缘如何重塑网络布局

    随着大模型推理延迟进入毫秒级时代,整个科技行业都意识到:网络的规则正在被改写。这场变革的核心,正是从云端集中式计算向边缘分布式智能的范式转移。据行业多家分析机构综合预测,全球AI基础设施正面
    的头像 发表于 12-25 11:34 712次阅读
    从云端集中到<b class='flag-5'>边缘</b>分布:<b class='flag-5'>边缘</b>智<b class='flag-5'>算</b>如何重塑<b class='flag-5'>算</b><b class='flag-5'>力</b>网络布局

    什么是AI边缘模组?​

    天数智AI边缘模组以其多元的产品矩阵、领先的技术实力和广泛的行业应用,正成为推动各行业智能化变革的重要力量。未来,天数智将继续深耕
    的头像 发表于 12-17 17:09 1134次阅读
    什么是AI<b class='flag-5'>边缘</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?​

    解锁边缘智能新境界,天数智AI边缘模组赋能端AI应用新篇章​

    在数字化与智能化飞速发展的时代,边缘计算正逐渐成为推动行业变革的关键力量。天数智紧跟技术浪潮,精心布局AI边缘模组领域,以强大的产品矩
    的头像 发表于 12-12 09:16 956次阅读
    解锁<b class='flag-5'>边缘</b>智能新境界,天数智<b class='flag-5'>算</b>AI<b class='flag-5'>边缘</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组赋能端<b class='flag-5'>侧</b>AI应用新篇章​

    解锁边缘智能新境界,天数智AI边缘模组赋能端AI应用新篇章​

    在数字化与智能化飞速发展的时代,边缘计算正逐渐成为推动行业变革的关键力量。天数智紧跟技术浪潮,精心布局AI边缘模组领域,以强大的产品矩
    的头像 发表于 12-12 09:15 819次阅读
    解锁<b class='flag-5'>边缘</b>智能新境界,天数智<b class='flag-5'>算</b>AI<b class='flag-5'>边缘</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组赋能端<b class='flag-5'>侧</b>AI应用新篇章​

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    兆芯与安勤科技共建丰富边缘计算方案

    日前,安勤科技“端融合、共创生态”边缘与端多元应用研讨会在广州、北京两地成功举办。会议聚焦智慧城市、智能制造、智慧医疗三大领域,探讨
    的头像 发表于 09-28 18:00 1179次阅读

    EASY-EAI携手Hailo,推出高性能、高边缘AI硬件组合

    导读EASY-EAI与Hailo建立合作关系,共同推出高边缘AI产品组合。此次合作,EASY-EAI将采用Hailo公司的AI加速芯片,并与我司硬件相结合,打造一款性能优异、性价
    的头像 发表于 07-25 15:22 1539次阅读
    EASY-EAI携手Hailo,推出<b class='flag-5'>高性能</b>、高<b class='flag-5'>算</b><b class='flag-5'>力</b>的<b class='flag-5'>边缘</b>AI硬件组合

    华为AI WAN智IP广域网助力互联建设

    的发展机遇。数据通信网络的高效性、可靠性和智能化程度,直接决定了资源能否在广域网范围内实现快速、精准的调配与利用,进而影响互联网的整
    的头像 发表于 06-11 11:21 1359次阅读