0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MCM正在渗透进更多的芯片设计中

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-05-09 09:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)多芯片模块(MCM)技术的应用在半导体业界已经不是什么新鲜事了,但随着Chiplet、2.5D/3D封装技术日趋火热,MCM正在渗透进更多的芯片设计中,无论是GPU、光模块还是AI芯片,都在慢慢引入这类封装技术。

MCM GPU成为趋势

以去年AMD发布的首个MCM GPU Instinct MI250X为例,这款GPU集成了两个GPU Chiplet和128GB的超大HBM2e内存,在算力和带宽上都做到了极致,实现了383TFLOPS(FP16)和3.2TB/s的可怕成绩,无疑是专注AI的各大超算中心梦寐以求的加速器了。同样,英特尔也在其Ponte Vecchio GPU上采用了MCM。

虽然MCM已经由AMD和英特尔两家GPU厂商开始推进了,但目前来看英伟达的动作比较小,虽然有相关的研究,但还未拿出商用的MCM产品。不过以上都是面向HPC/AI市场的GPU,消费级的GPU是否也会迎来MCM的GPU呢?据现在的传闻,AMD极有可能在下一代RDNA3架构的高端GPU中用上MCM。

但消费级应用与HPC/AI应用又属于截然不同的场景,后者使用多个GPU跑负载是很常见的情况。但消费场景中多GPU已经相当少见了,在兼容性上肯定会大打折扣,所以迈出这一步很可能会带来一定的风险。

IP公司眼中的MCM

MCM不仅为GPU公司带来了更多设计灵活性,也让一众IP公司找到了新的商业模式。比如IP公司Credo就提供混合信号DSP IP,用于客户的ASIC设计,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。随着数据中心的网络架构慢慢趋向于400G以上,芯片连接性的要求也在逐步升高。为此,Credo在去年底推出了全新的3.2Tbps BlueJay重定时器chiplet,通过64通道56Gbps PAM4 LR的DSP,提供了强大的系统级连接性。

BlueJay虽然只是以台积电28nm工艺打造,但保证了性能和功耗的要求,与其先进工艺方案Nutcracker相比也降低了成本。此外,由于BlueJay与主机端MCM中SoC核心的通信是通过超低功耗的BoW D2D接口实现的,其接口已经针对台积电的CoWoS封装技术做了优化。这种将SerDes功能从片上(on-die)转向片外(off-chip)的做法,显著增加了ASIC的可使用面积,设计者可以将这一部分多出来的面积用于实现更高的计算性能。

AI在MCM上的创新

同样,AI也在MCM上找到了新的解决方案。我们已经看到了大的机器学习模型通过训练大数据在多个领域展示了惊人的成果,比如计算机视觉语音识别和自然语言处理等。为了减少机器学习加速器的成本,业界引入了不少设计创新,其中之一就是MCM。

英伟达的Simba,谷歌的TPU,都用到了MCM的设计。谷歌的Coral TPU是一个用于边缘端的机器学习推理加速器,在极小的占用面积下可以实现4 TOPS(INT8)的峰值性能,能效比可达2 TOPS/W。英伟达的Simba同样是一个用于推理的芯片,但规模比谷歌的Coral更大,整个MCM由36个Chiplet组成,每个都能实现4 TOPS的峰值性能,将整个芯片算力提升至最高128 TOPS,能效比更是高达6.1 TOPS/W。

一来在设计上,设计小芯片的难度比一整块芯片要低,二来小芯片由于面积较小,生产良率也更高。这都证明了这种方案既可以减少设计和生产成本,也能达到与单个大芯片近似的性能与能效。

但正如我们上文提到的MCM GPU兼容问题一样,机器学习中MCM也并非毫无痛点。由于MCM中单个Chiplet的内存远比单个大芯片要小,所以大型机器学习模型的训练与推理都需要将矢量计算的数据流图在Chiplet上进行划分。多芯片进行划分就是为了将运算分配给Chiplet,从而将某个性能指标最大化,比如说吞吐量。但与单芯片不一样,MCM中小芯片的数量以及神经网络的节点数量增加,都会让搜索空间成指数级增长,从而降低效率,更不用说因为MCM的硬件特性,可用的划分方案并不多。所以这种划分的质量,直接影响到了MCM芯片设计的优化。

为了解决这个问题,谷歌的研究员们开发了一种深度强化学习的划分方案,同时利用一个约束求解器来专门解决MCM封装的机器学习模型划分问题。他们的方案可以通过预训练来普及到未知的输入图,通过对生产级BERT模型的硬件评估,他们得到了超过随机搜索和模拟退火等现有方案5%以上的吞吐量。更重要的是,这种方案具备极佳的迁移学习性能,使用预训练的模型可以有效提升样本效率,将搜索时间从3个小时减少到了9分钟。

原文标题:MCM正在潜移默化地改变芯片设计

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136062
  • 芯片设计
    +关注

    关注

    15

    文章

    1172

    浏览量

    56776
  • MCM
    MCM
    +关注

    关注

    1

    文章

    70

    浏览量

    22938

原文标题:MCM正在潜移默化地改变芯片设计

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    浅谈车规多芯片模块可靠性验证新要求

    AEC-Q104是汽车电子协会针对 “多芯片模块(MCM)”制定的车规级可靠性验证规范,是车载高密度集成器件进入供应链的重要准入依据。
    的头像 发表于 04-22 09:50 397次阅读
    浅谈车规多<b class='flag-5'>芯片</b>模块可靠性验证新要求

    芯片短缺 2.0”时代,正在到来

    全球汽车行业曾以为芯片短缺最糟糕的时期已经过去。疫情扰乱了供应链,导致生产线停工,许多人认为半导体危机终将随着时间的推移而缓解。然而,一个被称为“芯片短缺2.0”的新阶段正在到来,而且与以往截然不同
    的头像 发表于 04-20 13:06 151次阅读
    “<b class='flag-5'>芯片</b>短缺 2.0”时代,<b class='flag-5'>正在</b>到来

    UWB超宽带技术加速渗透工业场景

    。这些进展正在滋养更广泛的模组级产品生态。 模块制造商架起芯片与应用之间的桥梁 对大多数工业用户而言,接入UWB技术的实际切入点,并非一颗原始芯片,而是经过预认证的集成模块。 G-NiceRF 等无线模块
    发表于 04-17 17:03

    亚马逊云科技正式推出Amazon Security Agent按需渗透测试功能

    里程碑式的改进将渗透测试从周期性的瓶颈转变为按需可得的功能,并可随用户在亚马逊云科技、微软Azure、谷歌GCP、其他云提供商以及本地环境的开发速度而同步扩展。凭借对多云的支持,Amazon Security Agent可让用户在整个基础架构
    的头像 发表于 04-08 13:56 133次阅读

    想转又怕转?AI低代码MES助力中小企业数字化转型

    从食品包装的批次追溯到汽车零部件的精密调度,制造业的数字化转型早已渗透进生活的方方面面。然而,在这场数字化浪潮,大量企业尤其是中小企业,却始终面临着“想转又怕转”的尴尬局面。
    的头像 发表于 03-31 11:38 195次阅读
    想转又怕转?AI低代码MES助力中小企业数字化转型

    无需功放IC?WTN6040FP-14S大功率语音芯片如何引领技术革新?

    在电子科技飞速发展的今天,语音芯片作为人机交互的关键元件,正渗透进我们生活的方方面面——从汽车喇叭的安全警示,到通道闸机的语音提示,都离不开它。然而,传统的语音芯片方案往往需要外接功放IC才能驱动
    的头像 发表于 02-27 09:45 467次阅读
    无需功放IC?WTN6040FP-14S大功率语音<b class='flag-5'>芯片</b>如何引领技术革新?

    超细间距倒装芯片灌封胶渗透与空洞控制 |铬锐特实业

    铬锐特实业|探讨超细间距(Fine-pitch)倒装芯片封装,底部填充胶渗透难题与空洞缺陷控制的关键技术。分析间距缩小至40-55μm时的流动性、空洞成因及行业解决方案,助力高性能芯片
    的头像 发表于 02-12 04:05 592次阅读
    超细间距倒装<b class='flag-5'>芯片</b>灌封胶<b class='flag-5'>渗透</b>与空洞控制 |铬锐特实业

    为何工业OEM厂商正在向Arm架构迁移

    工业自动化正在经历一场根本性的变革。从工业 PC 到边缘网关和智能传感器,边缘侧的计算需求正在快速变化。人工智能 (AI) 正在从云端走向更多现实环境。过去围绕可预测、单一用途工作负载
    的头像 发表于 12-15 14:56 732次阅读

    技术资讯 I 一文速通 MCM 封装

    本文要点MCM封装将多个芯片集成在同一基板上,在提高能效与可靠性的同时,还可简化设计并降低成本。MCM封装领域的最新进展包括有机基板、重分布层扇出、硅中介层和混合键合。这些技术能够提升MCM
    的头像 发表于 12-12 17:10 7378次阅读
    技术资讯 I 一文速通 <b class='flag-5'>MCM</b> 封装

    2025国人工智能大会,藏着AI的行动派时刻

    AI正在从空中楼阁渗透进社会生产的方方面面
    的头像 发表于 12-07 22:29 8956次阅读
    2025<b class='flag-5'>中</b>国人工智能大会,藏着AI的行动派时刻

    CINNO预计2025年国乘用车市HUD渗透率约17%

    “根据CINNO Research数据显示,车载标配HUD正快速向中低端和高端市场渗透,1H’25国乘用车HUD标配量同比增长22%,HUD标配率为15.5%,其中,AR-HUD标配量同比增长45%,AR-HUD标配率达4.3%,同比均提升1个百分点。”
    的头像 发表于 11-10 17:42 1457次阅读

    Arm CEO:公司正在自研芯片

    据外媒路透社报道,Arm CEO Rene Haas透露,Arm正在投资开发自有芯片,并计划将部分利润投资于制造自己的芯片和其他组件。与之对应的是Arm预测的下一财季经营业绩也会因为自研芯片
    的头像 发表于 07-31 11:49 781次阅读

    芯片行业,太缺人了

    随着芯片需求的不断增长,以及设备和应用逐渐渗透到日常生活,半导体行业正在快速发展。然而,据Semi称,该行业正面临严重的劳动力失衡问题,合格专业人员(尤其是工程师和领导者)的数量
    的头像 发表于 07-04 10:02 1354次阅读
    <b class='flag-5'>芯片</b>行业,太缺人了

    传统的芯片设计,正在被颠覆

    几十年来,半导体开发一直遵循着24至36个月的稳定设计开发周期。虽然这种模式在计算需求较低且创新速度更易于管理的情况下运作良好,但人工智能却创造了一套新的规则。人工智能的飞速发展正在迅速超越当前芯片
    的头像 发表于 06-27 12:38 1020次阅读
    传统的<b class='flag-5'>芯片</b>设计,<b class='flag-5'>正在</b>被颠覆

    瑞之辰:全金属封装+MEMS传感技术双轮驱动重塑格局

    上至宇宙的航天器,下至地下管网,传感器,已经渗透进生活的每个角落。传感器正在全球范围内,为各产业转型升级不断提振活力。然而,当一台咖啡机的压力传感器因温漂误差导致萃取失败时,背后折射出的是我国高端
    的头像 发表于 06-26 16:36 1070次阅读
    瑞之辰:全金属封装+MEMS传感技术双轮驱动重塑格局