0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MCM正在渗透进更多的芯片设计中

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-05-09 09:27 次阅读

电子发烧友网报道(文/周凯扬)多芯片模块(MCM)技术的应用在半导体业界已经不是什么新鲜事了,但随着Chiplet、2.5D/3D封装技术日趋火热,MCM正在渗透进更多的芯片设计中,无论是GPU、光模块还是AI芯片,都在慢慢引入这类封装技术。

MCM GPU成为趋势

以去年AMD发布的首个MCM GPU Instinct MI250X为例,这款GPU集成了两个GPU Chiplet和128GB的超大HBM2e内存,在算力和带宽上都做到了极致,实现了383TFLOPS(FP16)和3.2TB/s的可怕成绩,无疑是专注AI的各大超算中心梦寐以求的加速器了。同样,英特尔也在其Ponte Vecchio GPU上采用了MCM。

虽然MCM已经由AMD和英特尔两家GPU厂商开始推进了,但目前来看英伟达的动作比较小,虽然有相关的研究,但还未拿出商用的MCM产品。不过以上都是面向HPC/AI市场的GPU,消费级的GPU是否也会迎来MCM的GPU呢?据现在的传闻,AMD极有可能在下一代RDNA3架构的高端GPU中用上MCM。

但消费级应用与HPC/AI应用又属于截然不同的场景,后者使用多个GPU跑负载是很常见的情况。但消费场景中多GPU已经相当少见了,在兼容性上肯定会大打折扣,所以迈出这一步很可能会带来一定的风险。

IP公司眼中的MCM

MCM不仅为GPU公司带来了更多设计灵活性,也让一众IP公司找到了新的商业模式。比如IP公司Credo就提供混合信号DSP IP,用于客户的ASIC设计,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。随着数据中心的网络架构慢慢趋向于400G以上,芯片连接性的要求也在逐步升高。为此,Credo在去年底推出了全新的3.2Tbps BlueJay重定时器chiplet,通过64通道56Gbps PAM4 LR的DSP,提供了强大的系统级连接性。

BlueJay虽然只是以台积电28nm工艺打造,但保证了性能和功耗的要求,与其先进工艺方案Nutcracker相比也降低了成本。此外,由于BlueJay与主机端MCM中SoC核心的通信是通过超低功耗的BoW D2D接口实现的,其接口已经针对台积电的CoWoS封装技术做了优化。这种将SerDes功能从片上(on-die)转向片外(off-chip)的做法,显著增加了ASIC的可使用面积,设计者可以将这一部分多出来的面积用于实现更高的计算性能。

AI在MCM上的创新

同样,AI也在MCM上找到了新的解决方案。我们已经看到了大的机器学习模型通过训练大数据在多个领域展示了惊人的成果,比如计算机视觉语音识别和自然语言处理等。为了减少机器学习加速器的成本,业界引入了不少设计创新,其中之一就是MCM。

英伟达的Simba,谷歌的TPU,都用到了MCM的设计。谷歌的Coral TPU是一个用于边缘端的机器学习推理加速器,在极小的占用面积下可以实现4 TOPS(INT8)的峰值性能,能效比可达2 TOPS/W。英伟达的Simba同样是一个用于推理的芯片,但规模比谷歌的Coral更大,整个MCM由36个Chiplet组成,每个都能实现4 TOPS的峰值性能,将整个芯片算力提升至最高128 TOPS,能效比更是高达6.1 TOPS/W。

一来在设计上,设计小芯片的难度比一整块芯片要低,二来小芯片由于面积较小,生产良率也更高。这都证明了这种方案既可以减少设计和生产成本,也能达到与单个大芯片近似的性能与能效。

但正如我们上文提到的MCM GPU兼容问题一样,机器学习中MCM也并非毫无痛点。由于MCM中单个Chiplet的内存远比单个大芯片要小,所以大型机器学习模型的训练与推理都需要将矢量计算的数据流图在Chiplet上进行划分。多芯片进行划分就是为了将运算分配给Chiplet,从而将某个性能指标最大化,比如说吞吐量。但与单芯片不一样,MCM中小芯片的数量以及神经网络的节点数量增加,都会让搜索空间成指数级增长,从而降低效率,更不用说因为MCM的硬件特性,可用的划分方案并不多。所以这种划分的质量,直接影响到了MCM芯片设计的优化。

为了解决这个问题,谷歌的研究员们开发了一种深度强化学习的划分方案,同时利用一个约束求解器来专门解决MCM封装的机器学习模型划分问题。他们的方案可以通过预训练来普及到未知的输入图,通过对生产级BERT模型的硬件评估,他们得到了超过随机搜索和模拟退火等现有方案5%以上的吞吐量。更重要的是,这种方案具备极佳的迁移学习性能,使用预训练的模型可以有效提升样本效率,将搜索时间从3个小时减少到了9分钟。

原文标题:MCM正在潜移默化地改变芯片设计

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4414

    浏览量

    126642
  • 芯片设计
    +关注

    关注

    15

    文章

    895

    浏览量

    54406
  • MCM
    MCM
    +关注

    关注

    1

    文章

    67

    浏览量

    22215

原文标题:MCM正在潜移默化地改变芯片设计

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    汽车价格战对芯片供应链的影响

    随着新能源汽车渗透率的快速提升,传统燃油车市场正在逐渐被蚕食。车规芯片厂商又将迎来哪些挑战和机会?
    发表于 03-20 10:26 298次阅读
    汽车价格战对<b class='flag-5'>芯片</b>供应链的影响

    CPU、MCU、MPU、SOC和MCM的含义及区别

    在嵌入式开发中,我们经常会接触到一些专业术语,例如CPU、MCU、MPU、SOC和MCM等,这些缩写代表了不同类型的电子处理单元,它们在消费电子、计算机硬件、自动化和工业系统中扮演着重要角色。下面
    的头像 发表于 11-29 14:14 823次阅读

    澜起科技:CKD芯片有望明年下半年开始上量

     aipc为了提高整体性能,需要更多的带宽需要的内存,所以aipc ddr5一代反复渗透率的增加,加快速度更高的ddr5内存可以增加的需要,因此,ckd芯片的加快,ckd未来更多的羊可
    的头像 发表于 11-23 14:49 551次阅读

    什么是合封芯片,它与单封芯片有何不同?

    什么是合封芯片,它与单封芯片有何不同? 合封芯片(Multi-Chip Module,简称MCM)是将多个晶片集成到一个小型封装内的技术。它与单封
    的头像 发表于 10-23 09:59 1199次阅读

    OpenAI正在探索制造自己的AI芯片

    openai的首席执行官萨姆·奥尔特曼将收购更多的人工智能芯片作为公司的首要课题。他公开对图像组合的不足表示不满,nvidia掌握着最适合ai应用程序的芯片市场的80%以上。
    的头像 发表于 10-09 11:14 451次阅读

    “油电同价”下的市场猛进 电池企业谁在提速“抢跑”?

    在中国电动化加速渗透进程中,PHEV品类(含插电式、增程式)开始扮演越来越重要的作用。
    的头像 发表于 09-26 09:49 1083次阅读
    “油电同价”下的市场猛进 电池企业谁在提速“抢跑”?

    科技云报道:一文搞懂企业渗透测试

    如何正确认知渗透测试?
    的头像 发表于 08-24 16:02 192次阅读

    台积电获更多中国大陆AI芯片供应商订单;全球5G专利排名:华为第一 小米进入前十

    热点新闻 1、消息人士:台积电获更多中国大陆AI芯片供应商订单 据报道,尽管中美之间的紧张关系加剧,可能会导致针对中国大陆的人工智能(AI)GPU受到更多限制,但自今年第一季度以来,中国大陆的AI
    的头像 发表于 07-10 17:50 782次阅读
    台积电获<b class='flag-5'>更多</b>中国大陆AI<b class='flag-5'>芯片</b>供应商订单;全球5G专利排名:华为第一 小米进入前十

    记脚本小子的一次渗透全过程

    一.前言 在一次综合渗透的过程中遇到的比较完整的一个渗透流程。很多现查的技巧,这次渗透的基础是基于队友已经在服务器写入了一句话木马但无法执行系统命令。 二.渗透过程 一开始,我想到的是
    的头像 发表于 06-14 09:21 332次阅读
    记脚本小子的一次<b class='flag-5'>渗透</b>全过程

    如何使用DudeSuite进行渗透测试工作

    Dude Suite 是一款集成化的Web渗透测试工具集,包含了Web渗透测试活动中使用频率非常高的功能,可以帮助我们高效地完成对Web应用程序的渗透测试和攻击。测试人员可依据自身对漏洞及渗透
    的头像 发表于 06-13 09:04 1043次阅读
    如何使用DudeSuite进行<b class='flag-5'>渗透</b>测试工作

    LPUART6映射到的物理引脚以及在哪里可以找到更多信息?

    正在使用 mcxn9XXbrk_face_detection 参考项目研究 MCX-N9XX-BRK。而且我不知道在哪里连接调试端口。它映射到 LPUART6。 我想知道 LPUART6 映射到的物理引脚以及在哪里可以找到更多信息。我在用户手册或源代码
    发表于 06-12 08:52

    MPU模块的寄存器EPID会记录哪个PID?

    - EDR4)的EPID有个疑问。 它说 EPID 记录了错误引用的进程标识符。我想知道“进程标识符”是 RGDn_WORD3 的 PID 还是 MCM_PID 的当前 PID
    发表于 06-05 11:30

    RISC-V,正在摆脱低端

    月流片;目前第三版“昆明湖架构”也正在推进。 此外,已有一批企业正在基于“香山”开发高端芯片,如AI芯片、服务器
    发表于 05-30 14:11

    一款扩展性高的渗透测试框架渗透测试框架

    MYExploit 简介 一款扩展性高的渗透测试框架渗透测试框架(完善中) 只支持部分EXP 利用 使用声明 本工具仅用于安全测试目的 用于非法用途与开发者、本公众号无关 工具下载地址 【进入下方名片回复关键词:504】       审核编辑:彭静
    的头像 发表于 05-30 09:06 368次阅读
    一款扩展性高的<b class='flag-5'>渗透</b>测试框架<b class='flag-5'>渗透</b>测试框架

    浅析SMT贴片加工厂出现透锡不良的四类原因

    高温融化的锡具有很强的渗透性,但并不是所有的被焊接金属(PCB板、元器件)都能渗透进去,比如铝金属,其表面一般都会自动形成致密的保护层
    的头像 发表于 04-27 09:35 626次阅读