0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MCM正在潜移默化地改变芯片设计

21克888 来源:电子发烧友网 作者:凯扬 2022-05-09 08:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

多芯片模块(MCM)技术的应用在半导体业界已经不是什么新鲜事了,但随着Chiplet、2.5D/3D封装技术日趋火热,MCM正在渗透进更多的芯片设计中,无论是GPU、光模块还是AI芯片,都在慢慢引入这类封装技术。

MCM GPU成为趋势

以去年AMD发布的首个MCM GPU Instinct MI250X为例,这款GPU集成了两个GPU Chiplet和128GB的超大HBM2e内存,在算力和带宽上都做到了极致,实现了383TFLOPS(FP16)和3.2TB/s的可怕成绩,无疑是专注AI的各大超算中心梦寐以求的加速器了。同样,英特尔也在其Ponte Vecchio GPU上采用了MCM。

Instinct MI250X GPU / AMD

虽然MCM已经由AMD和英特尔两家GPU厂商开始推进了,但目前来看英伟达的动作比较小,虽然有相关的研究,但还未拿出商用的MCM产品。不过以上都是面向HPC/AI市场的GPU,消费级的GPU是否也会迎来MCM的GPU呢?据现在的传闻,AMD极有可能在下一代RDNA3架构的高端GPU中用上MCM。

但消费级应用与HPC/AI应用又属于截然不同的场景,后者使用多个GPU跑负载是很常见的情况。但消费场景中多GPU已经相当少见了,在兼容性上肯定会大打折扣,所以迈出这一步很可能会带来一定的风险。

IP公司眼中的MCM

MCM不仅为GPU公司带来了更多设计灵活性,也让一众IP公司找到了新的商业模式。比如IP公司Credo就提供混合信号DSP IP,用于客户的ASIC设计,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。随着数据中心的网络架构慢慢趋向于400G以上,芯片连接性的要求也在逐步升高。为此,Credo在去年底推出了全新的3.2Tbps BlueJay重定时器chiplet,通过64通道56Gbps PAM4 LR的DSP,提供了强大的系统级连接性。

BlueJay Chiplet / Credo

BlueJay虽然只是以台积电28nm工艺打造,但保证了性能和功耗的要求,与其先进工艺方案Nutcracker相比也降低了成本。此外,由于BlueJay与主机端MCM中SoC核心的通信是通过超低功耗的BoW D2D接口实现的,其接口已经针对台积电的CoWoS封装技术做了优化。这种将SerDes功能从片上(on-die)转向片外(off-chip)的做法,显著增加了ASIC的可使用面积,设计者可以将这一部分多出来的面积用于实现更高的计算性能。

AI在MCM上的创新

同样,AI也在MCM上找到了新的解决方案。我们已经看到了大的机器学习模型通过训练大数据在多个领域展示了惊人的成果,比如计算机视觉语音识别和自然语言处理等。为了减少机器学习加速器的成本,业界引入了不少设计创新,其中之一就是MCM。

Coral TPU / 谷歌

英伟达的Simba,谷歌的TPU,都用到了MCM的设计。谷歌的Coral TPU是一个用于边缘端的机器学习推理加速器,在极小的占用面积下可以实现4 TOPS(INT8)的峰值性能,能效比可达2 TOPS/W。英伟达的Simba同样是一个用于推理的芯片,但规模比谷歌的Coral更大,整个MCM由36个Chiplet组成,每个都能实现4 TOPS的峰值性能,将整个芯片算力提升至最高128 TOPS,能效比更是高达6.1 TOPS/W。

一来在设计上,设计小芯片的难度比一整块芯片要低,二来小芯片由于面积较小,生产良率也更高。这都证明了这种方案既可以减少设计和生产成本,也能达到与单个大芯片近似的性能与能效。

但正如我们上文提到的MCM GPU兼容问题一样,机器学习中MCM也并非毫无痛点。由于MCM中单个Chiplet的内存远比单个大芯片要小,所以大型机器学习模型的训练与推理都需要将矢量计算的数据流图在Chiplet上进行划分。多芯片进行划分就是为了将运算分配给Chiplet,从而将某个性能指标最大化,比如说吞吐量。但与单芯片不一样,MCM中小芯片的数量以及神经网络的节点数量增加,都会让搜索空间成指数级增长,从而降低效率,更不用说因为MCM的硬件特性,可用的划分方案并不多。所以这种划分的质量,直接影响到了MCM芯片设计的优化。

为了解决这个问题,谷歌的研究员们开发了一种深度强化学习的划分方案,同时利用一个约束求解器来专门解决MCM封装的机器学习模型划分问题。他们的方案可以通过预训练来普及到未知的输入图,通过对生产级BERT模型的硬件评估,他们得到了超过随机搜索和模拟退火等现有方案5%以上的吞吐量。更重要的是,这种方案具备极佳的迁移学习性能,使用预训练的模型可以有效提升样本效率,将搜索时间从3个小时减少到了9分钟。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53530

    浏览量

    458837
  • 芯片设计
    +关注

    关注

    15

    文章

    1128

    浏览量

    56429
  • MCM
    MCM
    +关注

    关注

    1

    文章

    69

    浏览量

    22829
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大数据时代下的管理变革:勤哲EXCEL服务器助力企业高效运营

    在大数据高速发展的今天,先进信息技术正在潜移默化改变现代企业的经营管理模式。实践证明,这些技术不但提升了管理效率,还为企业决策提供了科学依据。信息化建设已成为企业管理创新的重要趋势,越来越多企业
    的头像 发表于 11-19 14:29 151次阅读

    Chiplet,改变芯片

    1965年,英特尔联合创始人戈登·摩尔提出了“摩尔定律”。半个多世纪以来,这一定律推动了集成电路(IC)性能的提升和成本的降低,并成为现代数字技术的基础。摩尔定律指出,半导体芯片上的晶体管数量大约每
    的头像 发表于 10-17 08:33 2903次阅读
    Chiplet,<b class='flag-5'>改变</b>了<b class='flag-5'>芯片</b>

    AI芯片冷却技术,正在成为关键

    电子发烧友网综合报道 随着单芯片性能的不断提高,AI芯片的功率飙升至数千瓦级别,需要更加搞笑的散热来保证芯片的稳定运行。最近市场有消息传出,英伟达已要求供应链伙伴开发一种名为MLCP的新型液冷技术
    发表于 09-20 00:36 1601次阅读

    Arm CEO:公司正在自研芯片

    据外媒路透社报道,Arm CEO Rene Haas透露,Arm正在投资开发自有芯片,并计划将部分利润投资于制造自己的芯片和其他组件。与之对应的是Arm预测的下一财季经营业绩也会因为自研芯片
    的头像 发表于 07-31 11:49 456次阅读

    传统的芯片设计,正在被颠覆

    几十年来,半导体开发一直遵循着24至36个月的稳定设计开发周期。虽然这种模式在计算需求较低且创新速度更易于管理的情况下运作良好,但人工智能却创造了一套新的规则。人工智能的飞速发展正在迅速超越当前芯片
    的头像 发表于 06-27 12:38 712次阅读
    传统的<b class='flag-5'>芯片</b>设计,<b class='flag-5'>正在</b>被颠覆

    请问改变电源管理芯片参考点电压就会改变芯片输出电压的原理是什么?

    在线性稳压芯片LM7815电源管理芯片,在输出端并联电阻分压网络R1和R2,并将分压点接在参考端,这样做为什么会将输出电压增大为(1+R2/R1)*Ue,Ue为电源管理芯片额定输出电压; 这里假设
    发表于 04-17 06:28

    谷东AR+AI智能眼镜如何改变生活

    这不是科幻电影,而是一副AR+AI眼镜正在发生的“魔法”。今天,我们带大家走进这款即将改变生活的未来科技——谷东AR+AI智能眼镜。
    的头像 发表于 04-14 12:50 975次阅读

    生物传感器:解锁生命密码的“芯片”,正在改变世界的感知方式

    当你用智能手表监测心率,用血糖仪检测健康,甚至喝下一杯经过微生物检测的牛奶时,或许不曾想到,这些日常场景背后都藏着同一项前沿技术——生物传感器。这个将生物学与电子技术融合的“魔法工具”,正在
    的头像 发表于 03-26 18:19 1010次阅读

    HMC342低噪声放大器芯片技术手册

    HMC342芯片是一款GaAs MMIC低噪声放大器(LNA),工作频率范围为13至25 GHz。 由于尺寸较小(2.14 mm²),该芯片可轻松集成到多芯片模块(MCM)中。 该
    的头像 发表于 03-20 09:15 799次阅读
    HMC342低噪声放大器<b class='flag-5'>芯片</b>技术手册

    AI在芯片上的应用:革新设计与功能

    AI在芯片上的应用正在深刻改变芯片设计、制造和应用的全过程。未来,随着AI技术的不断进步和应用场景的不断拓展,AI芯片将成为推动科技发展的
    的头像 发表于 02-17 16:09 1258次阅读

    慧荣正在开发4nm PCIe 6.0 SSD主控芯片

    慧荣科技正在积极开发采用4nm先进制程的PCIe 6.0固态硬盘主控芯片SM8466。根据慧荣的命名规律,其PCIe 4.0和5.0企业级SSD主控分别名为SM8266和SM8366,因此可以推测,SM8466也将是一款面向企业级市场的高端产品。
    的头像 发表于 01-22 15:48 1051次阅读

    TLV5638输出电压在输入改变时钳在某一数值保持不变是什么原因?

    这块DA芯片是学长一年前申请的,我们了编程一套AD/DA程序可以运行,刚开始运行程序有时输出正确结果,有时输出电压只有0.01伏,然后我们改变输入的电压,有的时候DA芯片正常改变为对
    发表于 01-14 06:21

    EE-70:ADSP-2106x SPORT DTx引脚:不同SHARC之间是否存在潜在的MCM数据争用

    电子发烧友网站提供《EE-70:ADSP-2106x SPORT DTx引脚:不同SHARC之间是否存在潜在的MCM数据争用.pdf》资料免费下载
    发表于 01-03 15:11 0次下载
    EE-70:ADSP-2106x SPORT DTx引脚:不同SHARC之间是否存在潜在的<b class='flag-5'>MCM</b>数据争用

    Chiplet或改变半导体设计和制造

    在快速发展的半导体领域,小芯片技术正在成为一种开创性的方法,解决传统单片系统级芯片(SoC)设计面临的许多挑战。随着摩尔定律的放缓,半导体行业正在寻求创新的解决方案,以提高性能和功能,
    的头像 发表于 12-05 10:03 935次阅读
    Chiplet或<b class='flag-5'>改变</b>半导体设计和制造