0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

20exaflops算力只有鞋盒大小,靠CMOS技术就能实现的超导处理器

E4Life 来源:电子发烧友 作者:周凯扬 2024-05-29 01:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着摩尔定律失效,高性能计算芯片的规模进一步扩大,数据中心集群庞大的功耗已经成为我们不得不面临的问题。早在2015年SIA的预测中,到2040年全球计算资源的能源供给就不再具有可持续性,而如今随着人工智能的爆发,计算资源的需求更是猛涨。

以用于训练AI大模型的计算资源为例,每六个月翻倍的速度已经远超高性能计算集群的组建速度。无需等到2040年,到了2030年训练单个大模型所需的资源就将超过TOP500所有超算的算力总和,而所需要的电力供应也将达到国家级。解决能源可持续的问题已经避无可避了,但除非我们放缓发展速度,或是颠覆计算方式,是很难实现这一目标的。

对于应用层还没进入商业模式成熟和完全盈利的人工智能来说,放缓发展速度自然是不可取的。那么也就只剩下颠覆计算方式一途,而大幅降低能耗的超导计算,也就理所当然地成了多数研究的重点方向。

显著降低功耗,最大开销成为冷却

2020年,日本国立横滨大学的一个研究小组就展示了一个超导CPU,并成功实现了流片。该处理器主要采用约瑟夫森结架构打造,这是一种经典的超导三层器件架构,也是超导逻辑单元中取代晶体管的基础元件。因为其独特的物理特性,该器件工作时的开关功耗只有10-21J左右,这样一来动态功耗相比传统CMOS器件极大降低,加之超导体无电阻的特性,静态功耗无限趋近于零。

超导体的出现为降低功耗提供了最大的可能性,因为其在通过电流时并不会消耗能量。最大的能耗开支莫过于需要在低温下工作的冷却方案供电,比如超导芯片的处理单元,往往需要低至4K的冷却温度。但即便如此,几乎零电阻的互联、基于超短脉冲构建的数字逻辑,都为现代计算资源大规模扩展提供了足够的优势。

而且随着计算资源规模的扩大,冷却方案开销的边际成本也会越小,据imec研究表明,一旦达到数十petaflops,超导计算机相比传统的计算机就要节能了,而这样的算力要求,TOP500中排名前30的超算已经可以做到了。

而Imec近期发布了他们采用标准CMOS工艺制造的超导计算单元,基于该技术打造的处理器能效将是当下最高效芯片的100倍,甚至可以将一个数据中心级别的计算资源塞进鞋盒大小的系统中。

将超导带出实验室的方法——兼容现有的CMOS制造技术

尽管超导可以降低功耗提高计算密度,但对于目前的大部分研究来说,都只停留在实验室阶段,要想真正实现大规模量产无异于痴人说梦。比如上文提到的横滨国立大学超导CPU,就是基于超导铌实现的,这种材料在可预测的实验室环境中表现良好,但要想用于制造工艺中就存在不少难题了。

铌对传统半导体加工温度及其周围材料都很敏感,一加热就会失去超导能力,因此与标准CMOS工艺流程不兼容。为此,imec改用了氮化铌钛作为基础超导材料。氮化铌钛可以承受CMOS制造工艺所用的温度,而且与周围层的反应较少。

同时imec还为约瑟夫森结的势垒层选择了一个新材料,无定形硅。传统的约瑟夫森结势垒层材料,比如氧化铝等,可以在可控的条件下生长,但为了达到远高于CMOS工艺芯片的密度,就必须进一步压缩其厚度,可这么薄的氧化物已经到了无法制造的程度。无定形硅的出现,则允许使用更厚的势垒层,实现210nm这样的临界尺寸。

在电路层面,同样需要对逻辑和存储结构重新设计。Imec设计出了一种全新的逻辑架构,名为脉冲守恒逻辑,输入和输出的数量保持一致,且SFQ(单通量量子)的总数保持守恒。通过不同约瑟夫森结和电容的组合将SFQ引导至不同输出,从而产生我们常见的逻辑OR和AND。在Imec的设计中,SRAM也是基于约瑟夫森结重新设计的,不过DRAM还是采用传统的硅工艺,但也需要从室温降低至77K的低温环境,用于提高效率。

鞋盒大小的数据中心,也需要3D堆叠实现

在基于CMOS工艺打造的数字芯片上,随着缩小晶体管变得越来越困难,我们已经开始广泛利用3D堆叠技术提高性能。但由于芯片内部的超大功率和热量,堆叠方案已经逐渐面临更大的挑战,如何做好散热成了多数3D堆叠方案必须解决的首要问题。

对于基于超导体的芯片设计而言,同样可以借助3D堆叠来实现更高的密度。结合硅中介层和玻璃基板这样的先进封装技术,将超导处理单元与嵌入式超导SRAM和DRAM堆叠在一起。芯片的大部分都将浸没在液氮中,冷却至4K。

在imec的模拟中,他们将100块超导体芯片板打造堆叠在一起,中间只留出极小的空间,整个系统的体积大小只有20x20x12厘米,与一个鞋盒大小近似。但正是这样一个鞋盒大小的系统,总功耗只有500kW,却可以提供将近20exaflops(BF16)的算力。

而这仅仅是Imec路线图中第一套方案,在后续的产品中,会进一步缩小约瑟夫森结和互联的尺寸。未来通过进一步提高逻辑芯片的密度,芯片板的数量也会随之减少,这样提高性能的同时,也会降低工艺复杂性和成本。

写在最后

尽管超导计算让我们看到了可行的技术路线,但即便是imec也不认为超导数据技术会取代传统的CMOS计算,而只是作为部分特定应用补充。这一技术的主要应用场景还是在大型的数据中心,为人工智能和机器学习处理提供基于云端的训练推理等,因为只有这样的环境内才能有条件实现超导所需的冷却技术。在消费电子领域,传统的CMOS硅工艺依然不可取代。

值得一提的是,这一技术与Imec基于CMOS制造工艺的超导量子比特技术同样可以做到无缝集成,可以说是电子计算与量子计算的完美结合。但即便搞定了基础材料工程设计,以及架构的设计,还有电路开发设计这一环目前没有打通,需要EDA厂商为其开发特定的流程工具。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247121
  • CMOS
    +关注

    关注

    58

    文章

    6186

    浏览量

    241578
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16564
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    AI安防选什么主板?杰和IB3-761精准+多接口”出圈

    杰和科技推出AI力主板IB3-761 ,基于瑞芯微RK3568四核64位处理器开发,以精准、灵活兼容等特点解决轻量边缘场景痛点,已在智能安防、边缘计算等领域成功应用,帮助安防设备
    的头像 发表于 09-22 17:23 2395次阅读
    AI安防选什么主板?杰和IB3-761<b class='flag-5'>靠</b>“<b class='flag-5'>算</b><b class='flag-5'>力</b>精准+多接口”出圈

    AI安防选什么主板?杰和IB3-761精准+多接口”出圈

    任务。杰和科技AI轻力主板方案杰和科技推出AI力主板IB3-761,基于瑞芯微RK3568四核64位处理器开发,以精准、灵活兼容等特
    的头像 发表于 09-22 16:45 21次阅读
    AI安防选什么主板?杰和IB3-761<b class='flag-5'>靠</b>“<b class='flag-5'>算</b><b class='flag-5'>力</b>精准+多接口”出圈

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的AI
    的头像 发表于 09-19 15:26 1147次阅读
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的AI
    的头像 发表于 09-19 15:25 429次阅读
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    工业怎么选?ZMC6000系列I3/I5/I7处理器,精准匹配不同工业场景需求!

    工控机的“”是工业自动化的关键。致远电子ZMC6000系列工业PC,配备英特尔I3、I5、I7处理器,满足不同场景的需求。本文将介绍
    的头像 发表于 09-18 11:38 622次阅读
    工业<b class='flag-5'>算</b><b class='flag-5'>力</b>怎么选?ZMC6000系列I3/I5/I7<b class='flag-5'>处理器</b>,精准匹配不同工业场景需求!

    揭秘瑞芯微处理器,RK3576/RK3588强大搭档

    瑞芯微处理器-Gongga1(简称“贡嘎”),是瑞芯微针对旗舰芯片平台RK3576/RK3588等SoC平台配套的
    的头像 发表于 07-17 10:00 832次阅读
    揭秘瑞芯微<b class='flag-5'>算</b><b class='flag-5'>力</b>协<b class='flag-5'>处理器</b>,RK3576/RK3588强大<b class='flag-5'>算</b><b class='flag-5'>力</b>搭档

    云XR(AR/VR)底座关键特征与技术路径

    云XR(AR/VR)底座是支撑扩展现实技术规模化落地的核心基础设施,当前发展呈现以下关键特征与技术路径: 一、
    的头像 发表于 06-19 08:10 485次阅读
    云XR(AR/VR)<b class='flag-5'>算</b><b class='flag-5'>力</b>底座关键特征与<b class='flag-5'>技术</b>路径

    性能飞跃 慧视8核+32T平台让目标检测帧率提升20

    RK3588和大卡开发而成的一款低功耗大AI处理平台。它带有双2.5G网口,采用瑞芯微RK3588作为主控
    的头像 发表于 06-10 17:55 1003次阅读
    性能飞跃 慧视8核+32T<b class='flag-5'>算</b><b class='flag-5'>力</b>平台让目标检测帧率提升<b class='flag-5'>20</b>倍

    6TOPSNPU加持!RK3588如何重塑8K显示的边缘计算新边界

    与复杂运算。明远智睿推出的RK3588芯片,以6TOPS的NPU为核心,为这一难题提供了突破性的解决方案。 从硬件架构来看,RK3588的NPU采用了先进的神经网络处理器设计,支持多种主流深度学习
    发表于 04-18 15:32

    爆款推荐 | 迅为RK3568开发板4核处理器+1TNPU+好用到爆的配套资料和视频!

    爆款推荐 | 迅为RK3568开发板4核处理器+1TNPU+好用到爆的配套资料和视频!
    的头像 发表于 03-19 13:41 1190次阅读
    爆款推荐 | 迅为RK3568开发板4核<b class='flag-5'>处理器</b>+1T<b class='flag-5'>算</b><b class='flag-5'>力</b>NPU+好用到爆的配套资料和视频!

    (原创)昇腾310B(8T/20T)力主板定制方案

    昇腾310B(20T)力主板规格书 1.功能、性能与接口a)昇腾310B 20T处理器
    发表于 03-16 21:43

    【一文看懂】什么是端侧

    随着物联网(IoT)、人工智能和5G技术的快速发展,端侧正逐渐成为智能设备性能提升和智能化应用实现的关键技术。什么是端侧
    的头像 发表于 02-24 12:02 2956次阅读
    【一文看懂】什么是端侧<b class='flag-5'>算</b><b class='flag-5'>力</b>?

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4200次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?