0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何实现1万亿晶体管GPU - 半导体的进步推动人工智能蓬勃发展

半导体芯科技SiSC 来源:半导体芯科技SiSC 作者:半导体芯科技SiS 2024-04-03 17:02 次阅读

来源:半导体芯科技编译

Mark Liu 是台湾积体电路制造股份有限公司董事长。

Philip Wong 是斯坦福大学工程学院教授兼台积电首席科学家。

TSMC

1997 年,IBM "深蓝 "超级计算机击败了国际象棋世界冠军加里·卡斯帕罗夫。这是超级计算机技术的一次开创性展示,也是高性能计算有朝一日可能超越人类智能的初露端倪。在随后的 10 年中,我们开始将人工智能用于许多实际任务,如面部识别、语言翻译、推荐电影和商品等。

又过了十五年,人工智能已经发展到可以 "合成知识 "的地步。生成式人工智能,如 ChatGPT 和 Stable Diffusion,可以作诗、创作艺术品、诊断疾病、撰写总结报告和计算机代码,甚至可以设计与人类制造的集成电路相媲美的集成电路。

人工智能将面临巨大的机遇,成为人类所有工作的数字化助手。ChatGPT 就是一个很好的例子,它说明了人工智能如何使高性能计算的使用平民化,为社会中的每一个人带来益处。

所有这些令人惊叹的人工智能应用都归功于三个因素:高效机器学习算法的创新、可用于训练神经网络的海量数据的可用性,以及通过半导体技术的进步在高能效计算方面取得的进展。尽管生成式人工智能革命的贡献无处不在,但却没有得到应有的赞誉。

在过去的三十年里,人工智能领域的重大里程碑都得益于当时领先的半导体技术,没有这些技术是不可能实现的。“深蓝”采用 0.6 微米和 0.35 微米节点的混合芯片制造技术实现的。在 ImageNet 比赛中获胜、开启了当前机器学习时代的深度神经网络,是采用 40 纳米技术实现的。AlphaGo 采用 28 纳米技术征服了围棋比赛,而 ChatGPT 的最初版本是在采用 5 纳米技术制造的计算机上进行训练的。最新版本的 ChatGPT 由采用更先进的 4 纳米技术的服务器驱动。相关计算机系统的每一层,从软件和算法到架构、电路设计和设备技术,都是人工智能性能的倍增器。但公平地说,基础晶体管-器件技术是上述各层技术进步的基础。

如果AI革命要以目前的速度继续下去,那么半导体行业将需要更多的努力。在十年内,它将需要一个 1 万亿晶体管 GPU,也就是说,GPU 的设备数量是当今典型设备的 10 倍。

wKgZomYNGyyAfQQ2AAGqScIz9ks991.jpg

AI模型规模持续增长

在过去五年中,人工智能训练所需的计算量和内存访问量呈数量级增长。例如,训练 GPT-3 需要相当于每秒 50 亿亿次以上的运算量(即每天 5,000 petaflops )和 3 万亿字节(3 TB)的内存容量。

新的生成式人工智能应用所需的计算能力和内存访问能力都在持续快速增长。我们现在需要回答一个紧迫的问题: 半导体技术如何才能跟上步伐?

从集成器件到集成芯片

自集成电路发明以来,半导体技术一直在缩小特征尺寸,以便在拇指指甲大小的芯片中塞进更多的晶体管。如今,集成度更上一层楼;我们正在超越二维扩展,进入三维系统集成。现在,我们正在把许多芯片组装成一个紧密集成、大规模互连的系统。这是半导体技术集成的范式转变。

在AI时代,系统的能力与集成到系统中的晶体管数量成正比。其中一个主要限制因素是,光刻芯片制造工具的设计是为了制造不超过 800 平方毫米的集成电路,这就是所谓的 “光罩极限”(reticle limit)。但是,我们现在可以将集成系统的尺寸扩展到光刻的光罩极限之外。通过将多个芯片连接到更大的中介层(一块内置互连的硅片)上,我们可以集成一个包含比单个芯片上更多器件的系统。例如,台积电CoWoS技术(
chip-on-wafer-on-substrate )可容纳多达六个光罩场的计算芯片,以及十几个高带宽内存(HBM)芯片。

Nvidia 如何使用 CoWoS 先进封装技术

CoWoS是台积电的硅上芯片先进封装技术,目前已应用于产品中。。示例包括 Nvidia Ampere 和 Hopper GPU。每个都由一个 GPU 芯片和六个高带宽内存立方体组成,全部位于硅中介层上。计算GPU芯片的大小与芯片制造工具目前允许的大小差不多。Ampere 有 540 亿个晶体管,Hopper 有 800 亿个。从 7 纳米技术到更密集的 4 纳米技术的转变使得在基本相同的面积上封装 50% 以上的晶体管成为可能。Ampere 和 Hopper 是当今大型语言模型 (LLM) 训练的主力军。训练 ChatGPT 需要数以万计的此类处理器

HBM 是另一个对 AI 日益重要的关键半导体技术的实例:通过将芯片堆叠在一起来集成系统的能力,我们台积电称之为系统级集成芯片 (SoIC
system-on-integrated-chips )。HBM 由控制逻辑 IC 顶部的一组垂直互连的 DRAM 芯片组成。它使用称为硅通孔 (TSV) 的垂直互连来获取信号,并通过每个芯片和焊料凸点来形成存储芯片之间的连接。如今,高性能 GPU 广泛使用 HBMm。

展望未来,3D SoIC 技术可以为当今的传统 HBM 技术提供“无凸通替代方案”(bumpless alternative),在堆叠芯片之间提供更密集的垂直互连。最近的进展表明,HBM 测试结构具有 12 层芯片堆叠,使用混合键合,这种铜对铜的连接密度比焊接凸点更高。该存储器系统在较大的基础逻辑芯片上低温键合,总厚度仅为 600 μm。

高性能计算系统由大量运行大型人工智能模型的芯片组成,高速有线通信可能会迅速限制计算速度。如今,光互连已被用于连接数据中心的服务器机架。不久的将来,我们将需要基于硅光子技术的光接口,与 GPU 和 CPU 封装在一起。这样就能为 GPU 与 GPU 之间的直接光通信提供更高的能效和面积效率带宽,从而使数百台服务器能够像拥有统一内存的单个巨型 GPU 一样运行。由于人工智能应用的需求,硅光子技术将成为半导体行业最重要的使能技术之一。

迈向万亿晶体管 GPU

AMD 如何使用 3D 技术

AMD MI300A 加速处理器单元不仅利用了 CoWoS,还利用了台积电的 3D 技术——SoIC。MI300A 结合了 GPU 和 CPU 内核,旨在处理最大的AI工作负载。GPU 执行AI的密集矩阵乘法运算,而 CPU 则控制整个系统的运行,高带宽内存 (HBM) 则统一为两者服务。9 个采用 5 纳米技术制造的计算芯片堆叠在 4 个采用 6 纳米技术制造的基础芯片之上,这些芯片专门用于缓存和 I/O 流量。基础芯片和 HBM 再硅中介层之上。处理器的计算部分由 1500 亿个晶体管组成。

如前所述,用于人工智能训练的典型 GPU 芯片已经达到了光罩极限 (reticle field limit)。它们的晶体管数量约为 1000 亿个。晶体管数量继续增加的趋势将需要多个芯片,通过 2.5D 或 3D 集成相互连接来执行计算。通过 CoWoS 或 SoIC 以及相关的先进封装技术将多个芯片集成在一起,可使每个系统的晶体管总数大大超过单个芯片的晶体管总数。我们预测,十年内多芯片 GPU 的晶体管数量将超过 1 万亿个。

我们需要在3D堆栈中将所有这些芯片连接在一起,但幸运的是,业界已经能够迅速缩小垂直互连的间距,提高连接密度。而且还有足够的空间容纳更多。我们认为互连密度没有理由不能增长一个数量级,甚至更高。

wKgaomYNGy2AeVWeAAGoWTgCtqk996.jpg

GPU 的高能效性能趋势

那么,所有这些创新硬件技术是如何提升系统性能的呢?

如果我们看看能效性能指标(EEP:energy-efficient performance)的稳步提升,就能发现服务器 GPU 的发展趋势。EEP是对系统能效和速度的综合衡量。在过去的 15 年中,半导体行业每两年就能将能效性能提高约三倍。我们相信,这一趋势将以历史性的速度持续下去。推动这一趋势的将是多方面的创新,包括新材料、器件和集成技术、极紫外线(EUV)光刻技术、电路设计、系统架构设计以及所有这些技术要素的共同优化等等。

wKgZomYNGy2ACrhUAAIqxSU01CU775.jpg

特别是,我们在此讨论的先进封装技术将有助于提高 EEP。此外,系统技术协同优化(STCO: system-technology co-optimization)等概念也将变得越来越重要,在STCO 中,GPU 的不同功能部分被分离到各自的芯片上,并使用性能最好、最经济的技术来构建每个部分。

3D集成电路的Mead-Conway时刻

1978 年,加州理工学院教授 Carver Mead 和施乐 PARC的 Lynn Conway 发明了一种集成电路计算机辅助设计方法。他们使用一套设计规则来描述芯片的缩放比例,这样工程师们就可以轻松地设计超大规模集成电路(VLSI),而无需太多的工艺技术知识。

3D芯片设计也需要这种能力。如今,设计人员需要了解芯片设计、系统架构设计以及硬件和软件优化。制造商需要了解芯片技术、3D IC技术和先进的封装技术。正如我们在 1978 年所做的那样,我们再次需要一种通用语言,以电子设计工具能够理解的方式来描述这些技术。这种硬件描述语言可以让设计人员自由地进行 3D 集成电路系统设计,而无需考虑底层技术。它即将问世: 一种名为 3Dblox 的开源标准已被当今大多数技术公司和电子设计自动化 (EDA) 公司所采用。

隧道之外的未来

在人工智能时代,半导体技术是实现新的人工智能能力和应用的关键因素。新型 GPU 不再受限于过去的标准尺寸和外形尺寸。新的半导体技术也不再局限于在二维平面上缩小下一代晶体管的尺寸。一个集成的人工智能系统可以由尽可能多的高能效晶体管、适用于专业计算工作负载的高效系统架构以及优化的软硬件关系组成。

在过去的 50 年里,半导体技术的发展就像在隧道里行走。前方的道路是清晰的,因为有一条明确的道路。每个人都知道需要做什么:缩小晶体管。

现在,我们已经走到了隧道的尽头。从这里开始,半导体技术将越来越难发展。然而,在隧道之外,还有更多的可能性。我们不再受过去的束缚。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体
    +关注

    关注

    328

    文章

    24548

    浏览量

    202251
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4426

    浏览量

    126740
  • 晶体管
    +关注

    关注

    77

    文章

    9059

    浏览量

    135247
  • AI
    AI
    +关注

    关注

    87

    文章

    26485

    浏览量

    264109
  • 人工智能
    +关注

    关注

    1776

    文章

    43920

    浏览量

    230650
收藏 人收藏

    评论

    相关推荐

    晶体管掺杂和导电离子问题原因分析

    ? 再者在场效应这种单极性导电半导体中,为什么只是有一种离子导电,而非两种离子,不像晶体管那种两种离子导电,请问这是为什么?同样对于场效应也有上面的问题?
    发表于 02-21 21:39

    中国电信推动人工智能全面应用

    人工智能作为新质生产力的一环,将带来全要素生产率的提高,同时,加速实现显著的效率变革和动力变革,并推动企业高质量发展
    的头像 发表于 01-29 14:12 344次阅读

    单结晶体管的工作原理是什么?

    常用的半导体元件还有利用一个PN结构成的具有负阻特性的器件一单结晶体管,请问这个单结晶体管是什么?能够实现负阻特性?
    发表于 01-21 13:25

    推动人工智能安全发展

    近年来,国家高度重视人工智能安全发展,逐步完善相关政策法规。国务院印发《新一代人工智能发展规划》提出面向2030年我国新一代人工智能
    的头像 发表于 01-04 16:32 779次阅读

    陈海波:OpenHarmony技术领先,产学研深度协同,生态蓬勃发展

    蓬勃发展。OpenHarmony已经成为发展速度最快的智能终端操作系统开源社区之一,来自51家共建单位的超过6200名开发者参与了社区贡献,代码累计超过1亿行,并且已经有超过425款软
    发表于 11-06 14:35

    墨芯加入中电云人工智能创新应用产业联盟共促AI蓬勃发展

    近日,墨芯加入中国电子云人工智能创新应用产业联盟,为我国人工智能产业的发展和创新注入新的活力。
    的头像 发表于 10-09 15:21 522次阅读

    人工智能热潮推动光芯片与光器件需求飙升

    随着人工智能技术的迅猛发展,光芯片和光器件作为关键的基础技术,在这一浪潮下迎来了前所未有的需求增长。光芯片和光器件的高速率、高带宽、低能耗等优势,使其在人工智能应用中发挥着重要作用,正日益成为
    的头像 发表于 09-25 17:19 286次阅读
    <b class='flag-5'>人工智能</b>热潮<b class='flag-5'>推动</b>光芯片与光器件需求飙升

    SAP Americas为蓬勃发展的托管服务业务提升SAN容量

    电子发烧友网站提供《SAP Americas为蓬勃发展的托管服务业务提升SAN容量.pdf》资料免费下载
    发表于 08-29 11:21 0次下载
    SAP Americas为<b class='flag-5'>蓬勃发展</b>的托管服务业务提升SAN容量

    积极拥抱智能时代,推动人工智能产业发展,拓展人工智能想象空间

    积极拥抱智能时代,推动人工智能产业发展,拓展人工智能想象空间
    的头像 发表于 07-11 09:41 372次阅读

    WAIC 2023:英特尔以技术之力推动边缘人工智能发展,打造数字化未来“芯”时代

    产品创新”的主题演讲。 张宇博士详细介绍了英特尔面向边缘计算领域的人工智能(AI)产品创新,并讲述了英特尔如何通过先进的软硬件产品组合和解决方案助力行业和企业加速人工智能的开发和落地应用,以进一步推动人工智能
    的头像 发表于 07-08 14:15 285次阅读
    WAIC 2023:英特尔以技术之力<b class='flag-5'>推动</b>边缘<b class='flag-5'>人工智能</b><b class='flag-5'>发展</b>,打造数字化未来“芯”时代

    物联网市场蓬勃发展,泰科电子TE Connectivity助力端到端应用解决方案

    如今的全球物联网市场正蓬勃发展,行业的渗透率越来越广。
    的头像 发表于 06-05 17:49 1534次阅读
    物联网市场<b class='flag-5'>蓬勃发展</b>,泰科电子TE Connectivity助力端到端应用解决方案

    深圳出台方案推动人工智能发展应用

    《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》在加强智能计算集群供应、提高核心技术和产品创新能力、提高产业集成水平、构建全地区、全时间场应用、加强数据和人才要素供应
    的头像 发表于 06-05 11:51 951次阅读

    人工智能大模型蓬勃发展

    中国科学技术信息研究所所长、科学技术部新一代人工智能发展研究中心主任赵志耘发布这种报告时表示:“目前在中国建立理论模型方面已经猛烈方法和软硬件技术能力,紧跟世界前沿形成大模型技术,排放具有行业影响力的事前训练大模式。
    的头像 发表于 06-01 11:12 867次阅读

    《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》发布

    《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》发布 日前,中共深圳市委办公厅、深圳市人民政府办公厅印发《深圳市加快推动人工智能高质量发展高水平应用行动方
    的头像 发表于 05-31 18:54 1523次阅读

    物流行业蓬勃发展,重载AGV亟待发力

    随着物流行业的蓬勃发展,AGV作为一种自动化搬运设备,已经成为不可或缺的物流解决方案。特别是随着人工智能、云计算等技术的快速发展,AGV也在不断更新升级。不仅提高了物流效率,还降低了成本,实现
    的头像 发表于 05-18 09:44 570次阅读
    物流行业<b class='flag-5'>蓬勃发展</b>,重载AGV亟待发力