IBM 新款高能效 AI 芯片：能效比高过 NVIDIA A100-电子发烧友网

2 月 18 日报道，本届集成电路设计领域顶会 “国际固态电路会议（ISSCC 2021）”正在进行中（2021 年 2 月 13 日到 22 日）。作为已有近 70 年历史的集成电路产学届盛会，ISSCC 2021 亦被许多厂商视为发布其领先芯片技术的权威舞台。

本届会议上，IBM 发表了据称是 “全球首款”的高能效 AI 芯片，该芯片采用 7nm 制程工艺，可达到 80% 以上的训练利用率和 60% 以上的推理利用率，而通常情况下，GPU 的利用率在 30% 以下。

性能参数方面，IBM 新品的运算密度高于同样采用 7nm 工艺的 NVIDIA A100 GPU；其在多种精度下的整数运算性能，还优于联发科 7nm 专用 AI 芯片等产品。

据 IBM 官网分享，其新款 7nm 高能效 AI 芯片该款芯片在多种场景中均有较好的应用前景，比如，可用于混合云环境中的低能耗 AI 训练、或用于实现更接近边缘的云端训练等。

一、IBM 新款高能效 AI 芯片：能效比高过 NVIDIA A100

对比结果显示，IBM 新款 7nm 高能效 AI 芯片的性能和能效，不同程度地超越了 IBM 此前推出的 14nm 芯片、韩国科学院（KAIST）推出的 65nm 芯片、阿里巴巴旗下芯片公司平头哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、联发科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下，IBM 新款高能效 AI 芯片的每秒浮点运算次数，分别达到 16TFLOPS 和 25.6TFLOPS；运算密度分别为 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2；能效比分别为 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下，IBM 新款高能效 AI 芯片的运算密度分别为 3.27TOPS/mm^2 和 5.22TOPS/mm^2；能效比分别为 16.5TOPS/W 和 8.9TOPS/W。

对比之下，IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮点运算次数，分别为 2TFLOPS 和 3TFLOPS；在在 fp32 精度下的能效比为 1.4TFLOPS/W。

另外，在 7nm 芯片阵营中，NVIDIA A100 GPU 在 fp16 精度下的能效比为 0.78TFLOPS/W，在 int4 精度下的能效比为 3.12TOPS/W，均低于 IBM 新款高能效 AI 芯片。

▲ IBM 新款高能效 AI 芯片与同类产品的性能参数对比

二、采用 IBM 自研超低精度训练 / 推理设计

IBM 官网文章写道，其新款 AI 芯片之所以能够兼顾能效和性能，是因为该芯片支持超低精度混合 8 位浮点格式（（HFP8，hybrid FP8）。这是 IBM 于 2019 年发布的一种高度优化设计，允许 AI 芯片在低精度下完成训练任务和不同 AI 模型的推理任务，同时避免任何质量损失。

据悉，目前 IBM 将超低精度混合 8 位浮点格式用于训练、超低精度混合 4 位浮点格式用于推理，并开发了数据通信协议，以提升多核心 AI 芯片上不同核心间的数据交换效率。

据 IBM 官网文章，自 2015 年起，该公司每年将芯片的功耗性能提升 2.5 倍。这背后，IBM 致力于实现算法、架构、软件堆栈等各方面的创新。

▲ IBM 在低精度 AI 训练、推理方面的研究历程

除了采用超低精度混合 8 位浮点格式外，IBM 新款高能效 AI 芯片添加了电源管理功能。IBM 研究显示，在同等功率的情况下，通过减缓计算阶段的功率消耗，可以最大限度地提升芯片性能。

结语：AI 发展对芯片能耗提出更高要求

随着智能化浪潮席卷各个领域，AI 模型的复杂性日趋提高。相应地，AI 应用的能源消耗水平亦水涨船高。这一背景下，如何最大限度提升能效，成为 AI 芯片设计玩家们面临的重要命题。

IBM 通过采用超低精度混合 8 位浮点格式和内置电源管理功能，为其新款 AI 芯片实现了业界领先的高能效。但是，这一芯片尚未实现规模化量产，仍有待市场检验。

责任编辑：PSY

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
447

文章
47788

浏览量
409118
IBM

IBM

+关注

关注
3

文章
1671

浏览量
74272
NVIDIA

NVIDIA

+关注

关注
14

文章
4592

浏览量
101713
AI

AI

+关注

关注
87

文章
26443

浏览量
264044

阿里云暂停A100服务器出租，AI算力奇缺！国产AI芯片任重道远

电子发烧友网报道（文/李弯弯）上个月，美国发布更新针对AI芯片的出口管制规定，新措施意在填补去年10月发布法规中的漏洞。这样意味着，除了英伟达A100/H100之外，其针对中国市场推出

发表于 11-09 09:08 •3106次阅读

解读六大科技巨头自研AI芯片进展，谁将领跑未来？

在当前的AI发展浪潮中，NVIDIA无疑是AI算力的领跑者。其A100/H100系列芯片已获得全

发表于 02-22 10:35 •159次阅读

解读六大科技巨头自研<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>进展，谁将领跑未来？

对英伟达A100芯片算力服务收费价格上调100%，这家企业的硬气来自哪里？

半导体芯情了解到，A100是英伟达最新推出的一款高性能计算芯片，采用了全新的Ampere架构，Ampere架构是NVIDIA于 GTC 2020发布的GPU架构，NVIDIA Ampe

发表于 11-14 16:30 •650次阅读

对英伟达<b class='flag-5'>A100</b><b class='flag-5'>芯片</b>算力服务收费价格上调<b class='flag-5'>100</b>%，这家企业的硬气来自哪里？

升腾910和英伟达A100的区别

升腾910和英伟达A100的区别升腾910和英伟达A100代表着两个不同的领域，这两种芯片是为不同的目的设计的。升腾910是华为公司开发的一种AI

发表于 08-31 17:06 •4.5w次阅读

昇腾芯片和a100芯片的区别

昇腾芯片和a100芯片的区别随着现代社会的发展和技术的不断进步，计算机技术也在不断地进化和创新。随着大数据、人工智能等技术的快速发展，高性能计算机已经成为了当今技术领域所必需的东西。而高性能计算机

发表于 08-31 09:01 •6520次阅读

英伟达a100和h100哪个强?英伟达A100和H100的区别

英伟达a100和h100哪个强? 就A100和H100这两个产品来说，它们虽然都是英伟达公司的高性能计算产品，但是面向的市场和应用场景不同，所以不能简单地说哪个更强。

发表于 08-09 17:31 •3.6w次阅读

英伟达h800和a100的区别

英伟达h800和a100的区别 NVIDIA H800和A100是NVIDIA的两种不同类型的GPU，具有不同的架构和特点。以下是它们之间的区别： 1. 架构：H800使用

发表于 08-08 16:05 •1.4w次阅读

英伟达h800和a100参数对比

英伟达h800和a100参数对比 NVIDIA H800和A100是两款高端的GPU产品，下面是它们的参数对比： 1.架构： H800采用的是Volta架构，而A100则是

发表于 08-08 15:53 •2.5w次阅读

英伟达a100有国产替代吗？

英伟达a100有国产替代吗？目前尚未出现明确可替代英伟达A100的国产产品，但中国国内的企业正在积极推进相关领域的研发和生产。例如，中国科技巨头华为正在开发自主研发的AI芯片，其已发

发表于 08-08 15:37 •3689次阅读

英伟达A100的优势分析

HBM2显存。英伟达A100是一款高性能的GPU，其主要优势如下： 1. 支持高效的AI计算：A100采用了新一代的Tensor Core技术，能够在AI计算方面提供卓越的性能，为

发表于 08-08 15:25 •2660次阅读

英伟达A100的简介

达A100是英伟达公司推出的一款面向高性能计算（HPC）和人工智能（AI）的加速计算卡。它采用了全球首个基于7nm工艺的数据中心GPU架构Ampere，拥有6912个CUDA核心和432个张量核心

发表于 08-08 15:17 •7608次阅读

英伟达A100是什么系列？

英伟达A100是什么系列？全球都在关注生成式人工智能；特别是OpenAI发布ChatGPT以来，生成式人工智能技术一下就被拔高。在大模型训练中，A100是非常强大的GPU。英伟达的AI芯片

发表于 08-08 15:13 •2230次阅读

英伟达A100和V100参数对比

英伟达A100这个AI芯片怎么样？英伟达A100是一款基于英伟达Ampere架构的高性能计算卡，主要面向数据中心和高性能计算领域。其拥有高达6912个CUDA核心和432个Turing

发表于 08-08 11:54 •9306次阅读

英伟达a100和a800的区别

的浮点性能为19.5 TFLOPS，而A800为10.6 TFLOPS。 3. 存储容量不同：A100的显存最大为80 GB，而A800为48 GB。 4. AI加速器不同：A100配备Tensor

发表于 08-07 17:57 •3.2w次阅读

英伟达a100和h100哪个强？

英伟达a100和h100哪个强？英伟达A100比H100更强。英伟达A100在处理大型模型和数据集时可能比V

发表于 08-07 17:32 •1.1w次阅读

搜索历史

IBM 新款高能效 AI 芯片：能效比高过 NVIDIA A100

评论

阿里云暂停A100服务器出租，AI算力奇缺！国产AI芯片任重道远

解读六大科技巨头自研AI芯片进展，谁将领跑未来？

对英伟达A100芯片算力服务收费价格上调100%，这家企业的硬气来自哪里？

升腾910和英伟达A100的区别

昇腾芯片和a100芯片的区别

英伟达a100和h100哪个强?英伟达A100和H100的区别

英伟达h800和a100的区别

英伟达h800和a100参数对比

英伟达a100有国产替代吗？

英伟达A100的优势分析

英伟达A100的简介

英伟达A100是什么系列？

英伟达A100和V100参数对比

英伟达a100和a800的区别

英伟达a100和h100哪个强？