0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

工程师邓生 来源:芯东西 作者:温淑 2021-02-19 11:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2 月 18 日报道,本届集成电路设计领域顶会 “国际固态电路会议(ISSCC 2021)”正在进行中(2021 年 2 月 13 日到 22 日)。作为已有近 70 年历史的集成电路产学届盛会,ISSCC 2021 亦被许多厂商视为发布其领先芯片技术的权威舞台。

本届会议上,IBM 发表了据称是 “全球首款”的高能效 AI 芯片,该芯片采用 7nm 制程工艺,可达到 80% 以上的训练利用率和 60% 以上的推理利用率,而通常情况下,GPU 的利用率在 30% 以下。

性能参数方面,IBM 新品的运算密度高于同样采用 7nm 工艺的 NVIDIA A100 GPU;其在多种精度下的整数运算性能,还优于联发科 7nm 专用 AI 芯片等产品。

据 IBM 官网分享,其新款 7nm 高能效 AI 芯片该款芯片在多种场景中均有较好的应用前景,比如,可用于混合云环境中的低能耗 AI 训练、或用于实现更接近边缘的云端训练等。

一、IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

对比结果显示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韩国科学院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平头哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、联发科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮点运算次数,分别达到 16TFLOPS 和 25.6TFLOPS;运算密度分别为 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分别为 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的运算密度分别为 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分别为 16.5TOPS/W 和 8.9TOPS/W。

对比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮点运算次数,分别为 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比为 1.4TFLOPS/W。

另外,在 7nm 芯片阵营中,NVIDIA A100 GPU 在 fp16 精度下的能效比为 0.78TFLOPS/W,在 int4 精度下的能效比为 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片与同类产品的性能参数对比

二、采用 IBM 自研超低精度训练 / 推理设计

IBM 官网文章写道,其新款 AI 芯片之所以能够兼顾能效和性能,是因为该芯片支持超低精度混合 8 位浮点格式((HFP8,hybrid FP8)。这是 IBM 于 2019 年发布的一种高度优化设计,允许 AI 芯片在低精度下完成训练任务和不同 AI 模型的推理任务,同时避免任何质量损失。

据悉,目前 IBM 将超低精度混合 8 位浮点格式用于训练、超低精度混合 4 位浮点格式用于推理,并开发了数据通信协议,以提升多核心 AI 芯片上不同核心间的数据交换效率。

据 IBM 官网文章,自 2015 年起,该公司每年将芯片的功耗性能提升 2.5 倍。这背后,IBM 致力于实现算法、架构、软件堆栈等各方面的创新。

▲ IBM 在低精度 AI 训练、推理方面的研究历程

除了采用超低精度混合 8 位浮点格式外,IBM 新款高能效 AI 芯片添加了电源管理功能。IBM 研究显示,在同等功率的情况下,通过减缓计算阶段的功率消耗,可以最大限度地提升芯片性能。

结语:AI 发展对芯片能耗提出更高要求

随着智能化浪潮席卷各个领域,AI 模型的复杂性日趋提高。相应地,AI 应用的能源消耗水平亦水涨船高。这一背景下,如何最大限度提升能效,成为 AI 芯片设计玩家们面临的重要命题。

IBM 通过采用超低精度混合 8 位浮点格式和内置电源管理功能,为其新款 AI 芯片实现了业界领先的高能效。但是,这一芯片尚未实现规模化量产,仍有待市场检验。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53608

    浏览量

    459968
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1855

    浏览量

    76799
  • NVIDIA
    +关注

    关注

    14

    文章

    5513

    浏览量

    109173
  • AI
    AI
    +关注

    关注

    90

    文章

    38346

    浏览量

    297465
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    专为边缘而生:深度解析昆仑芯K100 AI加速卡,释放128 TOPS极致

    昆仑芯K100边缘AI加速卡以75W超低功耗实现128 TOPS的INT8算力,重新定义边缘推理标准。其半高半长设计搭载8GB HBM内存与256GB/s带宽,支持INT8至FP3
    的头像 发表于 12-14 11:12 2255次阅读
    专为边缘而生:深度解析昆仑芯K<b class='flag-5'>100</b> <b class='flag-5'>AI</b>加速卡,释放128 TOPS极致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    新手小白必看!关于A100云主机租用,你想知道的一切都在这!

    最通俗易懂的语言,为你准备了一份超详细的A100云主机租用新手指南,帮你扫清所有障碍,轻松开启AI之旅。Q1:A100云主机到底是什么?我租了得到什么?把它想象成一
    的头像 发表于 10-31 19:24 1171次阅读
    新手小白必看!关于<b class='flag-5'>A100</b>云主机租用,你想知道的一切都在这!

    NVIDIA AI技术在节能和气候中的应用

    最新研究强调了高能基础设施和 AI 模型如何推动气候、能源等领域的创新。
    的头像 发表于 10-13 11:05 667次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也
    的头像 发表于 07-28 15:07 944次阅读

    佐航BYQ3712PK变压器等级测试仪:以精准测量赋配电变压器升级

    在“双碳”目标推动下,高效节能的配电变压器已成为电力系统降本增效的关键环节。而准确判定变压器等级,是推广节能产品、淘汰低效设备的核心前提。佐航推出的BYQ3712PK变压器等级
    的头像 发表于 06-27 13:35 503次阅读
    佐航BYQ3712PK变压器<b class='flag-5'>能</b><b class='flag-5'>效</b>等级测试仪:以精准测量赋<b class='flag-5'>能</b>配电变压器<b class='flag-5'>能</b><b class='flag-5'>效</b>升级

    优化电机控制以提高能

    机器人及工厂自动化设备密布的工业环境,电机已成为不可或缺的动力核心。 与能耗 根据美国能源信息署数据,全球约50%的能源消耗来自电机系统,而在工业领域,这一比例更高达80%。以2022年美国为例
    发表于 06-11 09:57

    比和算力提升的衡量方法

    一、比的衡量方法 定义与计算公式‌ 比(EER)定义为制冷量与输入功率的比值,计算公式为:‌EER = Q / W‌(Q为制冷量,W为输入功率)。公制单位通常采用kW/W,英制
    的头像 发表于 04-28 07:47 2823次阅读
    <b class='flag-5'>能</b><b class='flag-5'>效</b>比和算力提升的衡量方法

    线性充电与开关充电:环保与的考量

    从环保和角度出发,比较线性充电和开关充电的特点。
    的头像 发表于 03-18 15:45 732次阅读
    线性充电与开关充电:环保与<b class='flag-5'>能</b><b class='flag-5'>效</b>的考量

    Arm 推出 Armv9 边缘 AI 计算平台,以超高能与先进 AI 能力赋物联网革新

    架构的超高能 CPU——Arm Cortex-A320 以及对 Transformer 网络具有原生支持的 Ethos-U85 AI 加速器为核心的边缘
    的头像 发表于 03-06 11:43 1796次阅读
    Arm 推出 Armv9 边缘 <b class='flag-5'>AI</b> 计算平台,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>与先进 <b class='flag-5'>AI</b> 能力赋<b class='flag-5'>能</b>物联网革新

    高速公路综合管理:从理论到实践的跨越

    ,不仅面临着复杂的地质情况和建设难度,更需要在管理上寻求创新与突破。本文将结合都巴高速的实际应用案例,探讨高速公路综合管理的创新实践。 二、项目概述       都巴高速主线全
    的头像 发表于 02-28 15:42 638次阅读
    高速公路综合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理:从理论到实践的跨越

    飞腾主板——满足高能和安全可信需求

    在信息技术飞速发展的今天,主板作为计算机的核心部件,其性能和安全性至关重要。飞腾主板以其卓越的高能和安全可信特性,在众多主板产品中脱颖而出,成为满足当今时代需求的理想选择。
    的头像 发表于 02-20 08:45 601次阅读

    中央空调系统管理解决方案

    中央空调系统管理解决方案
    的头像 发表于 02-14 08:03 637次阅读
    中央空调系统<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解决方案

    英伟达A100和H100比较

    英伟达A100和H100都是针对高性能计算和人工智能任务设计的GPU,但在性能和特性上存在显著差异。以下是对这两款GPU的比较: 1. 架构与核心规格: A100: 架构: 基于Ampere架构
    的头像 发表于 02-10 17:05 1.2w次阅读
    英伟达<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比较

    IGBT模块在颇具挑战性的逆变器应用中提供更高能

    背景:电力驱动的虽高,但电动汽车、数据中心、热泵等应用仍需大量能源运行,因此提高能至关重要。 技术原理:IGBT(绝缘栅双极晶体管)模块是一种电力电子器件,它结合了MOSFET的
    的头像 发表于 01-16 10:47 883次阅读

    安科瑞管理监测云平台

    管理监测云平台的主要内容包括以下几个方面: 制定科学的管理制度和标准; 建立完善的能源监测系统和数据分析平台; 推进节能技术和设备的研发和应用; 加强人员培训和管理,提
    的头像 发表于 12-18 14:52 725次阅读
    安科瑞<b class='flag-5'>能</b><b class='flag-5'>效</b>管理监测云平台