0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM推出新款AI芯片,提高大型AI算法性能

我快闭嘴 来源:半导体行业观察 作者:半导体行业观察 2021-02-19 14:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IBM声称已开发出世界上第一批采用7纳米技术构建的用于AI推理和训练的高能效芯片。在2月初举行的2021年国际固态电路虚拟会议上,该公司的研究人员详细介绍了一种硬件加速器,该加速器支持多种模型类型,同时在所有模型类型上实现“领先”的电源效率。

AI加速器是一种专用硬件,旨在加速AI应用程序,特别是神经网络深度学习机器学习。它们在设计上是多核的,并且专注于低精度算术或内存计算,这两者都可以提高大型AI算法的性能,并带来更好的自然语言处理,计算机视觉和其他处理。

IBM表示,其四核的芯片(仍处于研究阶段)已针对具有许多不同的AI和机器学习模型的低精度工作负载进行了优化。与高精度技术相比,低精度技术需要更少的硅面积和功耗,从而提高了缓存利用率,并减少了内存瓶颈。这通常会减少训练AI模型的时间和精力成本。

IBM的AI加速器芯片是少数采用超低精度“混合FP8 ”格式并以基于极端紫外线光刻的封装来训练深度学习模型的芯片。它也是率先采用电源管理的功能之一,能够通过在高功耗的计算阶段放慢速度来最大化性能。它提供了很高的持续利用率,表面上可以转化为卓越的实际应用性能。

据了解,这颗芯片用于用于“混合” FP8训练的时候,具有25.6Tflop / s的速度,而用于INT4推理,也可以做到102.4Top / s的速度。

混合8位浮点(HFP8)是IBM发明的一种格式(于2019年发布),它克服了标准8位(1个符号,5个指数,2个尾数)FP8浮点格式的局限性,在训练特定的8位浮点格式时效果很好标准神经网络,但在训练其他网络时会导致准确性降低。混合FP8使用4个指数和3个尾数位进行正向传播,然后使用5个指数和2个尾数位进行逆向传播,这大大提高了训练的准确性。

四个核通过一对宽的快速数据环链接在一起,一个用于顺时针传输,另一个用于逆时针传输。这些可以保持在芯片内关闭,也可以通过外部存储器或多个相同的芯片打开并路由,以处理更大的网络。环和内核是异步的,以允许不同的时钟速率分别交换功率以提高性能。

每个核心分为两个共享暂存存储器的子核心,然后每个子核心具有8×8引擎阵列,这些引擎经过优化,可通过用于浮点和定点计算的单独管道来加速卷积和矩阵乘法–一起提供FP16,HFP8,INT4和INT2具有AI训练和推理功能。

该36mm 2 芯片采用EUV光刻技术制造,通过内核上的0.75V和SRAM上的0.95V达到了上述性能指标。利用在编译网络时收集的网络知识,该芯片可以限制耗电的网络层,以将其保持在功耗预算之内。标称工作频率(0.55V内核,0.7V SRAM)产生1GHz时钟,并具有3.5Tflop / s / W FP8和16Top / s / W INT4。

在实验中,IBM表示,其AI芯片通常可达到80%以上的训练利用率和60%以上的推理利用率。此外,该芯片的性能和功率效率超过了其他专用推理和训练芯片。

IBM未来2-3年的目标是将新颖的AI芯片设计商业应用到一系列应用中,包括在云,隐私,安全性和自动驾驶汽车方面的大规模训练。IBM研究人员Ankur Agrawal和Kailash Gopalakrishnan在博客中写道:“我们的新AI核心和芯片可用于跨多个行业的许多新的云到边缘应用程序。” “例如,它们可以用于使用8位格式(相对于当前行业中使用的16位和32位格式)的视觉,语音和自然语言处理中的大规模深度学习模型的云训练。它们还可以用于云推理应用程序,例如语音到文本AI服务,文本到语音AI服务,自然语言处理服务。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53608

    浏览量

    459963
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1855

    浏览量

    76799
  • 内存
    +关注

    关注

    9

    文章

    3174

    浏览量

    76163
  • AI
    AI
    +关注

    关注

    90

    文章

    38346

    浏览量

    297464
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的一项重大创新和发展。 优势: 在于能处理庞大的参数规模,显著减少内存占用
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片AI计算平台 ⑥基于AI的自主决策系统 ⑦基于AI的自主学习系统 2、面临的挑战 ①需要造就一个跨学科、全面性覆盖的知识库和科学基础模型 ②需要解决信息不准确和认知偏差问题
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    的同时,能够利用更小、更快的数字格式,提升模型的整体性能。 1.3Transformer 模型中的矩阵乘法计算 2、存内计算AI芯片 存内计算已经成为应对大模型不断增加的计算量和能耗需求、减少大模型
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    的工作吗? 从书中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的还是知道的,FPGA属于AI
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片的需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    芯片设计为例,从最初的架构选型,到算法适配、性能优化,每个环节都考验着工程师的专业素养。在设计一款面向智能安防领域的 AI 芯片时,需要深
    发表于 08-19 08:58

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    到AGI,一起来探索AI芯片 本书从创新视角出发,系统梳理了AI芯片的前沿技术与未来方向,串联起从算法到系统的实现路径,全景式展现
    发表于 07-28 13:54

    智能体AI面临非结构化数据难题:IBM推出解决方案

    ,同时提供一个开放的混合数据基础架构和企业级的结构化和非结构化数据管理。 智能体AI面临非结构化数据难题:IBM推出解决方案 测试结果显示,与传统RAG相比,IBM watsonx.d
    的头像 发表于 07-02 09:40 401次阅读

    IBM推出新一代大型主机IBM z17

    今天,IBM(纽约证券交易所:IBM)宣布推出新一代大型主机 IBM z17。作为 IBM Z
    的头像 发表于 04-10 14:45 891次阅读

    是德科技推出AI数据中心构建器以验证和优化网络架构和主机设计

    : KEYS )推出Keysight AI (KAI)数据中心构建器,这是一款先进的软件套件,通过模拟真实工作负载来评估新算法、组件和协议对AI训练
    的头像 发表于 04-10 08:50 510次阅读

    IBM携手英伟达AI数据平台推动企业级AI创新

    英伟达平台与 IBMAI 和数据平台 watsonx 的集成。此外,IBM 还将与英伟达合作推出新IBM 咨询 (
    发表于 03-24 19:20 428次阅读

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ),设计定制化的FPGA架构,以优化性能和功耗。 2.提升跨领域技能• AI知识储备:掌握深度学习算法、模型量化和优化技术,以便更好地将AI模型与FPGA硬件结合。• 系统集成能力:熟
    发表于 03-03 11:21

    IBM在watsonx.ai平台推出DeepSeek R1蒸馏模型

    ,进一步增强企业在安全、治理以及规模化部署方面的能力。 DeepSeek R1是IBMAI领域的一项重要创新,它采用了蒸馏模型技术,能够在保持模型性能的同时,显著减小模型体积,提高
    的头像 发表于 02-14 10:21 896次阅读