0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM研制可兼顾高精度学习和低精度推理的深度学习芯片

EdXK_AI_News 来源:未知 作者:胡薇 2018-07-10 08:56 次阅读

IBM正在研制一种可兼顾高精度学习和低精度推理的深度学习芯片

深度学习领域仍在不断发展,特别地,专家们认识到如果芯片能够使用低精度的计算方式得出近似答案,神经网络就可以用很少的资源完成大量的计算。这在移动设备和其他功率受限的设备中尤其有用。但对某些任务,尤其是训练神经网络去完成某些事情的任务来说,精确性仍然是必需的。IBM最近在IEEE VLSI研讨会上展示了其最新的解决方案(目前仍然是原型):一款在上述两方面都有良好表现的芯片。

训练神经网络与使用该网络执行其功能(称为推理)的需求之间存在脱节,这对那些从事于设计芯片以加速AI功能的人来说是一个巨大的挑战。IBM的新型AI加速器芯片能够满足该公司提出的所谓范围精度(scaled precision)要求。也就是说,它可以在32位、16位,甚至1位或2位模式下进行训练和推理。

IBM约克镇高地(Yorktown Heights)研究中心的杰出技术人员、该项工作的领导者Kailash Gopalakrishnan解释说:“在训练中,你能够使用的最好精度是16位,而在推理中可以应用的最好精度是2位。这个芯片可能涵盖了目前已知的最佳训练和最好推理。”

该芯片能够获得上述表现的原因来自于两项创新,而这两项创新的目标都是实现相同的结果——保持所有处理器组件能够得到数据和工作。

Gopalakrishnan说:“在深度学习方面,传统芯片架构面临的挑战之一是利用率一般非常低。”也就是说,即使芯片可能具有非常高的峰值性能,通常只有20%到30%的资源能够被用于解决问题。IBM始终将所有任务的目标定为90%。

利用率低通常是因为存在于芯片周围的数据流瓶颈。为了突破这些信息障碍,Gopalakrishnan的团队开发了一个“定制”的数据流系统。该数据流系统是一种网络方案,可以加速数据从一个处理引擎到下一个处理引擎的传输过程。它还针对要处理的是学习任务还是推理任务以及不同的精度进行了优化。

第二项创新是使用专门设计的“便笺本”形式的片上存储器,而不是CPUGPU上的传统高速缓冲存储器。构建高速缓存是为了遵守某些对一般计算有意义的规则,但会导致深度学习的延迟。例如,在某些情况下,缓存会将一大块数据推送到计算机的主存储器(强制推送),但如果神经网络的推理或学习过程需要用到该数据,则系统将不得不保持等待状态,直到可以从主存储器中检索到该数据。

便笺本遵循不同的规则。构建它的目标是为了保持数据流经芯片的处理引擎,并确保数据在恰当的时间处于正确的位置。为了获得90%的利用率,IBM必须使设计出的便笺本具有巨大的读/写带宽(每秒192千兆字节)。

由此产生的芯片可以执行当前所有的三种主要深度学习AI:卷积神经网络(CNN)、多层感知器(MLP)和长-短期记忆(LSTM)。Gopalakrishnan解释说,这些技术共同主导了语言、视觉和自然语言处理。在16位精度(尤其是针对训练)情况下,IBM的新芯片能够在每秒钟内执行1.5万亿次浮点运算;在2位精度下(推理的最佳设置)则跃升到每秒12万亿次运算。

Gopalakrishnan指出,由于芯片是采用先进的硅CMOS工艺(GlobalFoundries的14纳米工艺)制造的,每秒钟内发生的所有这些操作都被限制在一个相当小的区域内。为了推理出一个CNN网络,该芯片可以在每平方毫米内每秒执行平均1.33万亿次操作。这个数字很重要,“因为在很多应用中,你的成本受到尺寸的限制,”他说。

新的架构也证明了IBM研究人员几年来一直在探索的东西:如果以高得多的精度训练神经网络,真正低精度的推理就无法正常进行。Gopalakrishnan说:“当低于8位时,训练与推理将开始直接相互影响。一个在16位模式下训练但以1位模式部署的神经网络系统将出现无法接受的重大错误。因此,以与最终部署方式类似的精度训练网络将带来最好的结果。”

尚无任何消息披露这项技术什么时候可能以Watson或其他形式进行商业化,但Gopalakrishnan的领导、IBM半导体研究所的副总裁Mukesh Khare表示希望它能够发展和改进。他说:“这只是冰山一角,我们正在进行更多创新。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1666

    浏览量

    74264
  • 深度学习
    +关注

    关注

    73

    文章

    5226

    浏览量

    119870

原文标题:IBM正在研制通用型深度学习芯片

文章出处:【微信号:AI_News,微信公众号:人工智能快报】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    友思特应用 | 高精度呈现:PCB多类型缺陷检测系统

    高精度呈现!友思特PCB多类型缺陷检测系统,借由深度学习自动标注功能排查全部微小缺陷,为工业 PCB生产制造提供了先进可靠的质量保障。
    的头像 发表于 04-10 17:51 262次阅读
    友思特应用 | <b class='flag-5'>高精度</b>呈现:PCB多类型缺陷检测系统

    Aigtek:如何设计一个高精度电压源

    在现代电子系统中,高精度电压源是许多应用的基础,如精密仪器、测试测量设备、通信系统等。设计一个高精度电压源需要深入了解电源电路的原理和各种影响电压稳定性的因素,同时结合高性能的元器件和精密的控制技术
    的头像 发表于 02-27 11:40 227次阅读
    Aigtek:如何设计一个<b class='flag-5'>高精度</b>电压源

    矽力杰多通道高精度DAC

    数据云、人工智能和互联网通信等多方深度推动,通信、电池、工业自动化与数据采集系统等高精度控制领域对多通道、高精度数字模拟转换器(DigitaltoAnalogConverter,DAC)芯片
    的头像 发表于 12-06 08:19 373次阅读
    矽力杰多通道<b class='flag-5'>高精度</b>DAC

    高精度电压源是什么意思

    高精度电压源是一种能够产生稳定、准确和可调节的电压输出的设备。在各种电子应用中,高精度电压源被广泛应用于模拟信号处理、测试和测量领域。本文将介绍高精度电压源的基本原理、特点和应用场景。
    的头像 发表于 11-17 17:02 326次阅读
    <b class='flag-5'>高精度</b>电压源是什么意思

    深度学习在语音识别中的应用及挑战

    一、引言 随着深度学习技术的快速发展,其在语音识别领域的应用也日益广泛。深度学习技术可以有效地提高语音识别的精度和效率,并且被广泛应用于各种
    的头像 发表于 10-10 18:14 481次阅读

    TPU-MLIR量化敏感层分析,提升模型推理精度

    背景介绍TPU-MLIR编译器可以将机器学习模型转换成算能芯片上运行的bmodel模型。由于浮点数的计算需要消耗更多的计算资源和存储空间,实际应用中往往采用量化后的模型(也称定点模型)进行推理。相比
    的头像 发表于 10-10 10:17 563次阅读
    TPU-MLIR量化敏感层分析,提升模型<b class='flag-5'>推理</b><b class='flag-5'>精度</b>

    什么是高精度地图

    什么是高精度地图 高精度地图:(1)是和普通导航电子地图相对而言的服务于自动驾驶系统的专题地图(2)是包含道路形状、道路标记、交通标志和障碍物等地图元素(3)是涵盖道路交通状况实时动态信息,(4
    发表于 10-07 14:24

    AVT1200 北斗高精度车载定位终端

    ALLYSTAR 北斗高精度定位终端是一款支持 5G 通讯、集 GNSS 导航技术、惯性传感技术于一体的车载智能终端。基于华大北斗自研的全系统多频低功耗高精度 GNSS 芯片,结合高精度
    发表于 09-08 14:29

    高精度参考电压源是什么意思

    高精度参考电压源是一种能够提供稳定、准确且可靠的参考电压的电路或器件。在电子系统中,参考电压起着至关重要的作用,它被用作比较、校准、测量等各种应用中的基准电压。高精度参考电压源能够提供高精度
    的头像 发表于 08-24 12:00 504次阅读
    <b class='flag-5'>高精度</b>参考电压源是什么意思

    深度学习框架和深度学习算法教程

    深度学习框架和深度学习算法教程 深度学习是机器学习
    的头像 发表于 08-17 16:11 700次阅读

    深度学习框架的作用是什么

    深度学习框架的作用是什么 深度学习是一种计算机技术,它利用人工神经网络来模拟人类的学习过程。由于其高度的精确性和
    的头像 发表于 08-17 16:10 1140次阅读

    深度学习框架区分训练还是推理

    深度学习框架区分训练还是推理深度学习框架是一个非常重要的技术,它们能够加速深度
    的头像 发表于 08-17 16:03 1022次阅读

    深度学习框架是什么?深度学习框架有哪些?

    高模型的精度和性能。随着人工智能和机器学习的迅猛发展,深度学习框架已成为了研究和开发人员们必备的工具之一。 目前,市场上存在许多深度
    的头像 发表于 08-17 16:03 1710次阅读

    高精度电压源如何设计出来的

    高精度电压源是一种用于提供高精度电压的电子设备,通常用于测量和控制系统。高精度电压源的设计是一个复杂的过程,需要考虑多个因素,包括电路设计、元件选型、测量误差、稳定性等。下面将从电路设计和元件选型两个方面,详细介绍
    的头像 发表于 05-29 17:30 513次阅读
    <b class='flag-5'>高精度</b>电压源如何设计出来的

    高精度电压源是什么电路(高精度电压源原理)

    高精度电压源是一种基于电路设计的电子设备,其主要目的是提供高精度的电压输出。在该电路中,使用了高稳定性的电路元件和精密的电路设计来保证输出电压的稳定性和准确性。通常,高精度电压源中包含大量的反馈控制电路,以及
    的头像 发表于 05-23 09:18 746次阅读
    <b class='flag-5'>高精度</b>电压源是什么电路(<b class='flag-5'>高精度</b>电压源原理)