0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何驱动专门为AI应用而设计的新型处理器

lhl545545 来源:eetimes 作者:佚名 2020-03-17 15:05 次阅读

今年的集成固态电路会议(ISSCC)的主题是“为AI时代提供动力的集成电路”,而开幕全体会议的目的是描绘AI“折叠”半导体空间的程度。

Google AI 负责人Jeff Dean、联发科高级副总裁Kou-Hung Loh、Imec项目总监Nadine Collaert、IBM Research总监Dario Gil分别解释了电子领域对AI的期望要求,例如,如何驱动专门为AI应用而设计的新型处理器 (以及CPUGPU) ;促进结构创新 (例如小芯片,多芯片封装,中介层) ;甚至影响着量子计算的发展。

布局布线太费时? Google AI 帮你降本增效

ISSCC会议于上周在旧金山举行,会议期间谷歌表示人工智能电路设计同样重要,并且宣布谷歌正在尝试利用机器学习来解决集成电路设计流程中自动化布局布线问题,并且得到了不错的效果。

人工智能的应用这几年来也一直是电子领域的研究热点和重点。这个方向吸引了大量半导体研究人员从事传统方向和人工智能结合的相关研究。尤其是今年的集成固态电路会议(ISSCC)甚至把会议主题定为:“用集成电路推动AI新时代”。而开幕式也将此次会议的目的陈述为探讨AI对半导体领域研究的影响。

开幕式的四位发言人解释了人工智能的需求是如何推动设计AI专用的新型处理器(相比于CPU和GPU)、如何促进结构创新(例如采用小芯片,多芯片封装,或者插件式设计)、甚至如何正在影响未来量子计算的发展。

会议的第一位发言人是Google AI负责人Jeff Dean。Jeff Dean提到谷歌正在通过实验,尝试利用机器学习执行集成电路设计中的布局布线任务,也就是让AI学习集成电路中的布局布线,节省设计专家的人力劳动。

Jeff Dean首先简要介绍了AI和ML的发展历史,接着介绍了机器如何学习玩双陆棋,深蓝如何下国际象棋, alphago如何擅长下围棋 。以及现在的AI可以应对非常复杂的视频游戏(例如《星际争霸》)并且取得了“具有里程碑意义的成绩”。同时 机器学习还被广泛应用于医学成像机器人技术,计算机视觉自动驾驶,神经科学,农业,天气预报等领域。

数十年来,推动计算技术发展的基本思想是:问题越大,我们就给它更强的计算能力。如果你拥有的处理能力越强,你就可以解决的更大的问题。在一段时间里,这个规则也适用于解决AI问题。但是,这个规则很快就被爆炸式增长的问题空间所打破。因为我们根本无法攒够足够多的CPU/GPU来解决这样的问题。

事实证明,AI / ML不需要典型的CPU / GPU的复杂功能,所需的数学运算也更简单,而且要求的精度也低很多。这个发现带来的影响是:专用的AI / ML加速器不必像CPU / GPU那样复杂。基于此Google设计了TensorFlow加速器,并且已经推出第三代产品,第四代产品也很快会发布。AI / ML处理器设计相对简单,因此也相对便宜,所有这些都使得将机器学习进一步推向网络边缘变得更加容易。截至2019年,Google已经拥有一款可在智能手机上使用的非常紧凑的模型。

当前阶段每个基于AI的应用程序(自动驾驶,医学成像,游戏)都是通过训练专用的AI / ML系统而实现。那么,AI能将一个系统上学到的知识应用到从未见过的新系统中吗?答案很明确:“YES”。

“我之所以提出这一点是因为我们开始考虑将AI用于ASIC设计中的布局布线” Jeff Dean说,“布局布线的难度远远大于围棋:目标更模糊,问题规模反而更大”。Google已经创建了布局布线的学习模型,然后尝试该工具是否可以进一步推广。Jeff Dean说“到目前为止,我们在所有尝试中都获得了非常好的结果。它的性能要比人类好一些,有时甚至要好很多。”

“更好”指的是在非常短的时间内完成布局布线。如果让人类设计专家完成这项任务通常需要一周甚至数周时间。而ML布局布线器通常在24小时内就能完成相同的工作量,并且布局的连线通常更短。ML布局布线器在自动布局和布线方面的更多出色表现可以参考由Cadence公司Rod Metcalfe撰写的“在EDA中进行机器学习可加快设计周期”的文章。

Jeff Dean说,ML可能还会扩展到IC设计过程的其他部分,包括使用ML来帮助生成测试用例,以更充分地进行ASIC设计验证;也许还可以使用ML来改进高级代码综合以达到更优化的设计。这些可能的应用方向对机器学习本身的普及很重要,同时对加速集成电路设计进度也是一样的重要。

高成本大功耗CPU/GPU并非必须,边缘计算可定制

联发科技高级副总裁兼首席战略官Kou-Hung Loh指出物联网设备将数百亿的事物连接在一起,然而AI正在改变着这些联网的一切事物。

AI之所以走向边缘计算,部分原因正如Dean在本节前面提到的那样,还有更多的原因包括:减轻数据中心日益增长的处理负担、最小化网络流量,以及那些需要使用近似本地处理的实时应用。本地处理要求:快速(必须为AI计算专门设计),而且低功耗。这些为AI专门设计的处理器,被称为AI处理器单元。一个APU可以不如CPU灵活,但是由于是专用的,所以APU可以性能上比CPU快20倍,功耗比CPU低55倍。

多系统不好协同设计?AI 帮你打通奇经八脉

Imec的项目总监Nadine Collaert指出摩尔定律可能在未来几年内依然适用,虽然CMOS缩小的难度越来越大,但可以利用FinFETs、 纳米片、forksheets等技术实现芯片级的CMOS进一步缩放。相信3D技术是最好的方法:包括使用多层封装,硅上穿孔,以及与其他标准单元进行精细等级的连接。具体技术的选择需要根据系统设计需求和可选用的器件属性来决定。“这将是一个复杂的练习”Collaert说。这将对EDA供应商产生很大压力,因为这需要EDA供应商在工具层面支持不同方案的尝试和比较。

无线通信系统的前端模块将成为一个特殊的挑战。“通常,这些系统最多样化:使用不同技术的许多不同组件,并且前端模块会随着天线、PA、以及滤波器的增多,而变得更加复杂。” 无线通信行业正在向更高频和更高效率迈进。一种方案是将III-V材料(例如GaN和SiC)与CMOS结合使用以获得两种材料的优势。Nadine Collaert给出一个在绝缘的硅衬底(SOI)上生长的具有III-V材料的3D nano-ridge的图片示例,同时指出这里还有很多工作要做。

至于机器学习对内存的影响则更加明显。 像AI和ML这样的新应用都需要快速地访问内存。 人们迫切需要关注和发展内存计算,随着逻辑和存储的日益紧密,3D封装当然会发挥重要作用。

彼此赋能,量子计算和人工智能可互补

IBM Research总监Dario Gil在会议上进一步提及广义的AI:几乎可以肯定,广义的AI将会在量子计算机上实现。他总结了最大的好处可能来自bits(数字处理),neurons(AI)和qubits(量子计算)的互补使用。IBM于2016年通过开放了第一台量子计算机的访问,现在可以访问15台量子计算机,包括其最新的53量子位模型。
责任编辑;zl

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18219

    浏览量

    221938
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263955
收藏 人收藏

    评论

    相关推荐

    台积电:AI服务器处理器预计翻番,拉动收入增长 

    台积电将 AI 服务器处理器严格限定为用于 AI 训练与推理的 GPU、CPU 及 AI 加速器,剔除网络边缘与消费级设备中的此类产品。
    的头像 发表于 04-19 15:04 42次阅读

    国产兆芯主板GM9-6002采用KX-U6780A处理器#兆芯处理器

    处理器主板
    国产计算机小秦
    发布于 :2024年04月13日 13:58:31

    国产GPU搭配国产处理器平台主机

    处理器gpu
    GITSTAR 集特工控
    发布于 :2024年03月27日 14:11:32

    飞腾2000 4核处理器国产主板介绍# 飞腾主板# 国产主板# 飞腾处理器

    处理器服务
    jf_67464575
    发布于 :2024年02月03日 10:15:41

    英特尔新处理器,掀AI PC战火

    随着ai时代的到来,英特尔正在构想新的酷睿Ultra处理器(代号Meteor Lake),这是英特尔的第一个基于npu的处理器,旨在在pc上应用ai加速和边缘推理。meterlake采
    的头像 发表于 12-11 11:26 506次阅读

    青稞处理器资料分享

    和下载。 4.“WFE”指令 RISC-V规范中没有WFE指令,满足蓝牙运用的多种低功耗场景,青稞处理器率先增加WFE指令,只需把快速可编程中断控制(PFIC)中的系统控制寄存
    发表于 10-11 10:42

    基于IDE构建用于STM32微处理器的完整人工智能项目

    本用户手册指导了基于 IDE 逐步构建用于 STM32 微处理器的完整人工智能(AI)项目,自动转换预训练好的神经网络(NN)并集成所生成的优化库。本手册还介绍了 X-CUBE-AI 扩展包,该扩展
    发表于 09-07 06:15

    华为海思麒麟9000s是处于什么水平的处理器

      华为海思麒麟9000s是一款旗舰级处理器,采用了5nm工艺制程,是目前华为公司最强大的芯片之一。该芯片主要应用于华为Mate40系列手机中,其性能指标非常出色,从CPU、GPU、AI计算能力等
    发表于 08-31 09:34

    ARM Cortex-R7 MPCore处理器技术参考手册

    ,并且提供了可选的硬件加速一致性端口(ACP),以减少与其他主机共享存储区域时的软件高速缓存维护操作。 中断延迟通过中断和重新启动加载-存储多条指令以及使用集成中断控制来保持低。 Cortex-R7 MPCore
    发表于 08-18 06:34

    瑞萨rc m3车规级处理器介绍

    是不可或缺的一部分。 RC M3车规级处理器是基于ARM Cortex-M3内核的32位微控制器。它将高性能、低功耗和车规级安全性能结合在一起,可以帮助汽车制造商满足严格的安全要求。RC M3车规级处理器专门为汽车电子应用
    的头像 发表于 08-15 16:23 905次阅读

    AI芯片和处理器的区别

      AI芯片是一种专门用于人工智能计算的集成电路。相较于传统的通用微处理器AI芯片具备更优秀的高性能和低功耗等特点,能够加速训练和推理过程,是目前在人工智能领域广泛应用的重要基础设施
    的头像 发表于 08-08 16:43 1283次阅读

    GAUDIR HL-2000处理器介绍

    GAUDIRHL-2000是一款先进的Al和DeepLearning Training处理器,利用专门构建的体系结构,提供卓越的性能、可扩展性、电源效率和成本节约。Gaudi HL-205夹层卡
    发表于 08-04 07:23

    dsp处理器专门用于什么方面的处理器

    DSP处理器(Digital Signal Processor)是一种专门用于数字信号处理处理器。与通用用途的微处理器(如普通的中央
    发表于 07-27 17:21 2893次阅读

    昇腾AI处理器:Ascend310和CANN简介

    Ascend310 AI处理器逻辑架构昇腾AI处理器的主要架构组成:芯片系统控制CPU(Control CPU)AI计算引擎(包括
    发表于 06-05 14:09 6093次阅读
    昇腾<b class='flag-5'>AI</b><b class='flag-5'>处理器</b>:Ascend310和CANN简介

    新一代面向边缘应用的AI视觉处理器

    最近,笔者与Ambarella的AIoT高级总监Jerome Gigot进行了交流,该公司专门为边缘应用程序创建AI视觉处理器
    发表于 05-08 16:03 474次阅读
    新一代面向边缘应用的<b class='flag-5'>AI</b>视觉<b class='flag-5'>处理器</b>