0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI芯片如果有罗马大道 必定归功可重构计算

电子工程师 来源:未知 作者:胡薇 2018-12-06 08:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在芯片架构设计领域中,可重构计算技术并非一项新的存在。20世纪60年代末,加利福尼亚大学的Geraid Estrin首次提出重构计算,后过去二十余年,Xilinx才基于这一原型系统推出该技术的重要分支——FPGA架构,正式开启现代重构计算技术。

即便如此,由于此前芯片发展一直走在摩尔定律预设的方向上,FPGA始终无法进入公众的视野中,而在学术研究领域,它也一直只是芯片技术研究中少有人关注的冷门项目。不曾想,在这一波AI浪潮的推动下,可重构计算技术迅速从学术边缘走向了主流。

AI浪潮与芯片架构创新

任何技术的兴起都是市场需求、技术迭代与产业发展合力推动的结果,AI不例外,芯片的变革更是如此。

在算力需求持续增长的背景下,AI算法对芯片运算能力的要求上升到传统芯片的百倍以上,想像一下,采用了人工智能算法的AlphaGo需要用到上千块传统处理器CPU)和上百块图形处理器(GPU)。类似,传统处理器根本无力支持智能家居自动驾驶和智能终端等应用场景的巨大算力需求,因此基于传统CPU搭建出新的架构就显得迫在眉睫,AI芯片也就此诞生。

对于这一新兴的芯片市场,摩根大通的分析师Harlan Sur曾公开表示,到2022年为止,AI芯片市场将以每年59%的成长速度增长,届时市场规模有望达到330亿美元。

用迅猛之势来形容AI芯片产业的发展毫不为过,这一新兴事物也打破了整个市场既有的产业形态。在新兴芯片市场占据龙头地位的英伟达,其CEO黄仁勋就多次在公开场合中表示:“摩尔定律时代已经终结。”这也并非一家之言,作为摩尔定律的提出者,Intel也多次公开承认这一点。

没有摩尔定律的约束,在接下来很长一段时间内,芯片产业势必将进入自由生长状态,AI芯片产业呈现了前所未有的百花齐放。但其实深入去看,它却也被有章法的推进着。事实上,最为明显的就是,伴随着整个市场对功能的需求变化和终端的发展,GPU、ASIC等主流芯片架构技术正逐步有序得的迭代和扩大自己的市场占比。

目前,因市场对智能的实现尚处于初期,AI中关键的应用需求更偏向于训练端,因而,在训练市场中独大的GPU成为芯片市场的主流架构也就毫不奇怪。但真正的智能一定离不开逻辑推理部分。自然,作为这一功能实现的主力军,ASIC和FPGA备受业内关注,其中,热度蹭蹭上涨的FPGA可以说是格外引入注目。

FPGA热潮启示录

在AI并不火热的时间段,FPGA常年来被用作专用芯片(ASIC)的小批量替代品。因传统计算机冯·诺依曼结构的约束,比CPU甚至GPU能效更高的FPGA一直未有用武之地,直到神经网络算法的出现。

不得不说,从初入商用市场到独立成产品,FPGA架构技术似乎从未和AI算法分离开过,硬件上的节点与算法的神经元结构形成天然的呼应,颇有天造地设的意味。

如所料,FPGA最早一出现就伴随着神经网络算法研究,2011年,Altera推出OpenCL,其中的CNN算法研究就是基于FPGA的,这让FPGA重回了人们的视野中;后时隔三年,微软推出Catapult项目,开发了高吞吐CNN FPGA加速器,将这种架构更紧密的与神经网络算法实现绑在了一起;2015年,陷入转型焦虑的Intel直接选择收购Altera,这一举动后来甚至带起了一波CPU+FPGA热,但这一刻FPGA的魅力还没有真正被展现出来。直到一年后,Intel终利用BP算法在FPGA上实现了5GOPS处理能力,这一架构的优势终锋芒初现。

一步一步,伴随着深度学习的应用和渗透,FPGA架构技术也越来越受各芯片厂商关注,在多次大会的行业交流中,多位芯片研发人员都指出:综合考虑成本、可行性等因素,在可见的未来里,架构创新是唯一算力提升解决方案。而FPGA无疑为整个行业带来架构设计上的新思路。

第一次,FPGA被用于产品端是在iPhone 7上,苹果集成了Lattice iCE40 FPGA,将其作为超低功耗的逻辑处理兼传感器部件。从技术到产品端,这一技术架构只用了短短七年,而苹果的成功尝试也为这一技术架构加分不少。现在,业内人士也普遍将它列为旧有半导体甚至终端架构的关键颠覆者,也因此,FPGA这七年的持续热度给出了整个行业的风向标:半导体架构进入了新的征程,尤其为AI芯片的设计提供了关键思路。

站在FPGA的肩膀上,可重构芯片诞生

对于AI芯片的优势,寒武纪陈天石曾这样形象的描述道:“如果把深度学习看作切肉,传统的处理器就是瑞士军刀,我们的专用神经网络处理器则相当于菜刀。瑞士军刀通用性很好,什么都可以干,但干得不快,菜刀是专门用来做饭的,在切肉这件事情上,效率当然更高。”

按理,效率越高,算力越高,芯片产业发展应当重回到此前活跃增长的阶段,但在近两年整个产业却出现了一种怪象:芯片产业进入了一种低效的繁荣状态,现有的AI产品的数量只有两位数,而单价几乎不变,尤其是AI终端产品,产业利润几乎在个位数。在产业链端,产品开发费用、产品难度都在持续上升,在市场空间有限的条件下,产品的盈利空间直线下降。

事实上,仅仅融合FPGA架构设计的高效对整个产业的发展来说是依然不够的,菜刀终究还是菜刀,AI芯片的应用场景和变现能力实在十分有限。对此,清华大学微电子所所长魏少军就直接点出:“要想让AI芯片能够在使用中变得更‘聪明’,架构创新就是它不可回避的课题。”

产业端,为了打破这一现状,地平线、寒武纪、Arm等众多新老玩家纷纷给出了各自的平台性商用解决方案,但终不是长久之计。对此,业内的共同认知是:若想釜底抽薪,设计出一款动态可重构的并行计算芯片,以实现一块芯片可以跑多种算法,节省资源,大大提高通用性,极大程度上促进整个产业的发展。

所幸,在国内,目前尚有两款芯片代表:一款是清华大学的Thinker可重构AI芯片,它获得了2017年国际低功耗电子与设计会议设计竞赛奖,这是一款由65nm工艺制成的芯片,不过其峰值性能能够达到410GOPS,能效达5TOPS/W。第二款是南京大学RAPS可重构芯片,它由40nm工艺制成,可以实现25种与信号处理有关的算法,峰值性能69GFLOPS,能效达到32GFOPS/W。与TMS320C6672多核DSP比较,性能能够提高一个数量级。

值得一提的是,两款芯片制程一般,工艺泛泛,却收获如此高效的性能,架构创新的四两拨千斤功效可见一斑。

最后

纵观第三波AI浪潮下的半导体产业,有两个现象级事件奠定了当下芯片产业的基调:曾经逃离半导体行业的风投又纷纷重新回到了半导体行业;历来观潮的中国,现在成了弄潮儿。

不言而喻,这两大趋势撞在一起发生的化学效应率先打破了整个半导体行业既有的产业形态。但不可忽视的是,作为工业的粮食,芯片架构创新带动的产业活力才将成为推动第三波AI浪潮持久发展的动力。

如许衍居院士所言:未来10年,整个半导体产业将会从cSoC时代走向rSoC时代。但是可重构芯片发展还需要突破众多难关,如基于可重构计算搭建的硬件平台是需要搭建一个统一的标准平台还是仅仅只开发一个通用的编程模型?采用双编程如何划分软硬件任务并处理好之间的通信问题?这些问题依旧是缠绕在可重构芯片发展之路上的藤蔓,披荆斩棘,路且漫长。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1664

    文章

    22571

    浏览量

    640733
  • AI芯片
    +关注

    关注

    17

    文章

    2181

    浏览量

    36886

原文标题:站在FPGA的肩膀上 AI可重构芯片诞生

文章出处:【微信号:FPGAer_Club,微信公众号:FPGAer俱乐部】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [工具讨论] 如果有一款国产图形化配置工具STM32Cube,支持所有内核和厂商MCU,你会用吗?

    涉及多家厂商芯片时,要在多个工具间切换 如果有一款这样的工具 我们想和大家讨论一个假设性问题: 如果有一款国产的图形化配置工具,具备以下特性,你会考虑使用吗? 核心特性对比 对比维度
    发表于 01-26 10:30

    AES和SM4算法的重构分析

    为:Y=A(AX+C)^-1+C 。 通过对比以上两个计算公式可以发现,它们都具有的仿射变换操作和求逆操作,于是可以通过以下流程图对AES和SM4算法进行S盒的重构。具体实现过程需要具备有限域上的知识,感兴趣的读者
    发表于 10-23 07:26

    全球首款“可逆计算”冰河芯片诞生,相比普通芯片节能30%

    。这一突破不仅填补了可逆计算商业化芯片的全球空白,更为解决 AI 算力爆发带来的能源危机提供了全新路径,标志着我国在新型计算架构领域实现从理论到产品的关键跨越。 ​ 冰河
    的头像 发表于 10-09 17:05 1075次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    芯片 ③数模混合电路的突破 ④重构性架构 ⑤情感计算单元 ⑥决策与行动单元 ⑦多种神经网络与多种学习算法 2)AGI芯片的新创公司 3、A
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、类脑芯片

    AI芯片发展的重要方向。如果利用超导约瑟夫森结(JJ)来模拟与实时突触电路相连的神经元,神经网络运行的速度要比目前的数字或模拟技术提升几个数量级。 1、超低温类脑芯片 JJ: QP
    发表于 09-17 16:43

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    流体芯片AI计算平台 ⑥基于AI的自主决策系统 ⑦基于AI的自主学习系统 2、面临的挑战 ①需要造就一个跨学科、全面性覆盖的知识库和科学
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+化学或生物方法实现AI

    顺序排列并存储在毛细血管内。 电石存储器: 3、化学计算的总体现状与前景 二、生物计算 1、用活细胞实现AI 作者第七章才会介绍类脑芯片,到时候我们再一起欣赏吧。 这里只是先给我们打了
    发表于 09-15 17:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    的同时,能够利用更小、更快的数字格式,提升模型的整体性能。 1.3Transformer 模型中的矩阵乘法计算 2、存内计算AI芯片 存内计算
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    ②Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    保持停滞的情况下,依照目前计算机的能耗效率,至少还需要30年的努力才接近其水准,见图1所示。 图1 大脑与计算机的能量效率对比 图2 类脑芯片的前瞻性研究领域AI湿件 为此,一些想
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    、集成芯片、分子器件与分子忆阻器,以及打印类脑芯片等。 第五章至第八章分别探讨用化学或生物方法实现AIAI在科学发现中创新应用、实现神经形态计算
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    方向,就明确涵盖了人工智能芯片的研发、部署与优化技术岗位 。如果你从事 GPU 相关研发工作,在申报职称时,就需着重突出在图形处理加速、大规模并行计算等方面的成果,因为 GPU 的高并行结构及强大浮点
    发表于 08-19 08:58

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    计算等类别AI芯片的及时、全面而富有远见的书。” 那么时至今日,这个世界发生了什么变化呢? 在这四年间,最重大的技术变革无疑就是大模型的横空出世,人类的时间仿佛被装上了加速器,从ChatGPT到
    发表于 07-28 13:54

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI
    的头像 发表于 07-09 15:59 2081次阅读

    清微智能官宣:国产重构芯片全球出货量突破2000万颗

    芯片累计出货量已突破2000万颗,成为全球销量领先的重构芯片厂商。 2000万颗出货量 坚持高阶国产替代,从清华实验室到2000万颗的产业突围 时下,当
    的头像 发表于 06-12 17:15 2161次阅读
    清微智能官宣:国产<b class='flag-5'>可</b><b class='flag-5'>重构</b><b class='flag-5'>芯片</b>全球出货量突破2000万颗