0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

旺材芯片 来源:NATURE 2023-11-24 17:04 次阅读

随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。中国科协发布的2023重大科学问题中“如何实现低能耗人工智能”被排在首位。

2023年10月25日,清华大学团队在超高性能计算芯片领域取得新突破。相关成果以“All-analog photo-electronic chip for high-speed vision tasks”为题发表在Nature上。这枚芯片基于纯模拟光电融合计算架构,在包括ImageNet等智能视觉任务实测中,相同准确率下,比现有高性能GPU算力提升3000倍,能效提升400万倍。

f09e5e20-7898-11ee-939d-92fbcf53809c.png

图1 相关论文(来源Nature)

未来已来?光为载体的计算芯片

实现算力飞跃并非易事,特别是当前传统的芯片架构,受限于电子晶体管大小逼近物理极限。全新计算架构成为破局的关键。光计算以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算。面对以光速计算的诱人前景,数年来海内外知名科研团队相继提出多种设计,但要替代现有电子器件实现系统级应用,仍面临重大瓶颈:一是如何在一枚芯片上集成大规模的计算单元(可控神经元),且约束误差累计程度;二是实现高速高效的片上非线性;三是为兼容目前以电子信号为主体的信息社会,如何提供光计算与电子信号计算的高效接口。当前常见的模数转换功耗,较光计算每步乘加运算高出多个数量级,掩盖了光计算本身的性能优势,导致光芯片难以在实际应用中体现出优越性。

系统级算力和能效,超现有芯片万倍

为解决这一国际难题,清华大学团队创造性地提出了模拟电融合模拟光的计算框架,构建可见光下的大规模多层衍射神经网络实现视觉特征提取,利用光电流直接进行基于基尔霍夫定律的纯模拟电子计算,两者集成在同一枚芯片框架内,完成了“传感前 传感中 近传感”的新型计算系统。极大地降低了对于高精度ADC的需求,消除传统计算机视觉处理范式在模数转换过程中速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模集成、高效非线性、高速光电接口三个关键瓶颈。

f0a20246-7898-11ee-939d-92fbcf53809c.png

图2. 光电计算芯片ACCEL的计算原理和芯片架构(来源Nature)

实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的数千倍。同时系统级能效达74.8 Peta-OPS/W,较现有的高性能GPU、TPU、光计算和模拟电计算架构,提升了两千到数百万倍。

在超低功耗下运行的ACCEL将有助于大幅度改善发热问题,对于芯片的未来设计带来全方位突破,并为超高速物理观测提供算力基础。同时对无人系统、自动驾驶等续航能力要求高的场景带来重大利好。

f0c45e36-7898-11ee-939d-92fbcf53809c.png

表1. ACCEL和现有高性能芯片的系统级实测性能指标对比 (来源:Nature)非相干光直接计算

更进一步,ACCEL芯片还支持非相干光视觉场景的直接计算,如论文中演示的交通场景实验。显著拓展了ACCEL的应用领域,有望颠覆目前自动驾驶、机器人视觉、移动设备等领域先将图片拍摄并保存在内存中后进行计算的思路,避免传输和ADC带宽限制,在传感过程中完成计算。

f0cdfc20-7898-11ee-939d-92fbcf53809c.gif

图3. ACCEL可用于电子设备超低功耗人脸唤醒示意动图(来源:清华大学)

开辟新路径:颠覆性架构有望真正落地

清华攻关团队提出的新型计算架构不仅对于光计算技术的应用部署意义重大,对未来其他高效能计算技术与当前电子信息系统的融合,亦深有启发。

论文通讯作者之一,清华大学戴琼海院士介绍道,“采用全新原理研发出计算系统是一座大山,而将新一代计算架构真正落地到现实生活,解决国计民生的重大需求,是攀过高峰后更重要的攻关。”Nature杂志特邀在Research Briefing发表的该研究专题评述也指出,“或许这项工作的出现,会让新一代计算架构,比预想中早得多地进入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。

清华大学戴琼海院士、方璐副教授、乔飞副研究员、吴嘉敏助理教授为本文的共同通讯作者;博士生陈一彤、博士生麦麦提·那扎买提、许晗博士为共同一作;孟瑶博士、周天贶助理研究员、博士生李广普、范静涛研究员、魏琦副研究员共同参与了这项研究。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 晶体管
    +关注

    关注

    76

    文章

    9054

    浏览量

    135212
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230604
  • 智能视觉
    +关注

    关注

    0

    文章

    94

    浏览量

    9081

原文标题:清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

文章出处:【微信号:wc_ysj,微信公众号:旺材芯片】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Energy Micro将32位MCU提高4

    消费电子、汽车电子、医疗电子和工搅拌机业自动化应用正在推动32位微控制器的广泛采用,32位MCU具有更高的性能,但高性能往往意味着 粉碎机需要消耗更多的功率,因此,低功耗设计和能耗
    发表于 03-16 16:00

    白炽灯光提升20 能否再现辉煌

      白炽灯,最早由托马斯·爱迪生进行商业开发,曾是全世界产量最大、应用最广泛的电光源。白炽灯用电流将钨丝加热到3000摄氏度左右,达到白炽状态,利用热辐射发出可见光。这些被加热的钨丝
    发表于 01-18 09:50

    福音来啦:省一万倍电的被动Wi-Fi

    方式要省一万倍,比蓝牙传输要省一千。省一万倍电的被动Wi-Fi,再也不用担心手机电量了LoloStock/Shutterstock.com据华盛顿大学Shyam Gollakota等人的研究,他们将
    发表于 03-09 18:02

    FPGA是如何实现30倍速度的云加速的?都加速了哪些东西?

    提升至通用CPU服务器的30以上。同时,与已经深入人心的高性能计算的代表GPU相比,FPGA具有硬件可编程、低功耗、低延时的特性,代表了
    发表于 04-15 16:17

    请问这个放大一万倍么,输入正弦信号范围多少啊?

    这个放大一万倍么,输入正弦信号范围多少啊.
    发表于 06-06 09:05

    NVIDIA火热招聘GPU高性能计算架构师

    这边是NVIDIA HR Allen, 我们目前在上海招聘GPU高性能计算架构师(功能验证)的岗位,有意向的朋友欢迎发送简历到 allelin@nvidia.comWechat
    发表于 09-01 17:22

    [新品发布]全球首个百万IOPS云盘来了 阿里云推出超高性能云盘ESSD

    提升500%。阿里云发布超高性能ESSD云盘 100IOPS随机读写刷新纪录1月9日,阿里云正式推出全球首个跨入IOPS百万时代的云盘——ESSD,单盘IOPS高达100,这是阿里
    发表于 01-17 11:57

     华为云MongoDB弹性伸缩能力提升100

    高性能并非一蹴而就,这与华为云深厚的技术积累息息相关。   10数据重构性能提升,得益于将数据复制功能卸载到分布式共享存储。分布式存储采用基于分区的并行复制方式;任意盘或节点故障
    发表于 08-03 13:00

    鸿湖联基于RK3399芯片的扬帆富设备开发板正式合入OpenHarmony主干

    、H265/H264视频解码。多路视频输出和输入,性能更强,速度更快,接口更丰富,普遍适用于互动广告机、互动数字标牌、智能自助终端、智能零售终端、工控主机、机器人设备等。而RK3399芯片
    发表于 07-21 10:52

    研究人员开发出半导体测量新技术,灵敏度比以往测量技术提升了10万倍!

    UT(德州大学,University of Texas)研究人员开发出一种半导体测量新技术,这项技术的灵敏度比以往测量技术提升了10万倍
    的头像 发表于 05-05 15:38 2889次阅读

    德州大学开发出半导体测量新技术 比以往提升10万倍

    UT(德州大学,University of Texas)研究人员开发出一种半导体测量新技术,这项技术的灵敏度比以往测量技术提升了10万倍。 UT电气与计算机工程专业的研究生Sukrit
    的头像 发表于 05-14 10:01 1320次阅读

    清华大学团队在超高性能计算芯片领域取得新突破

    清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。
    的头像 发表于 10-29 09:20 623次阅读
    <b class='flag-5'>清华</b>大学团队在<b class='flag-5'>超高性能</b><b class='flag-5'>计算</b><b class='flag-5'>芯片</b>领域取得新突破

    清华大学开发出超高速光电计算芯片性能是商用芯片3000倍!

    针对这一难题,清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种“挣脱”摩尔定律的全新计算架构:光电模拟芯片,算力达到目前高性能商用
    的头像 发表于 10-31 18:00 961次阅读
    <b class='flag-5'>清华</b>大学<b class='flag-5'>开发出超高</b>速光电<b class='flag-5'>计算</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>是商用<b class='flag-5'>芯片</b>的<b class='flag-5'>3000</b>倍!

    中国开发芯片,算力提升3000倍!

    据了解ACCEL芯片的光学芯片部分只要采用百纳米级别工艺,而电路部分更是可以采用180纳米CMOS工艺就能生产这种芯片,用如此落后的工艺却能将芯片
    的头像 发表于 11-03 16:29 416次阅读
    中国<b class='flag-5'>开发</b>新<b class='flag-5'>芯片</b>,算力<b class='flag-5'>提升</b><b class='flag-5'>3000</b>倍!

    国际首个全模拟光电智能计算芯片的算力可提升3000

    据团队介绍,实测结果显示,该芯片在智能视觉目标识别任务方面的算力可超过目前高性能商用芯片3000倍,为超高性能
    的头像 发表于 11-08 18:23 1030次阅读
    国际首个全模拟光电智能<b class='flag-5'>计算</b><b class='flag-5'>芯片</b>的算力可<b class='flag-5'>提升</b><b class='flag-5'>3000</b>倍