电子发烧友网报道(文/李宁远)自1965年戈登摩尔提出摩尔定律以后,半导体行业在摩尔定律上已经繁荣发展了半个多世纪。芯片,已经成为时代发展的重要引擎。但随着晶体管尺寸逐渐逼近物理极限,近年来摩尔定律发展已放缓,甚至面临失效无法延续,需要建立新的芯片秩序。
而且在现在的人工智能时代,算力是无法替代的先进生产力,是人工智能、大数据、物联网等先进技术落地应用的基础支撑,而国内正处在高端算力芯片供应链被封锁的形势。如何绕开专利、技术被封锁的束缚,找出一条新的道路来也是至关重要。
与现有高端GPU相比,实现了算力提升三千余倍,能效提升四百万余倍的表现,ACCEL光电计算芯片为超高性能芯片的研发开辟了全新的路径。
ACCEL架构光电计算实现高速视觉处理性能飞跃
现在我们使用的各种设备和系统,绝大多数通过晶体管以电信号来进行计算,以现在市面上用于人工智能算力芯片内集成的晶体管数量已经以百亿、千亿来算。这些晶体管操纵电流实现超大规模的计算。
人工智能算力正在崛起成为刚需,而摩尔定律正在衰落,寻找新兴技术革新硬件计算是目前前沿科技的一大技术热点。量子计算、神经形态芯片、光子计算等都是有可能实现计算性能飞跃的技术路线,光子计算是其中有力的竞争者,近期ACCEL光电计算芯片的突破也印证了这一技术路线的可行性。
面向高速视觉任务的纯模拟光电计算芯片基于光电深度融合计算框架,将光芯片与电芯片结合,在一枚芯片上突破大规模计算单元集成、高效非线性、高速光电接口三个国际难题,由清华大学自动化系(戴琼海院士、吴嘉敏助理教授)与电子工程系(方璐副教授、乔飞副研究员)联合攻克。
不同于传统计算,光子计算不是通过将电流表示成0和1来编码和操作数据,而是利用光的物理特性来进行计算。光子计算使用光,这使得它更快、更有效、更紧凑。光子计算的确能够更快、更节能地处理视觉数据。
因此,清华大学团队提出了一种结合电子和光计算(ACCEL)的全模拟芯片架构,将衍射光学模拟计算(OAC)和电子模拟计算(EAC)融合在一个芯片中,具有可扩展性、非线性和灵活性。根据论文数据,其系统能效为74.8Peta-OPS/W,计算速度为4.6Peta-OPS,而且计算的99%都由光学部分实现。
不论是系统能效还是计算速度,和现在最先进的计算处理相比,ACCEL都有着数量级上绝对的领先。
具体来说,ACCEL的系统级算力稳定达到现有高性能芯片的数千倍,同时系统级能效较现有的高性能 GPU、TPU、光计算和模拟电计算架构,提升了两千到数百万倍不等。
对于视觉数据来说,ACCEL无疑让处理性能实现了飞跃,也表明了“挣脱”摩尔定律的全新计算架构的可行性。
全新颠覆性计算架构,助力***领域弯道超车
ACCEL架构光芯片与电芯片的融合性能的大幅提升已经被证实,而且该芯片光学部分的加工最小线宽仅采用百纳米级,而电路部分仅采用180nm CMOS工艺。如果采用更先进的工艺技术,ACCEL能进一步大幅降低更高时钟频率下运行的控制单元功耗。
成熟的工艺却实现了超越先进制程GPU的性能,未来光子计算的霸权或许不是说说而已。
根据清华团队的说法,如果将OAC层数进一步提高,ACCEL的性能将进一步提高,实现灵敏度更高的光电二极管阵列并行输出。增加SRAM位数将进一步拓展ACCEL可分类的视觉类别数量。其未来的发展还有很大的提升空间。
更高算力和更优秀的能耗比只是ACCEL两个最直观的特点,在论文中,还披露了大量技术细节。
ACCEL将衍射光学计算作为光学编码器进行特征提取后,诱导光电流直接用于进一步计算,无需模数转换器。在同一任务不同类型的数字神经网络的端到端延迟和能耗对比中,ACCEL实现了每帧72 ns的超低计算延迟和每帧4.38 nJ的能耗,远小于NVIDIA A100的每帧0.26 ms延迟和每帧18.5 mJ的能耗。
论采用哪种方式计算操作,在实际应用中实现相同精度时,ACCEL与先进GPU上的数字神经网络相比,全模拟的ACCEL都能将系统延迟和能耗降低了几个数量级。
可以说ACCEL的全新计算架构,极具颠覆性,绕过了模拟数字转换器速度、精度与功耗相互制约的物理瓶颈,充分利用了光电技术的优势,芯片实现了计算效率和能耗的极致优化。大量的实验数据对比也打消了人们对光子计算算力“有效性”的顾虑。
虽然这一技术目前还只是停留在实验室阶段,但从实际应用价值来看,这一成果对于推动芯片技术进步、降低能耗和提高计算效率具有重要意义。在国内先进制程面临制约的情况下,清华大学团队在颠覆性计算架构取得的成果给我国高性能芯片研发开辟了一条全新的路径,是打破芯片专利、技术封锁的一个方向。
光电芯片在量产后,也足够颠覆现在的半导体格局,也将在未来实际应用落地后推动人工智能等领域的创新与发展。
小结
目前,该团队正在研究规模更大、算力更强的模拟域光电融合系统,这需要在算法层面和硬件层面,开展更高层次的联合设计优化。目标应用也拓展至和高速处理相关的领域,如时延降低四个数量级的超高速图像计算、自动驾驶、野外监测、物联网传感器网络等等。
采用全新原理研发出计算芯片需要越过很多难关,不可能一蹴而就,但ACCEL的出现也意味着新一代计算架构时代的来临可能会比料想中的更早。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
光电
+关注
关注
8文章
860浏览量
83227 -
gpu
+关注
关注
28文章
5272浏览量
136074
发布评论请先 登录
相关推荐
热点推荐
告别高成本!新一代极简光端机,性能对标,价格直降近50%
互联网领域,企业均迫切需要一款兼顾严苛传输需求、成本控制与简易部署的光端机解决方案。
一、传统光端机方案陷入两难
新一代光端机极简方案顺势而生,以架构革新打破行业困境,实现高
发表于 04-23 10:09
广汽新一代智能座舱架构与电子电气架构即将发布
2026广汽科技日将于4月12日在广汽集团番禺总部举办。本届科技日以“科技向心”为主题,将发布新一代端云一体智能座舱架构、电子电气架构及
曦望发布新一代推理GPU芯片,单位Token推理成本降低90%
电子发烧友网报道 1月27日,国产GPU厂商曦望(Sunrise)重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿
今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3
曦望发布新一代推理GPU芯片启望S3 近日,浙江杭州GPU创企曦望(Sunrise)发布新一代推理GPU
发表于 01-28 11:09
•1347次阅读
这家公司研发玻璃光计算芯片,算力超传统AI推理芯片千倍
之间几乎无缝兼容,具有较高的工艺成熟度和集成便利性。然而,纯硅调制存在诸多局限性,其中最为突出的是矩阵规模扩展困难。从64×64扩大至128×128的矩阵规模,竟然间隔了三年之久,这严重制约了光计算芯片性能的提升和应用的拓展。
北大团队最新研究:AI芯片算力提升数倍,能效提升超90倍
首次实现后摩尔新器件异质集成的多物理域融合傅里叶变换系统。 这一全新计算架构将傅里叶变换计算速度从当前每秒约1300亿次提升至每秒约50
摩尔线程新一代GPU架构即将揭晓
的开发者盛会,大会以“创造、链接、汇聚(Create, Connect, Converge)”为核心理念,直面技术自立自强与产业升级的时代命题,旨在汇聚全球AI与GPU领域开发者、技术领袖、产业先锋及行业数智化转型实践者,共同探索国产算力的突破路径,擘画自主计算生态的崭新
亚马逊发布新一代AI芯片Trainium3,性能提升4倍
Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。 作为亚马逊首款3纳米工艺AI芯片,
Nordic新一代NRF54高性能蓝牙, 赋能更多穿戴戒指行业客户产品
nRF54L15芯片去开发智能戒指产品,其处理能力较上一代系统级芯片提升一倍,处理效率提高三倍,使智能戒指能够整合多款高
发表于 11-26 17:19
中科驭数亮相2025新一代计算产业大会
近日,由中国电子工业标准化技术协会指导、新一代计算标准工作委员会(以下简称 “新一代计算标工委”)主办,中科驭数、Intel 及经开区国家信创园联合承办的
新一代智己LS6采用瑞丰光电Mini LED背光技术
近日,新一代智己LS6正式首发并开启预售,凭借着全新外观造型以及首次搭载增程式动力,一经推出便成为现象级爆款。值得一提的是,该车型全系标配Mini LED车载屏,瑞丰光电为
今日看点丨优必选获得2.5亿大单;象帝先新一代“伏羲”架构芯片完成流片验证
象帝先新一代“伏羲”架构芯片完成流片验证 9月3日,安孚科技在互动平台表示,象帝先研发的新一代“伏羲”架构
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理
前言
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯
发表于 06-18 19:31
iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。
性能强
iTOP-3588S开发板采用瑞芯微RK3588S处理器,是全新一代AloT高端应用芯片,搭载八核64位CPU,四核Cortex-A76和四核Cortex-A55架构主频高达2
发表于 05-15 10:36
ACCEL光电芯片,性能超GPU千倍,新一代计算架构将更早来临
评论