0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华人学者Nature上发表最新成果 世界最快光子AI加速器

工程师邓生 来源:《Light: Science & App 作者:徐兴元 2021-01-11 15:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工神经网络广泛应用于人脸识别、语音翻译、医疗诊断、自动驾驶等重要领域,其性能主要由硬件算力决定,目前所广泛应用的神经网络硬件都基于数字电子架构。然而,该架构的两个本质局限—冯诺曼依瓶颈与电子速率瓶颈,极大限制了神经网络硬件的潜在算力。首先,数字架构中,数据的存储和运算是分布式的,因而在计算过程中,会有大量的能源和算力消耗在数据的反复读取和存储中,此限制被称为冯诺曼依瓶颈。其次,由于电子微处理器中的寄生电容和互联时延问题,电子系统存在着本质的带宽限制,导致电子微处理器的主频事实上在过去十年已没有明显提升,此限制也被称为电子速率瓶颈。

光子神经网络工作于模拟架构中,即数据在硬件系统中的实时位置与进行运算的位置相同,因而规避了冯诺曼依瓶颈。此外,宽达数十太赫兹的光谱也为高速运算提供了充足的带宽。目前已有来自加州大学、麻省理工学院、明斯特大学等单位的研究团队做出了一系列在网络尺度、可集成性、片上存储等方面的突破,然而尚未能实现较高运算速度与高维数据处理能力,光子神经网络的超高运算潜力尚未得到证实。

近日,澳大利亚研究人员徐兴元博士(莫纳什大学)、谭朦曦博士、David Moss教授(斯文本科技大学)、Arnan Mitchell教授(皇家墨尔本理工大学)等首次提出并实现了基于波长、时间交织的光子卷积加速器。该文章以“ 11 TOPS photonic convolutional accelerator for optical neural networks”为题发表在Nature。

研究人员通过采用集成高品质因素、高非线性微环与波导色散调控,实现了高相干度、易于产生的集成克尔孤子晶体光频梳。

研究人员将该光频梳进行频域整形并且与高速光电调制相结合,实现了输入数据在并行波长通道上的组播与加权,然后采用光学色散介质作为缓存,对组播信号进行了步进延时(步长为单个码元时长),从而在时域上对齐了不同波长通道中需要加权求和的码元,最后通过光电转换实现处理结果的高速实时读取(如图1所示)。通过这一系列步骤,波长构架的卷积窗口(感知域)即可在时域以超过60GBaud的速率滑动,结合克尔光频梳所实现的高并行度(C波段90个波长通道),实现了11 TOPS(太运算每秒)的运算速度,即每秒可完成11万亿次运算。

1610351104722.jpg

图1 卷积加速器工作原理

图源:Nature 589, 44–51 (2021)。 Fig 1

通过这一系列步骤,数学模型抽象的神经元突触就被光频梳在实际物理系统中实现,其中突触连接的权重由光频梳的光功率体现。最终实验验证了高维图片处理(实验结果如图2所示)以及深度学习光子卷积神经网络(实验结果如图3所示)。

1610351144513.jpg

图2 卷积图像处理结果

图源:Nature 589, 44–51 (2021)。 Fig 3

在国际相关研究成果的基础上实现了数个突破,包括:

1. 由于集成克尔光频梳所提供的大量波长通道,运算速度首次突破到11 TOPS以上;

2. 首次实现了利用光学手段进行高维数据处理(25万像素点),为光子神经网络的进一步实际应用如人脸识别等展现了可能;

3. 实现了500张MINIST手写数字图片的高速分类预测,准确率达到88%以上;

4. 实现了具备高速光电接口的硬件加速器,速度可达64G Baud以上,并且可与现有电子或者光学硬件兼容互联;

5. 结合应用了集成克尔光频梳,为实现光子神经网络的单片集成奠定了基础。

1610351182692.jpg

图3 卷积神经网络50张手写数字识别结果。上图为全连接层神经元输出幅度,下图为混淆矩阵。

图源:Nature 589, 44–51 (2021)。 Fig 6

后续,研究人员将继续优化本方案的性能指标,如处理速度、并行度、体积与可集成性、功耗等。本工作实验证明了光子神经网络硬件的运算潜力,并且具有高速光电接口,未来可作为通用卷积特征提取前端与其他光电模数架构互联,在卷积神经网络中可承担70%以上的运算负荷,大幅提升系统整体算力,在未来实时人工智能应用场景如无人驾驶、医疗诊断等方面有重要应用。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 晶体管
    +关注

    关注

    78

    文章

    10284

    浏览量

    146488
  • 人工智能
    +关注

    关注

    1813

    文章

    49780

    浏览量

    261862
  • 光子芯片
    +关注

    关注

    3

    文章

    110

    浏览量

    25195
  • AI加速器
    +关注

    关注

    1

    文章

    73

    浏览量

    9442
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备
    的头像 发表于 11-06 13:42 475次阅读
    边缘计算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>类型与应用

    亚马逊云科技第三期创业加速器圆满收官 助力初创释放Agentic AI潜力 加速全球化进程

    北京——2025年10月28日 ,亚马逊云科技第三期创业加速器项目圆满收官。35家入营企业齐聚一堂,分享了各自的业务发展情况,以及参与本期加速器的收获及体验。第三期创业加速器持续聚焦AI
    的头像 发表于 10-29 15:18 783次阅读

    航裕电源以大电流技术为国内外超导加速器项目提供优质方案

    航裕电源:以大电流技术,护航尖端科技 大科学装置建设热潮中,超导加速器作为探索微观世界、推动前沿科研的 “国之重”,对供电系统的稳定性、精度及功率提出极致要求。航裕电源以31.5kA、80kA万安
    的头像 发表于 10-12 15:02 1306次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    、Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块化的指令集架构(ISA)。优势如下: ①模块化特性②标准接口③开源
    发表于 09-12 17:30

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习
    的头像 发表于 08-20 17:43 1937次阅读

    Arm神经技术是业界首创在 Arm GPU 增添专用神经加速器的技术,移动设备实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 增添专用神经加速器的技术,首次在移动设备实现 PC 级别的 AI 图形性能,为未来的端侧 AI
    的头像 发表于 08-14 17:59 2535次阅读

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境中对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器技术现已发展成为集高能物理、核物理、
    的头像 发表于 06-19 12:05 2623次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    机器学习赋能的智能光子学器件系统研究与应用

    与应用 在人工智能与光子学设计融合的背景下,科研的边界持续扩展,创新成果不断涌现。从理论模型的整合到光学现象的复杂模拟,从数据驱动的探索到光场的智能分析,机器学习正以前所未有的动力推动光子学领域的革新。据调查,目前在
    的头像 发表于 06-04 17:59 463次阅读
    机器学习赋能的智能<b class='flag-5'>光子</b>学器件系统研究与应用

    基于双向块浮点量化的大语言模型高效加速器设计

    本文提出双向块浮点(BBFP)量化格式及基于其的LLMs加速器BBAL,通过双向移位与重叠位设计显著降低量化误差,提升非线性计算效率,实现精度、吞吐量和能效的显著优化,相关成果被国际顶级会议 DAC 2025 接收。
    的头像 发表于 05-14 13:40 2127次阅读
    基于双向块浮点量化的大语言模型高效<b class='flag-5'>加速器</b>设计

    光子 AI 处理的核心原理及突破性进展

    电子发烧友网(文 / 李弯弯)光子 AI 处理,作为一种借助光子执行信息处理与人工智能(AI)计算的新型硬件设备,正逐渐崭露头角。与传统基
    的头像 发表于 04-19 00:40 3713次阅读

    曦智科技时隔八年再登《Nature》,光电混合计算架构首次公开

    英国伦敦时间4月9日,全球顶级学术期刊《自然》(Nature)刊载了曦智科技的光电混合计算成果:《超低延迟大规模集成光子加速器》(An integrated large-scale p
    发表于 04-10 09:50 1306次阅读
     曦智科技时隔八年再登《<b class='flag-5'>Nature</b>》,光电混合计算架构首次公开

    嵌入式AI加速器DRP-AI 详细介绍

    的嵌入式设备。此外,人工智能正在不断发展,新的算法不时被开发出来。 在人工智能快速发展的过程中,瑞萨开发了人工智能加速器(DRP-AI)和软件(DRP-AI翻译),既提供高性能又提供
    的头像 发表于 03-15 16:13 1550次阅读
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 详细介绍

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    。• AI加速器的开发:FPGA被广泛用于开发专为AI算法优化的加速器,例如深度学习推理加速器。这种定制化的硬件设计能够显著提升
    发表于 03-03 11:21

    消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

    近日,据外媒 videocardz 报道,参考 AMD 最新推出的 AMD - GFX 补丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器设计将有重大变革,其将配备 8
    的头像 发表于 02-05 15:07 1406次阅读

    苹果加入UALink联盟,共推AI加速器新标准

    苹果公司已正式成为Ultra Accelerator Link(UALink)联盟的一员,并获得了该联盟董事会席位。UALink联盟由超过65家成员组成,专注于开发下一代人工智能加速器架构,旨在推动AI技术的快速发展。
    的头像 发表于 01-22 18:18 1184次阅读