0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

光子处理器:加速光学计算领域的变革

ss 来源:学术头条 作者:学术头条 2021-01-08 16:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们身处于一个数据、信息量爆炸性增长的时代,一个由 AI 引领的、更加智能的时代。

但是,持续增加的数据量在为人工智能(AI)提供源源不断的“动力”的同时,也对用于 AI 的电子计算硬件提出了更多的挑战,无论是在计算速度,还是在功耗方面,都已经成为严重制约 AI 发展的主要瓶颈之一。

如今,随着用于自动驾驶汽车和语音识别机器学习方法的出现,这种数据增加的上升趋势仍将继续下去。所有这些,都给当前的计算机处理器在满足人们需求方面带来了沉重的负担。

好在,一个由多国科学家组成的团队已经开始着手解决这个问题。最新研究进展以“Parallel convolutional processing using an integrated photonic tensor core”为题,于 1 月 6 日发表在顶级科学期刊《自然》(Nature)上。

据论文描述,研究人员开发了一种新的方法和架构,通过使用基于光的处理器或光子处理器,将处理和数据存储结合到单个芯片上。研究结果首次证明,这些设备可以快速并行处理信息,而这种能力是现有电子芯片无法做到的。

研究人员表示,通过这种利用光的独特属性来加速 AI 处理的方式,可能会加速光学计算领域的变革。

新型硬件系统的发展

随着 AI 的兴起,传统的电子计算方法逐渐达到了其性能极限,并且滞后于可处理数据的快速增长。在各种类型的 AI 系统中,人工神经网络由于优异的性能而被广泛应用于 AI 任务,这些网络使用多层相互连接的人工神经网络进行复杂的数学运算。

为了加速人工神经网络的处理,人们已经做出了各种努力来设计和实现特定的电子计算系统。特别值得一提的是,人们在专用集成电路、大脑灵感计算和内存计算等定制芯片的应用上,已经取得了相当大的成功,这些芯片通过一系列称为忆阻器的内存设备直接进行处理。

在电子计算中,电子是信息的载体,但一直以来光子都被认为是一种更优的替代选择。因为光谱覆盖的波长范围很广,不同波长的光子可以同时多路复用(并行传输)和调制(通过改变它们可以携带信息),而不会使光信号相互干扰。

这种以光速传播信息的方式能达到目前最小的时间延迟。此外,无源传输有助于实现超低功耗,而相位调制可以轻松调制并检测出频率高于 40 千兆赫的光。

在过去的几十年里,光纤通信取得了巨大的成功。然而,使用光子进行计算仍然具有一定的挑战性,特别是在规模和性能水平上,其与最先进的电子处理器相比更具挑战性。这一困难来自于缺乏合适的并行计算机制、使用材料来允许人工神经元的高速非线性响应以及可扩展的光子器件来集成到计算硬件中。

幸运的是,过去几年来,光学频率梳(Optical Frequency Combs)的发展为集成光子处理器带来了新的机会。光学频率梳是一组光源,其发射光谱由数千或数百万条频率均匀且间隔紧密的清晰谱线组成。这些器件在光谱学、光学时钟计量和电信等领域取得了巨大的成功,其可以集成到计算机芯片中,并用作光学计算的高效能源,非常适合采用波分复用技术(WDM)进行数据并行处理。

光子处理器:为 AI 加速

在此次工作中,研究人员成功研制了一个集成光子处理器,该处理器可以对跨越二维空间的光信号进行卷积处理。该设备在基于相变材料(一种可以在非晶相和晶相之间切换的材料)的“内存”计算架构中使用光学频率梳。

通过波长复用,该处理器可以对输入数据进行充分的并行化处理,并利用相变材料的集成单元阵列进行类似的矩阵矢量乘法运算。

(来源:Nature)

该团队也针对矩阵—向量乘法开发了一个硬件加速器。由于不同波长的光不会相互干扰,研究人员可以使用多个波长的光进行并行计算。

为了做到这一点,他们使用了洛桑联邦理工学院(EPFL)开发的另一项创新技术,一种基于芯片的“频率梳”,并以此作为光源。频率梳可以提供各种不同的光波,这些光波在同一个光子芯片中相互独立地处理。

该研究的负责人之一、EPFL 的 Tobias Kippenberg 教授说:“我们的研究首次将频率梳应用于人工神经网络领域。” Kippenberg教授在频率梳发展方面做出开创性的研究工作。

同时,该研究的负责人之一、明斯特大学(WWU)的 Wolfram Pernice 教授也表示:“在机器学习领域,用于加速任务的光子处理器使复杂的数学任务能够以很高的速度和处理量处理,这比依赖电子数据传输的传统芯片快得多。”

在设计和制造完光子芯片后,研究人员在一个可识别手写数字的神经网络上对其进行了测试。这些网络受到生物学的启发,是机器学习领域的一个概念,主要用于图像或音频数据的处理。

论文的第一作者之一 Johannes Feldmann 表示:“输入数据和一个或多个过滤器之间的卷积运算非常适合我们的矩阵体系结构。利用光进行信号传输使处理器能够通过波分多路复用执行并行数据处理,这保证了更高的计算密度,并且仅需一个时间步长就可以进行许多矩阵乘法。与通常在较低频率工作的传统电子设备相比,光调制速度可以达到 50-100GHz 范围。”

牛津大学的 Nathan Youngblood 认为,“利用波分多路复用可以实现更高的数据速率和计算密度,也就是处理器单位面积上的操作,这是以前无法实现的。”

这种高度并行化的框架,有可能在单个步骤中高速处理整个图像。在不久的将来,该系统可以通过使用商业制造程序和辅助现场机器学习来进行大规模扩展。

新型硬件的巨大应用潜力

由于卷积过程涉及到无源传输,所以理论上光子处理核心的计算能以光速和低功耗来进行。这种能力对于能源密集型应用程序非常有价值,比如应用在云计算中。

鉴于传统电子计算方法面临的挑战,集成光子学的出现是令人兴奋的。它作为一个潜在的“接班人”,为未来的计算架构实现前所未有的性能。

然而,建造一个实用的光学计算机仍将需要广泛的跨学科努力和材料科学、光子学、电子学等领域的研究人员之间的合作。

尽管报道的光子处理器具有较高的单位面积计算能力和潜在的可扩展性,但全光学计算规模仍然很小。此外,由于存在固有的吸收光的计算元件,以及光电信号经常需要转换,能源效率会受到一些限制。

未来另一个研究方向是,发展先进的非线性集成光子计算架构,而不是单一或二维的线性卷积。

通过将电子电路和数千或数百万个光子处理器集成到一个合适的架构中,一种同时利用光子和电子处理器的混合光电框架,或许在不久的将来可以彻底改变 AI 硬件。未来,这种硬件将在通信、数据中心营运和云计算等领域具有十分重要的应用。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20158

    浏览量

    247643
  • AI
    AI
    +关注

    关注

    90

    文章

    38271

    浏览量

    297302
  • 光子
    +关注

    关注

    0

    文章

    119

    浏览量

    15212
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于E203 NICE协处理器扩展指令

    国一的协处理器应用 (1) 概念 领域特定架构(Domain SpecificArchitecture,DSA),使用特定的硬件做特定的事情[18],也就是说,将主处理器和协处理器
    发表于 10-21 14:35

    利用e203中NICE协处理器加速滤波运算

    和加法器的方法来加速滤波运算。 使用NICE协处理器加速的程序为一个长循环,计算较长(100到1000量级)的两个浮点数组乘累加的结果,分别命名为ifm (Input Feature
    发表于 10-21 13:40

    基于E203 NICE协处理器扩展指令2.0

    应用 (1) 概念 领域特定架构(Domain Specific Architecture,DSA),使用特定的硬件做特定的事情[18],也就是说,将主处理器和协处理器加速器适当扩展
    发表于 10-21 10:39

    基于e203中NICE协处理器加速滤波运算

    和加法器的方法来加速滤波运算。 使用NICE协处理器加速的程序为一个长循环,计算较长(100到1000量级)的两个浮点数组乘累加的结果,分别命名为ifm (Input Feature
    发表于 10-21 09:54

    EtherCAT科普系列(13):EtherCAT技术在电感信号处理器领域的应用

    的电感传感信号处理器,对电感传感的信号进行采集、处理、模数转换等操作,最终将测得信号传输给计算机并进行相应的分析
    的头像 发表于 06-20 11:21 614次阅读
    EtherCAT科普系列(13):EtherCAT技术在电感信号<b class='flag-5'>处理器</b><b class='flag-5'>领域</b>的应用

    明远智睿SSD2351开发板:语音机器人领域变革力量

    的四核1.4GHz处理器具备强劲的运算性能,能够高效处理语音机器人运行过程中的复杂任务。语音识别和合成需要大量的计算资源,该处理器可以快速对语音信号进行分析、
    发表于 05-28 11:36

    光子 AI 处理器的核心原理及突破性进展

    电子发烧友网(文 / 李弯弯)光子 AI 处理器,作为一种借助光子执行信息处理与人工智能(AI)计算的新型硬件设备,正逐渐崭露头角。与传统基
    的头像 发表于 04-19 00:40 3713次阅读

    AI MPU# 瑞萨RZ/V2H 四核视觉 ,采用 DRP-AI3 加速器和高性能实时处理器

    RZ/V2H 高端 AI MPU 采用瑞萨电子专有的AI 加速器-动态可重配置处理器 (DRP-AI3)、四核 Arm^®^ Cortex ^®^ -A55 (1.8GHz) Linux 处理器
    的头像 发表于 03-15 11:50 1954次阅读
    AI MPU# 瑞萨RZ/V2H 四核视觉 ,采用 DRP-AI3 <b class='flag-5'>加速器</b>和高性能实时<b class='flag-5'>处理器</b>

    端侧 AI 音频处理器:集成音频处理与 AI 计算能力的创新芯片

    电子发烧友网综合报道:端侧 AI 音频处理器是专为智能物联网(AIoT)端侧设备设计,集成了人工智能(AI)加速器的系统级音频处理器。这类处理器旨在打造低功耗、高算力的芯片平台,以满足
    的头像 发表于 02-16 00:13 3129次阅读

    RK3399Pro处理器:高性能与AI加速的完美结合

    RK3399Pro是一款高性能处理器,专为需要强大计算能力和人工智能加速的应用场景而设计。其主要特性如下: 高性能CPU核心:搭载双核Cortex-A72处理器,主频高达1.8GHz,
    的头像 发表于 02-07 18:11 1423次阅读

    处理器和芯片的区别是什么 处理器是指cpu吗

    一、处理器和芯片的区别 处理器和芯片是两个在电子领域中经常出现的术语,它们虽然有一定的联系,但在定义、功能、结构及应用场景等方面存在显著的差异。 定义与构成 处理器(Processor
    的头像 发表于 02-01 14:59 7985次阅读

    量子处理器的作用_量子处理器的优缺点

    量子处理器(QPU),又称量子级计算处理器,是量子计算机中的核心部件,其作用主要体现在以下几个方面:   一、高速计算
    的头像 发表于 01-27 13:44 1573次阅读

    量子处理器是什么_量子处理器原理

    量子处理器(QPU)是量子计算机的核心部件,它利用量子力学原理进行高速数学和逻辑运算、存储及处理量子信息。以下是对量子处理器的详细介绍:
    的头像 发表于 01-27 11:53 1845次阅读

    从数据中心到量子计算光子集成电路引领行业变革

    来源:Yole Group 光子集成电路正在通过实现更快的数据传输、推进量子计算技术、以及变革医疗行业来彻底改变多个领域。在材料和制造工艺的创新驱动下,
    的头像 发表于 01-13 15:23 1031次阅读

    QorIQ®T1042多核处理器

    QorIQ®T1042多核处理器T1042 QorIQ高级多核处理器综合了数据网络、电信/数据通讯、无线网络基础设施和国防军事/航天工程应用所需要的性能卓越数据线路加速及网络和外围总线接口
    发表于 01-10 08:48