0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种让AI更快的可重构处理器

芯长征科技 来源:半导体行业观察 作者:半导体行业观察 2022-12-09 10:27 次阅读

深度学习是一种关键的计算方法,它正在推动技术的发展——处理海量数据并发现人类永远无法自行辨别的微妙模式。但为了获得最佳性能,深度学习算法需要得到正确的软件编译器和硬件组合的支持。特别是,允许根据需要灵活使用硬件资源进行计算的可重构处理器是关键。

在最近的一项研究中,香港的研究人员报告了一种名为 ReAAP 的新型可重构处理器,其性能优于几种常用于支持深度神经网络 (DNN) 的计算平台,深度学习是一种有用的形式,通常涉及具有许多计算密集型的大型数据集数据层。他们在 10 月 10 日发表在IEEE Transactions on Computers上的一篇论文中对其进行了描述。

在他们的研究中,研究人员将他们在 ReAAP 中提出的软件编译器与 Nvidia GPUARM CPU 上的其他三个基线软件编译器进行了比较。结果表明,它的执行速度是运行在GPU并且是运行相同软件编译器的 1.6 到 3.3 倍在中央处理器上.

此外,Zheng 指出,ReAAP 为各种不同的计算密集层实现了硬件资源的持续高利用率。

虽然 ReAAP 擅长处理具有典型数据密集型工作负载的 DNN,但它目前不太适合在数据稀疏时支持 DNN。郑说他的团队希望在未来解决这个问题。更重要的是,研究人员希望以 ReAAP 为基础,使其能够更好地处理量化数据(处理的数据以一种显着降低神经网络的内存需求和计算成本的方式)。

“在 [ReAAP 更好地处理量化数据] 的扩展完成和评估后,我们将考虑将其与其他几个人工智能计算加速解决方案一起商业化,”郑说,并指出这将使 ReAAP 在资源方面更有效率受限平台,例如各种物联网 (IoT) 设备。

而普通处理器通常允许数据使用特定的硬件路径进行处理,可重构处理器提供了一种更具适应性的选择:重新配置最有效的硬件资源以根据需要处理数据。

“可重构处理器结合了软件灵活性和硬件并行性的优势,”参与该研究的香港科技大学电子与计算机工程系博士后研究员郑建伟解释道。

这些优势促使他的团队创建了 ReAAP,这是一个集成的软硬件系统。它的软件编译器负责评估和优化各种深度学习工作负载。一旦确定了并行处理数据的最佳解决方案,它就会发送指令重新配置硬件协处理器,从而分配适当的硬件资源来进行并行计算。“作为端到端系统,ReAAP 可以部署以加速各种深度学习应用程序,只需在 [the] 软件中为每个应用程序定制一个 Python 脚本,”Zheng 解释说。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18299

    浏览量

    222307
  • AI
    AI
    +关注

    关注

    87

    文章

    26478

    浏览量

    264107
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24360

原文标题:一种让AI更快的可重构处理器

文章出处:【微信号:芯长征科技,微信公众号:芯长征科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    国产兆芯主板GM9-6002采用KX-U6780A处理器#兆芯处理器

    处理器主板
    国产计算机小秦
    发布于 :2024年04月13日 13:58:31

    国产GPU搭配国产处理器平台主机

    处理器gpu
    GITSTAR 集特工控
    发布于 :2024年03月27日 14:11:32

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传
    发表于 03-12 08:09

    瑞萨发布下一代动态可重构人工智能处理器加速器

    瑞萨最新发布的动态可重构人工智能处理器(DRP-AI)加速器,在业界引起了广泛关注。这款加速器拥有卓越的10 TOPS/W高功率效率,相比传统技术,效率提升了惊人的10倍。其独特之处在于,它能在低功耗的传统嵌入式
    的头像 发表于 03-08 13:45 257次阅读

    ARM处理器7工作模式

    中需要用到的每一种模式都要给SP定义个堆栈地址。方法是改变状态寄存(CPSR)内的状态位,使处理器切换到不同的状态,然后给SP赋值。注意:不要切换到User模式进行User模式的堆
    发表于 12-15 10:15

    英特尔新处理器,掀AI PC战火

    随着ai时代的到来,英特尔正在构想新的酷睿Ultra处理器(代号Meteor Lake),这是英特尔的第一个基于npu的处理器,旨在在pc上应用ai加速和边缘推理。meterlake采
    的头像 发表于 12-11 11:26 526次阅读

    青稞处理器资料分享

    )、精简的两线和单线调试接口、“WFE”指令、物理内存保护(PMP)等特色功能,详细说明参考青稞微处理器手册。 特色功能 1.硬件压栈(HPE) 稞处理器开启硬件压栈后,当发生中断,硬件自动将
    发表于 10-11 10:42

    基于IDE构建用于STM32微处理器的完整人工智能项目

    本用户手册指导了基于 IDE 逐步构建用于 STM32 微处理器的完整人工智能(AI)项目,自动转换预训练好的神经网络(NN)并集成所生成的优化库。本手册还介绍了 X-CUBE-AI 扩展包,该扩展
    发表于 09-07 06:15

    AI芯片和处理器的区别

      AI芯片是一种专门用于人工智能计算的集成电路。相较于传统的通用微处理器AI芯片具备更优秀的高性能和低功耗等特点,能够加速训练和推理过程,是目前在人工智能领域广泛应用的重要基础设施
    的头像 发表于 08-08 16:43 1371次阅读

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon扩展处理器约占运行AI推理的
    发表于 08-04 07:25

    ARM920T处理器技术参考手册

    处理器核心是一种哈佛体系结构的设备,使用由Fetch、Decode、Execute、Memory和Write阶段组成的五级流水线实现。它可以作为个独立的核心提供,可以嵌入到更复杂的设备中。独立内核有
    发表于 08-02 13:05

    ARM 946E-S合成处理器技术参考手册

    ARM946E-S是合成处理器,结合了ARM9E-S™ 具有可配置存储系统的处理器核心。它是ARM9E的成员™ 高性能32位片上系统
    发表于 08-02 10:17

    AI 人工智能的未来在哪?

    人工智能、AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一种威胁;谷歌前CEO施密特认为AI和机器学习对人类有很大益处。 每个国家
    发表于 06-27 10:48

    昇腾AI处理器:Ascend310和CANN简介

    Ascend310 AI处理器逻辑架构昇腾AI处理器的主要架构组成:芯片系统控制CPU(Control CPU)AI计算引擎(包括
    发表于 06-05 14:09 6501次阅读
    昇腾<b class='flag-5'>AI</b><b class='flag-5'>处理器</b>:Ascend310和CANN简介

    求推荐与RT1172处理器起使用的推荐JTAG调试/编程的信息?

    我正在寻找与 RT1172 处理器起使用的推荐 JTAG 调试/编程的信息?此外,我希望对与 JTAGC 控制
    发表于 05-06 08:24