0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用粗粒度可重构阵列加速处理

星星科技指导员 来源:嵌入式计算设计 作者:Monique DeVoe 2022-06-14 10:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着性能需求的增加和对低功耗设计的推动,需要更有效的方法来执行处理任务,因为由于功率限制,将更多处理器投入性能问题不再可行。加速器旨在以更快的速度和更低的功耗进行计算,但今天的加速器在功耗和性能方面存在缺陷。

加速器阵容

亚利桑那州立大学计算、信息学和决策系统工程学院副教授 Aviral Shrivastava 正在对可编程加速器进行研究,以增强当今的加速技术。Shrivastava 列出了当今使用的三种常见类型的加速器:硬件加速器、FPGAGPU。硬件加速器将特定的计算元素专用于处理计算,而不是在 CPU 上运行它们。它们速度快、功耗低,但不适合当今快速变化的技术迭代,因为它们不可编程。FPGA 是可编程的——开发人员可以在其上编写任何逻辑并且它们可以充当加速器——但 Shrivastava 说它们通常过于通用并且消耗太多功率。GPU 是当今流行的加速器,

粗粒度可重构阵列

Shrivastava 正在开发粗粒可重构阵列 (CGRA),它可以加速非并行循环,并在 GPU 的并行循环优势之上实现更多加速功能。CGRA 由一个由算术逻辑单元 (ALU) 和寄存器组成的二维网格组成,这些单元接收输入和指令,计算指令的算术或逻辑运算,并将输出发送给它的四个邻居以计算下一个步骤(图 1)。

图 1:粗粒度可重构阵列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潜力来自于他们能够在消耗很少的电力的情况下执行操作。在常规处理器中执行加法运算需要很大的功率:它必须经过 20 多个流水线阶段。在 CGRA 中,只需要从邻居那里获取操作数并执行加法运算。CGRA 可以通过流水线加速——循环的操作被布置在 CGRA 的 PE 上,数据在它们之间流动。

CGRA 本身并不新鲜,但开发人员对现有的 CGRA 进行编程以仅执行一种类型的计算。Shrivastava 说,挑战在于映射,因为循环内核需要映射到 CGRA,操作映射到节点,数据依赖关系映射到 CGRA 的路径。Shrivastava 的目标是消除耗时的手动编码,并使任何类型的循环或计算能够通过编译器映射到 CGRA,这是一种相对较新的方法。他正在开发一个生成映射代码的编译器工具链。

Shrivastava 说 CGRA 的研究引起了 IBM 的兴趣,IBM 希望将这种方法应用于并行循环轻型服务器应用程序。用于科学研究和多媒体扩展的图形和高性能计算也可以从使用 CGRA 中获益。

解决分支分歧问题

所有现有加速技术面临的一个挑战是“分支分歧”。当执行具有“if-then-else”结构的循环时,加速器分配资源以执行来自分支的两条路径(真路径和假路径)的指令,然后丢弃假路径指令的影响。FPGA 将两个路径的功能映射到计算资源上,GPU 执行来自两个分支路径的指令并丢弃错误路径指令的结果。加速器必须这样做,因为在分配分支路径资源时,分支的结果在编译时是未知的(分支的结果是在运行时计算的,当执行分支时)。这种冗余执行会导致分支花费双倍的性能时间和执行能力。

Shrivastava 和他的团队提出了通过智能硬件-软件协同设计解决分支分歧问题的方法。不是为真路径分配一些PE,而为假路径分配一些PE,而是分配相同的PE来执行来自两条路径的指令。来自真路径和来自假路径的指令都发给PE。在运行时,PE 只选择正确的一个来执行。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20380

    浏览量

    255624
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5322

    浏览量

    136213
  • 编译器
    +关注

    关注

    1

    文章

    1673

    浏览量

    52076
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [FRED] FRED案例:矩形微透镜阵列

    介绍 小透镜阵列可应用在很多方面,其中包含光束均匀化。本文演示了一个用于在探测器上创建均匀的非相干照度的成像微透镜阵列的设计。输入光束具有高斯轮廓,半宽度等于微透镜阵列大小,并且显示了其功率轮廓被微
    发表于 05-21 08:13

    探索TRAC020LH:完全重构模拟电路的卓越之选

    探索TRAC020LH:完全重构模拟电路的卓越之选 在模拟信号处理的领域中,不断追求更高效、更灵活的解决方案是电子工程师们永恒的目标。今天,我们就来深入了解一款备受瞩目的产品——TRAC020LH
    的头像 发表于 03-27 14:30 213次阅读

    复合机器人重构柔性装配 赋能智能制造产线全面升级

    一、智能制造升级浪潮下 重构柔性装配成工业核心刚需 在工业 4.0 深度推进与中国制造 2025国家战略落地的背景下,制造业正从传统规模化批量生产向多品种、小批量、定制化生产模式转型,这一
    的头像 发表于 03-05 17:58 1210次阅读
    复合机器人<b class='flag-5'>可</b><b class='flag-5'>重构</b>柔性装配 赋能智能制造产线全面升级

    10AX022C3U19I2SG现场可编程门阵列(FPGA)芯片

    :13,752,320位,支持高速数据缓存与处理性能特点高性能逻辑处理能力l 基于220,000个逻辑单元,实现复杂数字信号处理(DSP)、算法
    发表于 02-27 09:31

    高压放大器在激励低频重构磁电天线中的应用

    根据磁电天线的机械振荡原理,本研究提出了一种基于机械调节方法的超低频重构磁电天线。该磁电天线的多维性能,如工作频率、带宽和品质因数(Q),可以在不破坏天线结构的情况下在很大的动态范围内进行调整
    的头像 发表于 01-16 16:32 277次阅读
    高压放大器在激励低频<b class='flag-5'>可</b><b class='flag-5'>重构</b>磁电天线中的应用

    AMD利用重构FPGA设备Moku实现自定义激光探测解决方案

    摘要本文介绍了AdvancedMicroDevices,AMD公司如何基于重构FPGA设备自定义激光探测解决方案,替代传统的仪器配置,通过灵活且定制的FPGA设备Moku提供更高效和灵活的激光
    的头像 发表于 11-20 17:28 1978次阅读
    AMD利用<b class='flag-5'>可</b><b class='flag-5'>重构</b>FPGA设备Moku实现自定义激光探测解决方案

    AES和SM4算法的重构分析

    一、AES和SM4算法特点分析 基于前面几篇分享,我们对AES和SM4的算法流程有了较为清晰的认识,接下来对AES和SM4算法的共同点进行分析,得出二者的重构设计思路。 首先,这里把AES
    发表于 10-23 07:26

    瑞萨电子RZ/V系列微处理器助力边缘AI开发

    边缘AI越来越多地应用于诸如工业摄像头和公共设施摄像头等嵌入式设备中,并要求嵌入式产品小型化且具有低功耗。瑞萨电子RZ/V系列微处理器(MPU)内置AI加速器,即动态重构
    的头像 发表于 09-23 10:31 1195次阅读
    瑞萨电子RZ/V系列微<b class='flag-5'>处理</b>器助力边缘AI开发

    FlashDB 的TSDB不支持写粒度为128,是出于什么考虑有这样的限制?

    FlashDB 的TSDB不支持写粒度为128,是出于什么考虑有这样的限制? 如果我希望把这个数据库移植到这样的一个mcu上,我们应该怎么做,有些建议吗。 感谢各位大佬指点。
    发表于 09-23 08:19

    阵列式雷达流量监测站-案例分享

    (水位)和水面流速,进而计算出流量。一、工作原理阵列雷达技术:采用多天线阵列同时发射多个雷达波束,覆盖更广的水面区域。非接触式测量:安装在水面上方(如桥梁、支架)
    的头像 发表于 09-11 16:31 1545次阅读
    <b class='flag-5'>阵列</b>式雷达流量监测站-案例分享

    ATA-7010高压放大器:开启低频重构磁电天线激励的新篇章

    根据磁电天线的机械振荡原理,本研究提出了一种基于机械调节方法的超低频重构磁电天线。该磁电天线的多维性能,如工作频率、带宽和品质因数(Q),可以在不破坏天线结构的情况下在很大的动态范围内进行调整
    的头像 发表于 08-30 10:43 750次阅读
    ATA-7010高压放大器:开启低频<b class='flag-5'>可</b><b class='flag-5'>重构</b>磁电天线激励的新篇章

    AI 智能重构测试测量平台,Moku:Delta集成业内首创“生成式仪器”

    。基于“软件定义+硬件重构”的平台架构,LiquidInstruments最新发布业内首创的“生成式仪器技术(GenerativeInstrumentation)”集
    的头像 发表于 07-15 11:34 864次阅读
    AI 智能<b class='flag-5'>重构</b>测试测量平台,Moku:Delta集成业内首创“生成式仪器”

    重构测试 智变升级|全新一代智能测控平台Moku:Delta发布!

    LiquidInstruments推出第四代智能测控平台#Moku:Delta,延续并升级了Moku系列一贯的“软件定义+硬件重构”设计理念,结合2GHz瞬时带宽、超低噪声和高分辨率前端设计,实现
    的头像 发表于 06-25 17:04 1230次阅读
    <b class='flag-5'>重构</b>测试 智变升级|全新一代智能测控平台Moku:Delta发布!

    清微智能官宣:国产重构芯片全球出货量突破2000万颗

    近日,由北京智源人工智能研究院主办的第7届北京智源大会成功举办。作为国产原创重构芯片架构领导者,清微智能受邀出席,向大众展示了前沿高阶国产算力技术成果。 在本次大会上,清微智能首次官宣,公司
    的头像 发表于 06-12 17:15 2162次阅读
    清微智能官宣:国产<b class='flag-5'>可</b><b class='flag-5'>重构</b>芯片全球出货量突破2000万颗

    ​数字孪生热管理:NTC热敏电阻阵列与热场重构算法的动态适配

    本文以东莞市平尚电子科技有限公司(平尚科技)的NTC热敏电阻阵列与热场重构算法为核心,探讨其在车载数字孪生热管理系统中的动态适配技术。通过高精度NTC阵列、多物理场耦合模型及实时反馈控制算法,实现热
    的头像 发表于 06-06 17:59 1071次阅读
    ​数字孪生热管理:NTC热敏电阻<b class='flag-5'>阵列</b>与热场<b class='flag-5'>重构</b>算法的动态适配