0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用粗粒度可重构阵列加速处理

星星科技指导员 来源:嵌入式计算设计 作者:Monique DeVoe 2022-06-14 10:05 次阅读

随着性能需求的增加和对低功耗设计的推动,需要更有效的方法来执行处理任务,因为由于功率限制,将更多处理器投入性能问题不再可行。加速器旨在以更快的速度和更低的功耗进行计算,但今天的加速器在功耗和性能方面存在缺陷。

加速器阵容

亚利桑那州立大学计算、信息学和决策系统工程学院副教授 Aviral Shrivastava 正在对可编程加速器进行研究,以增强当今的加速技术。Shrivastava 列出了当今使用的三种常见类型的加速器:硬件加速器、FPGAGPU。硬件加速器将特定的计算元素专用于处理计算,而不是在 CPU 上运行它们。它们速度快、功耗低,但不适合当今快速变化的技术迭代,因为它们不可编程。FPGA 是可编程的——开发人员可以在其上编写任何逻辑并且它们可以充当加速器——但 Shrivastava 说它们通常过于通用并且消耗太多功率。GPU 是当今流行的加速器,

粗粒度可重构阵列

Shrivastava 正在开发粗粒可重构阵列 (CGRA),它可以加速非并行循环,并在 GPU 的并行循环优势之上实现更多加速功能。CGRA 由一个由算术逻辑单元 (ALU) 和寄存器组成的二维网格组成,这些单元接收输入和指令,计算指令的算术或逻辑运算,并将输出发送给它的四个邻居以计算下一个步骤(图 1)。

图 1:粗粒度可重构阵列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潜力来自于他们能够在消耗很少的电力的情况下执行操作。在常规处理器中执行加法运算需要很大的功率:它必须经过 20 多个流水线阶段。在 CGRA 中,只需要从邻居那里获取操作数并执行加法运算。CGRA 可以通过流水线加速——循环的操作被布置在 CGRA 的 PE 上,数据在它们之间流动。

CGRA 本身并不新鲜,但开发人员对现有的 CGRA 进行编程以仅执行一种类型的计算。Shrivastava 说,挑战在于映射,因为循环内核需要映射到 CGRA,操作映射到节点,数据依赖关系映射到 CGRA 的路径。Shrivastava 的目标是消除耗时的手动编码,并使任何类型的循环或计算能够通过编译器映射到 CGRA,这是一种相对较新的方法。他正在开发一个生成映射代码的编译器工具链。

Shrivastava 说 CGRA 的研究引起了 IBM 的兴趣,IBM 希望将这种方法应用于并行循环轻型服务器应用程序。用于科学研究和多媒体扩展的图形和高性能计算也可以从使用 CGRA 中获益。

解决分支分歧问题

所有现有加速技术面临的一个挑战是“分支分歧”。当执行具有“if-then-else”结构的循环时,加速器分配资源以执行来自分支的两条路径(真路径和假路径)的指令,然后丢弃假路径指令的影响。FPGA 将两个路径的功能映射到计算资源上,GPU 执行来自两个分支路径的指令并丢弃错误路径指令的结果。加速器必须这样做,因为在分配分支路径资源时,分支的结果在编译时是未知的(分支的结果是在运行时计算的,当执行分支时)。这种冗余执行会导致分支花费双倍的性能时间和执行能力。

Shrivastava 和他的团队提出了通过智能硬件-软件协同设计解决分支分歧问题的方法。不是为真路径分配一些PE,而为假路径分配一些PE,而是分配相同的PE来执行来自两条路径的指令。来自真路径和来自假路径的指令都发给PE。在运行时,PE 只选择正确的一个来执行。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18027

    浏览量

    221546
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4336

    浏览量

    126296
  • 编译器
    +关注

    关注

    1

    文章

    1563

    浏览量

    48527
收藏 人收藏

    评论

    相关推荐

    瑞萨发布下一代动态可重构人工智能处理加速

    瑞萨最新发布的动态可重构人工智能处理器(DRP-AI)加速器,在业界引起了广泛关注。这款加速器拥有卓越的10 TOPS/W高功率效率,相比传统技术,效率提升了惊人的10倍。其独特之处在
    的头像 发表于 03-08 13:45 175次阅读

    Zeta电位纳米粒度仪的原理介绍

    Zeta电位纳米粒度仪是一种用于测量纳米材料电位和粒度分布的重要仪器。其原理基于电泳或电渗原理,通过测量纳米颗粒在电场作用下的移动行为,来获得其电位和粒度信息。
    的头像 发表于 03-06 10:51 287次阅读

    一种可重构的莫尔相干纳米激光阵列

    ,展示了纳米激光能够以“P”“K”“U”和“中”“国”等图形生成可重构阵列化相干激射。研究成果以《相位同步可重构莫尔纳米激光阵列》(“Reconfigurable moiré nan
    的头像 发表于 12-16 11:42 384次阅读
    一种可<b class='flag-5'>重构</b>的莫尔相干纳米激光<b class='flag-5'>阵列</b>

    fpga是什么?看完你就明白了

    的可编程性使得硬件设计变得更加灵活和定制,缩短了设计周期,提高了设计效率;其次,FPGA的重构性使得硬件系统可以随时进行升级和优化,无需更换硬件设备;此外,FPGA的并行处理能力和
    发表于 11-13 15:43

    基于全息控制理论的低剖面双极化双波束扫描天线阵列

    巧妙设计辐射单元,以通过控制集成在每个单元上的PIN二极管的状态实现可重构极化和辐射相位调制。将一个72通道的串并联等幅同相馈电网络与辐射阵列集成,实现阵列的低剖面特性。
    发表于 11-13 09:49 174次阅读
    基于全息控制理论的低剖面双极化双波束扫描天线<b class='flag-5'>阵列</b>

    基于PE的脉动阵列设计

    脉动阵列指的是多个相同的处理单元(简称 PE),按一定互联规则组成的网络,即称之为脉动阵列
    的头像 发表于 10-09 10:44 407次阅读

    用于汽车应用的AIS2DW12超低功耗3轴加速度计

    (FIFO)缓冲器,允许用户进行数据存储,减少主机处理器的干预。器件包含专用内部引擎,用于处理运动和加速度检测,包括自由落体、运动和不运动、唤醒、活动/不活动和 6D/4D 方向。嵌
    发表于 09-13 06:33

    中国首款可重构5G射频芯片发布

    中国首款可重构5G射频芯片发布  随着5G时代的到来,5G技术的发展不断加速。作为5G技术的核心组成部分之一的射频芯片,也在不断地发展和进步。最近,中国发布了首款可重构的5G射频芯片,这一成果引起了
    的头像 发表于 09-01 16:12 746次阅读

    评估报告:使用Lenovo StorageS3200 SAN阵列加速SQL Server数据库性能

    电子发烧友网站提供《评估报告:使用Lenovo StorageS3200 SAN阵列加速SQL Server数据库性能.pdf》资料免费下载
    发表于 08-30 11:08 0次下载
    评估报告:使用Lenovo StorageS3200 SAN<b class='flag-5'>阵列</b><b class='flag-5'>加速</b>SQL Server数据库性能

    代码重构的经验总结

    具体的重构手段可参考《代码大全2》或《重构:改善既有代码的设计》,本文不再班门弄斧,而侧重重构时一些粗浅的“方法论”,旨在提高重构效率。
    的头像 发表于 08-23 10:10 293次阅读
    代码<b class='flag-5'>重构</b>的经验总结

    为什么说锡膏颗粒度越小等于其活性越强?

    有人说“锡膏颗粒度越小其活性也就越强”,这是真的吗?对于刚接触锡膏行业不久的人可能会认同这一说法,小编本人就是其中之一。后来经过学习后才知道这是一种错误的说法。接下来由锡膏厂家讲一下为什么说锡膏颗粒度
    的头像 发表于 08-22 16:05 555次阅读
    为什么说锡膏颗<b class='flag-5'>粒度</b>越小等于其活性越强?

    一种基于信息超表面设计理念的可重构天线阵列

    ,为了降低设计的成本和复杂性,提出了利用数字化实现波束扫描的可重构比特阵列。4比特阵列天线具有平面可重构阵列重量轻、成本低、外形小的优点。
    的头像 发表于 08-15 10:06 704次阅读
    一种基于信息超表面设计理念的可<b class='flag-5'>重构</b>天线<b class='flag-5'>阵列</b>

    分享粒度仪的常见问题

    1、粒度仪能够测量表面积吗?(需要买国外的吗?) 答:这是两个不同的测试条件,粒度仪这块,其实现在咱国内的技术已经能满足了,而且价格只在三分之一左右。你如果zui主要的是要测比表面积,建议您
    的头像 发表于 06-29 10:54 411次阅读
    分享<b class='flag-5'>粒度</b>仪的常见问题

    激光粒度分析仪的调整精确原理

    激光粒度分析仪通过颗粒的衍射或散射光的空间分布(散射谱)来分析颗粒大小的仪器。激光粒度仪作为一种新型的粒度仪,在粉末加工、应用和研究领域得到了广泛的应用。 一个系统概述:赢家7303在线粒度
    的头像 发表于 06-29 09:29 266次阅读
    激光<b class='flag-5'>粒度</b>分析仪的调整精确原理

    共形可重构超表面的远场波束扫描和双波束产生

    重构智能超表面因其具有强大的实时电磁波处理和数字信号处理能力引起了众多研究者的关注。其具有高定向、高增益的动态波束扫描能力在无线通信、雷达探测有着重要的应用前景,独立动态多波束调控的设计方案
    的头像 发表于 04-10 14:15 931次阅读