0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用粗粒度可重构阵列加速处理

星星科技指导员 来源:嵌入式计算设计 作者:Monique DeVoe 2022-06-14 10:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着性能需求的增加和对低功耗设计的推动,需要更有效的方法来执行处理任务,因为由于功率限制,将更多处理器投入性能问题不再可行。加速器旨在以更快的速度和更低的功耗进行计算,但今天的加速器在功耗和性能方面存在缺陷。

加速器阵容

亚利桑那州立大学计算、信息学和决策系统工程学院副教授 Aviral Shrivastava 正在对可编程加速器进行研究,以增强当今的加速技术。Shrivastava 列出了当今使用的三种常见类型的加速器:硬件加速器、FPGAGPU。硬件加速器将特定的计算元素专用于处理计算,而不是在 CPU 上运行它们。它们速度快、功耗低,但不适合当今快速变化的技术迭代,因为它们不可编程。FPGA 是可编程的——开发人员可以在其上编写任何逻辑并且它们可以充当加速器——但 Shrivastava 说它们通常过于通用并且消耗太多功率。GPU 是当今流行的加速器,

粗粒度可重构阵列

Shrivastava 正在开发粗粒可重构阵列 (CGRA),它可以加速非并行循环,并在 GPU 的并行循环优势之上实现更多加速功能。CGRA 由一个由算术逻辑单元 (ALU) 和寄存器组成的二维网格组成,这些单元接收输入和指令,计算指令的算术或逻辑运算,并将输出发送给它的四个邻居以计算下一个步骤(图 1)。

图 1:粗粒度可重构阵列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潜力来自于他们能够在消耗很少的电力的情况下执行操作。在常规处理器中执行加法运算需要很大的功率:它必须经过 20 多个流水线阶段。在 CGRA 中,只需要从邻居那里获取操作数并执行加法运算。CGRA 可以通过流水线加速——循环的操作被布置在 CGRA 的 PE 上,数据在它们之间流动。

CGRA 本身并不新鲜,但开发人员对现有的 CGRA 进行编程以仅执行一种类型的计算。Shrivastava 说,挑战在于映射,因为循环内核需要映射到 CGRA,操作映射到节点,数据依赖关系映射到 CGRA 的路径。Shrivastava 的目标是消除耗时的手动编码,并使任何类型的循环或计算能够通过编译器映射到 CGRA,这是一种相对较新的方法。他正在开发一个生成映射代码的编译器工具链。

Shrivastava 说 CGRA 的研究引起了 IBM 的兴趣,IBM 希望将这种方法应用于并行循环轻型服务器应用程序。用于科学研究和多媒体扩展的图形和高性能计算也可以从使用 CGRA 中获益。

解决分支分歧问题

所有现有加速技术面临的一个挑战是“分支分歧”。当执行具有“if-then-else”结构的循环时,加速器分配资源以执行来自分支的两条路径(真路径和假路径)的指令,然后丢弃假路径指令的影响。FPGA 将两个路径的功能映射到计算资源上,GPU 执行来自两个分支路径的指令并丢弃错误路径指令的结果。加速器必须这样做,因为在分配分支路径资源时,分支的结果在编译时是未知的(分支的结果是在运行时计算的,当执行分支时)。这种冗余执行会导致分支花费双倍的性能时间和执行能力。

Shrivastava 和他的团队提出了通过智能硬件-软件协同设计解决分支分歧问题的方法。不是为真路径分配一些PE,而为假路径分配一些PE,而是分配相同的PE来执行来自两条路径的指令。来自真路径和来自假路径的指令都发给PE。在运行时,PE 只选择正确的一个来执行。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247061
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134445
  • 编译器
    +关注

    关注

    1

    文章

    1669

    浏览量

    51078
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD利用重构FPGA设备Moku实现自定义激光探测解决方案

    摘要本文介绍了AdvancedMicroDevices,AMD公司如何基于重构FPGA设备自定义激光探测解决方案,替代传统的仪器配置,通过灵活且定制的FPGA设备Moku提供更高效和灵活的激光
    的头像 发表于 11-20 17:28 791次阅读
    AMD利用<b class='flag-5'>可</b><b class='flag-5'>重构</b>FPGA设备Moku实现自定义激光探测解决方案

    AES和SM4算法的重构分析

    一、AES和SM4算法特点分析 基于前面几篇分享,我们对AES和SM4的算法流程有了较为清晰的认识,接下来对AES和SM4算法的共同点进行分析,得出二者的重构设计思路。 首先,这里把AES
    发表于 10-23 07:26

    瑞萨电子RZ/V系列微处理器助力边缘AI开发

    边缘AI越来越多地应用于诸如工业摄像头和公共设施摄像头等嵌入式设备中,并要求嵌入式产品小型化且具有低功耗。瑞萨电子RZ/V系列微处理器(MPU)内置AI加速器,即动态重构
    的头像 发表于 09-23 10:31 578次阅读
    瑞萨电子RZ/V系列微<b class='flag-5'>处理</b>器助力边缘AI开发

    FlashDB 的TSDB不支持写粒度为128,是出于什么考虑有这样的限制?

    FlashDB 的TSDB不支持写粒度为128,是出于什么考虑有这样的限制? 如果我希望把这个数据库移植到这样的一个mcu上,我们应该怎么做,有些建议吗。 感谢各位大佬指点。
    发表于 09-23 08:19

    ATA-7010高压放大器:开启低频重构磁电天线激励的新篇章

    根据磁电天线的机械振荡原理,本研究提出了一种基于机械调节方法的超低频重构磁电天线。该磁电天线的多维性能,如工作频率、带宽和品质因数(Q),可以在不破坏天线结构的情况下在很大的动态范围内进行调整
    的头像 发表于 08-30 10:43 476次阅读
    ATA-7010高压放大器:开启低频<b class='flag-5'>可</b><b class='flag-5'>重构</b>磁电天线激励的新篇章

    AI 智能重构测试测量平台,Moku:Delta集成业内首创“生成式仪器”

    。基于“软件定义+硬件重构”的平台架构,LiquidInstruments最新发布业内首创的“生成式仪器技术(GenerativeInstrumentation)”集
    的头像 发表于 07-15 11:34 377次阅读
    AI 智能<b class='flag-5'>重构</b>测试测量平台,Moku:Delta集成业内首创“生成式仪器”

    清微智能官宣:国产重构芯片全球出货量突破2000万颗

    近日,由北京智源人工智能研究院主办的第7届北京智源大会成功举办。作为国产原创重构芯片架构领导者,清微智能受邀出席,向大众展示了前沿高阶国产算力技术成果。 在本次大会上,清微智能首次官宣,公司
    的头像 发表于 06-12 17:15 890次阅读
    清微智能官宣:国产<b class='flag-5'>可</b><b class='flag-5'>重构</b>芯片全球出货量突破2000万颗

    ​数字孪生热管理:NTC热敏电阻阵列与热场重构算法的动态适配

    本文以东莞市平尚电子科技有限公司(平尚科技)的NTC热敏电阻阵列与热场重构算法为核心,探讨其在车载数字孪生热管理系统中的动态适配技术。通过高精度NTC阵列、多物理场耦合模型及实时反馈控制算法,实现热
    的头像 发表于 06-06 17:59 618次阅读
    ​数字孪生热管理:NTC热敏电阻<b class='flag-5'>阵列</b>与热场<b class='flag-5'>重构</b>算法的动态适配

    铝线键合强度测试:如何选择合适的推拉力测试机?

    近期,越来越多的半导体行业客户向小编咨询,关于铝线键合强度测试的设备选择问题。在电子封装领域,铝线键合技术是实现芯片与外部电路连接的核心工艺,其键合质量的高低直接决定了器件的可靠性和性能表现
    的头像 发表于 03-21 11:10 727次阅读
    <b class='flag-5'>粗</b>铝线键合强度测试:如何选择合适的推拉力测试机?

    支持实时物体识别的视觉人工智能微处理器RZ/V2MA数据手册

    DRP-AI 采用了一种由动态重构处理器(DRP)和 AI-MAC组成的人工智能加速器,该加速器可加速
    的头像 发表于 03-18 18:12 741次阅读
    支持实时物体识别的视觉人工智能微<b class='flag-5'>处理</b>器RZ/V2MA数据手册

    FRED案例:矩形微透镜阵列

    介绍 小透镜阵列可应用在很多方面,其中包含光束均匀化。本文演示了一个用于在探测器上创建均匀的非相干照度的成像微透镜阵列的设计。输入光束具有高斯轮廓,半宽度等于微透镜阵列大小,并且显示了其功率轮廓被微
    发表于 03-05 09:41

    粒度控制在结晶过程中的从小规模试验到放大应用

    引言 结晶作为API生产的最后一道工序,除了用于纯化外,还可以实现晶型与粒度控制。晶型和粒度影响口服药物生物利用度。其中,粒度分布(PSD)是一个重要的粉体性质,它影响晶浆的过滤速率、滤饼的干燥效率
    的头像 发表于 02-18 09:45 1205次阅读
    <b class='flag-5'>粒度</b>控制在结晶过程中的从小规模试验到放大应用

    突破传统桎梏,富唯重构柔性装配系统引领行业新变革

    在当今竞争激烈的制造业领域,传统装配系统正面临着诸多难以突破的困境。多层控制器架构冗余、产线生产种类单一、对人员要求过高以及标准化程度低等问题,严重制约着企业的发展与创新。而富唯智能基于 AI-ICDP 打造的重构柔性装配系统,宛如一颗璀璨的新星,为行业带来了全新的希望
    的头像 发表于 02-13 14:22 732次阅读
    突破传统桎梏,富唯<b class='flag-5'>可</b><b class='flag-5'>重构</b>柔性装配系统引领行业新变革

    阵列式位移计生产厂家:什么是阵列式位移计

    ,成为了结构变形监测的首选工具。下面是南京阵列式位移计生产厂家给大家介绍的相关内容:阵列式位移计传感器采用了先进的MEMS加速度计技术,并配备了完善的配套附件,使得其
    的头像 发表于 12-12 14:20 980次阅读
    <b class='flag-5'>阵列</b>式位移计生产厂家:什么是<b class='flag-5'>阵列</b>式位移计

    通过微透镜阵列的传播

    随着现代技术的发展,微透镜阵列等专用光学元件越来越受到人们的重视。特别是在光学投影系统、材料加工单元、光学扩散器等领域,微透镜阵列得到了广泛的应用。在VirtualLab Fusion中,可以
    发表于 12-11 11:32