0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

芯片综合和高级综合:硬件中的软件

星星科技指导员 来源:嵌入式计算设计 作者:OpenSystems Media 2022-06-09 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新一代高级综合 (HLS) 工具目前用于两个主要目的。首先是出于性能原因在硬件中实现软件。第二个是出于生产力、重用、架构探索和更好的结果质量 (QoR) 的原因,将半导体设计推向更高的抽象级别。

同时,一种新的寄存器传输级 (RTL) 综合方法称为芯片综合,它比以往任何时候都更容易实现对最终性能的快速准确评估,而无需创建完整的物理实现。结合这两种技术,设计人员可以快速改变设计参数,获得正确的性能数字,并在面积、性能和功耗方面达到最佳组合的设计。

更大的马力,更好的抽象

各类嵌入式软件,尤其是高清视频处理等具有高吞吐量要求的软件,经常会遇到性能问题。虽然可以使用一些软件方法来提高性能,但当性能下降几个数量级时,唯一可行的方法是更改​​运行软件的底层计算结构,这可能就像切换到多核处理器一样简单。然而,通常由于功率或成本的原因,改变计算结构并不是最优的。

HLS 是一种越来越有吸引力的方法,它采用软件的一部分并在硬件中自动实现它,无论是在片上系统 (SoC) 上的原始门中,还是在 FPGA 中更好。AutoESL 的 AutoPilot 是一个将 C、C++ 或 SystemC 作为输入并快速生成 RTL Verilog 或 VHDL 作为输出的工具的示例。

与此同时,SoC 设计人员正在寻找将设计推向更高抽象层次的方法,用 C 或 SystemC 描述他们的算法,自动将其转换为 RTL 代码,并达到面积(成本)的正确权衡点,功率和性能。通过在更高级别上工作,设计人员可以显着提高他们的生产力,并确保 QoR 接近或优于手动编码结果。同样,HLS 工具是执行从输入到 RTL 代码的优化转换的链接。然后,传统的 RTL 实现流程可以接管。

进入评估

说 HLS 使硬件编译像软件的 C 语言编译一样简单可能有些夸张,但它确实使软件到硬件的转换变得简单,尤其是与手动创建复杂的 RTL 实现相比。硬件编译比软件编译更复杂的一个原因是 HLS 工具需要考虑一组更丰富的权衡。

例如,数据路径可以简单地实现、流水线化或复制。这些选项中的每一个都具有不同的性能、面积和功率特性,其变化因子高达 1,000。可以为 HLS 工具提供指令,以将实现导向设计人员想要的最佳位置。但是有一个问题:鉴于 HLS 的输出是 RTL 代码,设计人员如何快速确定特定候选实现的面积、功耗和性能?

缺少的环节是难以评估这些特征并获得有关任何问题的快速反馈。虽然 HLS 工具提供了合理但相当粗略的估计,但通常需要更高的准确性。但是,用于将 RTL 代码缩减为实现的传统工具的性能与 HLS 工具的性能之间存在不匹配。

尽管 HLS 运行速度极快(大约一个小时左右),但减少 RTL 实现以实现准确的性能可能需要半天的综合时间,然后是一天半的物理设计。这几乎不是 HLS 用户想要的快速反馈循环,因为它浪费了每天迭代五到六次的潜力,并将其最小化为每周几次。这些较新的 HLS 工具的功能与语言无关,可以同时优化时序、面积和性能,从而生成高度可实现的 RTL 代码,但被下游 RTL 综合边缘化。

块和芯片

另一个细微差别是,块的详细性能不仅取决于块本身,还取决于它周围的其他块。有时,从高层综合的整个设计包括传统模块、第三方 IP 模块和在 RTL 级别手工设计的模块。当这些块一起实现时,任何特定块的性能都与共享某些相同物理资源的其他块的性能相互关联。

对于传统的 RTL 综合,设计人员面临着一个没有吸引力的选择:快速但粗略的反馈或准确但极慢的反馈。所需要的是一种提供快速和准确反馈的方法。Oasys Design Systems 的 RealTime Designer 等芯片综合工具提供了这种功能组合。

芯片综合通过直接将 RTL 代码简化为布局元素来运行,因此与传统综合相比具有两大优势:布局和布线。这个过程很快,而且时间和尺寸数据与最终实现设计时最终获得的数据有很好的相关性。HLS 和芯片综合的结合使获取大量 C 代码并快速获得性能和面积的出色估计成为可能。这使设计人员可以更有效地专注于最合适的实施位置。此外,由于芯片合成可以快速处理巨大的块,它可以合成正在设计的块以及影响性能的周围块。

区别很明显

芯片合成的工作方式与传统合成不同。一旦 RTL 代码被解析,它就会被分割(基于连通性)成更小的段,最终将被简化为门。每个分区都足够小,不会包含任何长线,这会导致时序的高度可变性,并且足够大,可以包含具有潜在不同区域/时间权衡的实现。每个分区都独立于其他分区。当然,需要所有其他分区的时序编号才能对整个芯片进行计时,但并不需要同时要求每个分区的详细内部结构。因为不再需要在门级同时查看整个芯片,所以减少了内存需求。

RTL 分区方法是芯片综合能够如此快速和有效的主要原因。通过在更高的层次上运行,这种方法一次智能地综合和计时设计一个分区。然后,在满足时序之前,它会重新综合、替换(并更新全局路由)并重新划分设计的各个部分,直到满足约束条件。

使用最新的 HLS 和芯片合成技术在更高水平上工作会产生数量级的更好性能。对于 HLS 创建的典型设计规模,芯片综合的运行时间与 HLS 大致相同。将这两种创新技术结合使用意味着可以在一两个小时内对设计进行迭代,从而每天可以考虑多次试验实施。通过这种方法腾出的额外时间可以用于更紧凑的时间表或探索更丰富的替代空间。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1664

    文章

    22571

    浏览量

    640757
  • 芯片
    +关注

    关注

    463

    文章

    54632

    浏览量

    470928
  • soc
    soc
    +关注

    关注

    40

    文章

    4658

    浏览量

    230582
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    怎么进行低温综合试验?低温综合试验可以模拟哪些环境条件?

    工作。在低温综合试验,通常会设定一个或多个低温条件,如-40℃、-60℃、-80℃等,以测试产品在这些条件下的性能表现。测试过程,产品会被放置在试验箱内,试验箱
    的头像 发表于 05-15 14:52 79次阅读
    怎么进行低温<b class='flag-5'>综合</b>试验?低温<b class='flag-5'>综合</b>试验可以模拟哪些环境条件?

    智能制造综合实训平台数据采集综合解决方案

    构建理论与实践深度融合的现代化教学环境。 行业痛点 为模拟真实工业生产场景,实训平台需集成多种工业设备,并实时采集各类设备状态、工艺参数及产品质量数据,确保不同厂商硬件与各类工业软件无缝对接。此过程主要面临以
    的头像 发表于 01-28 11:09 364次阅读
    智能制造<b class='flag-5'>综合</b>实训平台数据采集<b class='flag-5'>综合</b>解决方案

    【「龙芯之光 自主可控处理器设计解析」阅读体验】--LoongArch逻辑综合芯片设计

    生产、制造、封装等步骤得到芯片成品。 物理设计包括布图规划、物理综合、时钟树综合、时序修复、布线连接、布线后优化。这个内容看下来,放大外延 类似于硬件电路板设计,但
    发表于 01-18 14:15

    皮线光缆在综合布线的应用

    皮线光缆(也称为蝶形引入光缆或微型光缆)因其结构紧凑、柔韧性好、易于施工等特点,在综合布线系统中被广泛应用于“最后一公里”接入和终端用户连接场景。以下是其在综合布线的具体应用及优势分析: 一、皮线
    的头像 发表于 11-21 10:18 1005次阅读
    皮线光缆在<b class='flag-5'>综合</b>布线<b class='flag-5'>中</b>的应用

    智慧光伏综合管理系统的“全维度监测”

    实现光伏电站从设备监控到运维决策的全流程智能化,是智慧光伏综合管理系统应用的效果体现,从技术融合、管理优化和价值创造等层面来实现系统的“智慧”管理模式应用,贯穿光伏电站的效率提升、成本降低、安全保障
    的头像 发表于 11-12 19:31 605次阅读
    智慧光伏<b class='flag-5'>综合</b>管理系统<b class='flag-5'>中</b>的“全维度监测”

    复杂的软件算法硬件IP核的实现

    Designer 设计套件 TASKING 组件的 CHC 编译器完成的。 CHC 编译器,即 C-to-Hardware Compiler。它输入 C 语言源程序然后输出一个可综合的 FPGA 硬件描述
    发表于 10-30 07:02

    关于综合保持时间约束不满足的问题

    1、将 nuclei-config.xdc 和 nuclei-master.xdc 加入到项目工程综合得到时序约束报告如下: 保持时间约束不满足,分析原因,发现所有不满足均出现在
    发表于 10-24 07:42

    FPGA开发板vivado综合、下载程序问题汇总

    在做vivado综合时和FPGA下载程序时,我们碰到以下问题,并找出了对应的解决方案。 1.could not open include file”e203_defines.v”问题 在做
    发表于 10-24 07:12

    倾佳电子碳化硅MOSFET高级栅极驱动设计:核心原理与未来趋势综合技术评述

    倾佳电子碳化硅MOSFET高级栅极驱动设计:核心原理与未来趋势综合技术评述 倾佳电子杨茜致力于推动国产SiC碳化硅模块在电力电子应用全面取代进口IGBT模块,助力电力电子行业自主可控和产业升级
    的头像 发表于 10-18 21:22 1081次阅读
    倾佳电子碳化硅MOSFET<b class='flag-5'>高级</b>栅极驱动设计:核心原理与未来趋势<b class='flag-5'>综合</b>技术评述

    飞发综合能热系统架构演进研究:从独立设计到一体化综合的变革路径

    飞发综合能源和热管理系统(简称综合能热系统)作为保障飞行器和发动机可靠运行的关键系统,涵盖飞机、发动机能源和热相关的子系统。其中,飞机子系统包括飞机的电源、液压、环控、燃油以及辅助动力等系统;发动机子系统则涉及机械传动、燃油控
    的头像 发表于 10-17 10:34 892次阅读
    飞发<b class='flag-5'>综合</b>能热系统架构演进研究:从独立设计到一体化<b class='flag-5'>综合</b>的变革路径

    综合配电柜——电力系统的“智慧管家”

    一、什么是综合配电柜? 综合配电柜是一种集成化电力设备,它将配电、控制、保护、监测和计量五大功能整合于一个金属柜体。其核心价值在于通过模块化设计,实现电力系统的“一站式管理”。例如,在工厂车间
    的头像 发表于 10-16 10:31 820次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软
    发表于 08-07 14:30

    综合配电箱为什么叫jp柜

    综合配电箱被称为 JP 柜,主要源于其功能定位、设计背景及行业命名习惯,具体原因如下: 一、功能集成性:JP 柜的“综合”特性 JP 柜是集 电能分配、计量、保护、控制、无功补偿 于一体的新型配电
    的头像 发表于 07-31 10:11 5746次阅读

    光伏项目综合运维系统的核心技术功能

    光伏项目实现综合运维需构建一种覆盖数据采集、分析、决策到执行的闭环管理体系,这就需要通过软件系统与硬件设备的深度协同来实现。其中软件系统主要负责智能决策与全局管控,而
    的头像 发表于 07-17 10:13 964次阅读

    电缆隧道综合监测的技术应用分析

    的适配性。电缆隧道综合监测系统,是一款可实现电缆隧道在线监测的软硬件结合的解决方案,从电缆隧道实际情况出发,选配适用的监测内容,保证监测内容覆盖全面,才能有效实现电缆隧道监测。 电缆隧道综合监测核心监测技术
    的头像 发表于 06-10 10:53 847次阅读
    电缆隧道<b class='flag-5'>综合</b>监测的技术应用分析