0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

定制处理器的设计挑战

FPGA之家 来源:FPGA之家 作者:FPGA之家 2022-08-15 09:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

定义已更改,因此将影响设计过程。

在最新的周期性发展热潮的刺激下,半导体行业进入了定制处理器的新黄金时代,但是这次“定制处理器”意味着不同的东西。

上一个时代,每家主要的半导体公司都拥有内部处理器:SuperH,PowerPC,V800,Alpha,MEP,Trimedia等,其中一些在特定领域比其他领域更加专业。但是,行业整合和维护专有架构的巨额花费导致其中的许多都逐渐消失,整个行业进入了“标准架构”的漫长时期,而定制处理器填补了诸如音频处理等应用领域的空白。

“在过去的几年中,出现了用于图像处理、无线基带、LiDAR、图形和神经网络的领域专用内核,” Codasip营销副总裁Chris Jones说。

这样,定制处理器已发展为意味着针对特定任务类别进行了优化的处理器。微体系结构和指令集由最终将运行的软件来确定。如今,对可实现标准ISA专有指令扩展的定制工具的需求很高。

Jones说:“对于设计团队来说,这是一种高效而低风险的方式,以实现他们的‘秘密配方’。”此外,设计过程现在比以往任何时候都更关注软件,这对建模和性能分析工具提出了要求,以简化自定义体系结构。RISC-V运动为定制化在背后做出了巨大贡献,因为其模块化架构为非标准扩展提供了空间,专有软件IP技术可以嵌入在定制指令中,而不会牺牲行业标准ISA和随附生态系统的优势。”

定制处理器曾经是指从头开始设计的CPU,但是其定义是随着时间而发展和扩展的。

“用户可配置IP的可用性意味着设计人员可以选择最适合其目标应用的总线和寄存器宽度,缓存大小,流水线级数和其他处理器功能,” OneSpin解决方案产品设计验证的专家Nicolae Tusinschi说。“虽然最终的处理器可能不被认为是定制的,但大量可能的配置意味着所选的特定功能集可能在所有用户中都是唯一的。如果处理器IP以RTL形式交付或生成,并且如果许可协议允许,则用户可以将设计更改为真正定制的程度。”

他同意RISC-V ISA进一步扩展了自定义处理器的概念,因为其指令集体系结构定义了不同的数据宽度和可选指令的多种类别,包括特权模式扩展和变体。这些功能的任何选择均被视为符合ISA。

“由于RISC-V是一种不依赖于单个供应商的开放式体系结构,因此用户可以从多个IP供应商甚至从开源资源库中选择许多不同的处理器。从简单的控制器到具有乱序执行、多级缓存和其他高级功能的并行处理系统,RISC-V被明确定义为可以在各种微体系结构上实施。” Tusinschi说。

Tusinschi说,RISC-V ISA还可以添加用户定义的扩展,例如新指令,从而为设计开发适合最终应用的处理器提供了更大的灵活性。“因此,许多RISC-V处理器是真正的定制产品,具有定制的功能选择,定制的微体系结构和定制的扩展,同时仍符合ISA。这个更复杂的设计过程对验证具有重要意义。仅仅遵守是不够的。任何RISC-V验证解决方案都必须处理可选功能,验证包括微体系结构在内的完整设计,并且足够灵活以包含用户扩展。”

同时,消费者、工业和汽车产品对高性能计算的需求也在不断增长,以提供创新的“哇”的体验。

“功率和热约束推动了除高性能之外对高功率效率(每瓦性能)的需求。” CadenceTensilica IP产品管理、市场营销和业务开发高级总监Lazaar Louis指出,“定制处理器有助于满足这些需求。”

例如,消费者视频通话产品需要几个特定领域的处理器,包括音频、图像和AI处理,才能提供引人入胜的体验。同样,自动驾驶汽车需要信号处理器来预处理摄像头、雷达、激光雷达和超声传感器数据。下一步是感知车辆的周围环境,包括行人和其他车辆的位置。Louis解释说,下一步是决策,以估算路径规划和驾驶员协助。

9451310e-1c2f-11ed-ba43-dac502259ad0.png

图1:自动驾驶汽车处理器。来源:Cadence

过去,许多定制处理器都使用专有指令集。这种方法的缺点是限制了这些处理器的用途。好处是,工具集和体系结构更改由供应商维护,他们对确保其可靠和安全有既得利益。由加州大学伯克利分校的一个小组开发的RISC-V允许根据需要扩展开放式指令集。

“定制处理器的主要问题是对定制指令以及基本核心集的验证,以确保任何定制都不会改变整体功能,” Breker Verification Systems的副总裁兼首席营销官Dave Kelf说。“定制处理器公司经常为用户执行此验证过程。RISC-V将需要类似的验证机制,并且在处理器周围如雨后春笋般涌现的开源社区很可能提供了这一点。一个验证平台可以自动测试处理器周围的子系统,并且其模块化程度足以添加必要的指令,从而可以对处理器以及定制指令进行全面测试。这样的系统将大大增加RISC-V扩展的成功。”

定制化的计算尺

可以肯定的是,人们对定制处理器的理解存在差异,特别是在定制级别的方面。有这么多的选项和用例,定制似乎遵循着按比例扩大的趋势。如果没有这些工具,开发就会变得很复杂。

Synopsys和其他公司提供了一种工具,使工程团队可以设计定制的专有专用处理器。“使用该工具,你可以指定处理器,然后从中生成RTL,软件开发套件(至关重要的的一环),指令集模拟器,编译器和调试器以及整个GUI基础结构,” Synopsys的ASIP工具产品营销经理Markus Willems说。

这些工具具有广泛的适用性,Willens说。“我们看到各种各样的客户提出了各种关于定制他们想做什么的想法。它的范围从更改给定的ISA和微体系结构的特殊性到下一个级别,在该级别上,给定指令集体系结构得到扩展以添加特殊指令。这总是从给定的ISA作为起点开始,一直到构建非常定制的东西,这是一个经过很好调整的ISA,从外部可以看作是RTL的一部分或专用功能。这可以在普通的固定RTL实现中完成,但是在这里你想用更具可编程性的实体替换状态机,以保持一定的灵活性并降低状态机的复杂性。有各种各样的定制正在发生。”

反过来,这也说明了系统架构师今天在寻求最佳设计的道路上必须进行的权衡取舍。Willems越来越多地看到那些架构师在如何进行权衡方面取得了清晰的结果。这种做法已经由来已久。

“在上世纪90年代的处理器设计历史中,我们几乎没有看到这种创新,至少在指令集本身方面没有创新,因为在那里仅仅能依靠[制造]流程来进行改进。” Willems说,“转到下一个节点,你将获得2倍、3倍,并且无需做太多工作即可获得更高的频率。但这没什么用,我们进入了多核设计,起初是异构的,因此你只需做多个相同的事情即可。但这导致了一定的饱和度。现在,我们显然看到了将多核体系结构调整为更多专用内核的更加专业化的时代。”

芯片制造商通常对如何将算法切成什么样并分别使用何种专用处理器有很好的理解。他们知道哪些组件需要更高的性能,哪些组件必须专门用于满足特定的吞吐量要求,以及哪些组件最耗电。但是随之而来的挑战是弄清楚应该将算法的哪些部分以及应用程序的哪些部分映射到与之相应的事物上。这会影响时序、吞吐量和功耗,这是EDA在帮助工程师在短时间内探索各种体系结构(尤其是在C语言可编程级别)的巨大机会。

“没有人敢说,‘我想为一系列专用处理器做汇编编码,然后发现我选错了处理器。” Willems说到,“各种高级编程语言也是我们在定制处理器中关心的关键要素,你可以在Cuda图形处理以及神经网络处理器中看到这一点,其中编程语言实质上就是你所需要的一个形象的切入点。但是对于大多数人来说,仍然是C和C ++。”

高度抽象的工作有助于理解性能,因此拥有准确的处理器模型并在该处理器上运行关键内核至关重要。但是在微体系结构级别还有更多的优化可能。

内存设计增加了其他整个优化级别。“通常,它不是处理器本身,” Willems说。它可以输入和输出数据,并确保数据可以及时供不同的处理器使用。不同内存架构和处理器的I / O接口之间的权衡是定制处理器设计的关键要素。”

定制处理器的设计挑战

任何处理器设计中的关键指标都涉及功耗-每次操作每瓦/毫瓦的性能。

“通常情况下,数字运算很困难,因此你必须分析所有传感器数据,并且将信号处理与决策结合在一起,需要在这些边缘设备上进行很多工作。” Willems说“为这种与硬件链接的处理器设计编译器,和设计仿真器是一项需要完全不同技能的任务。你需要将这些技能组合在一起。必须对团队进行相应的组织,以便拥有正确的专业知识。如果你有硬件背景,现在决定要更加专注于定制处理器,那就意味着不能从IP供应商处购买。你开始对内部进行设计,而软件开发套件的主题就是这一举措的障碍。

在定制处理器的发展中,为了使跨越整个半导体生态系统的工程团队能够实现其目标,成功归结于ISA、工具、团队和权衡的进步。这种势头已经转向从可执行格式中获取创意,创建早期仿真模型以及执行基于概要的分析,而不是过时的电子表格方法。

但是随着AI和机器学习的激增,专用处理元素的机会在不断增长。

“你看到的架构越多,受到启发的人就越多,” Willems说。“整个市场仅凭人们使用更专业的处理器在市场上取得成功就触发了自身的发展。”

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20378

    浏览量

    255618
  • C语言
    +关注

    关注

    183

    文章

    7649

    浏览量

    146408
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077

原文标题:什么是定制化处理器?

文章出处:【微信号:zhuyandz,微信公众号:FPGA之家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高性能微处理器DC - DC转换:HIP6006/7EVAL1深度解析

    高性能微处理器DC - DC转换:HIP6006/7EVAL1深度解析 当今高性能微处理器对电源提出了诸多挑战,高功耗、低总线电压和快速负载变化等特性,使得在微
    的头像 发表于 04-12 12:05 534次阅读

    探索MPC184:强大的安全处理器

    探索MPC184:强大的安全处理器 引言 在当今数字化的时代,网络安全至关重要。对于电子工程师而言,选择合适的安全处理器是保障系统安全的关键。Freescale Semiconductor
    的头像 发表于 04-10 12:00 236次阅读

    新思科技ASIP Designer助力开发者快速构建RISC-V处理器

    专用指令集处理器(ASIP)是一种定制化指令集的处理芯片,它为某个或某一类应用而专门设计,通过权衡速度、功耗、成本、灵活性等多个方面,开发者可以定制 ASIP 以达到最佳平衡点。与通用
    的头像 发表于 03-25 14:01 2169次阅读
    新思科技ASIP Designer助力开发者快速构建RISC-V<b class='flag-5'>处理器</b>

    新思科技ImperasDV解决方案让RISC-V处理器验证效率翻倍

    由于 RISC-V 是一个开放性的 ISA,它允许任何开发者自由设计和扩展定制处理器。基于 RISC-V 的处理器必须保持与不断增长的支持工具和软件生态系统的兼容性。
    的头像 发表于 03-25 13:56 456次阅读

    ADSP-2148x SHARC处理器:音频处理领域的强大之选

    ADSP-2148x SHARC处理器:音频处理领域的强大之选 在电子工程领域,高性能的处理器对于实现复杂的音频处理任务至关重要。ADSP-2148x SHARC
    的头像 发表于 03-23 16:40 580次阅读

    ADSP - 21467/ADSP - 21469 SHARC处理器:高性能音频处理的理想之选

    ADSP - 21467/ADSP - 21469 SHARC处理器:高性能音频处理的理想之选 引言 在当今的电子领域,高性能音频处理需求日益增长。ADSP - 21467/ADSP - 21469
    的头像 发表于 03-23 16:35 1021次阅读

    探索ADSP - 21371/ADSP - 21375 SHARC处理器:高性能音频处理的利器

    探索ADSP - 21371/ADSP - 21375 SHARC处理器:高性能音频处理的利器 在电子设计领域,处理器的性能和特性直接影响着产品的功能和竞争力。ADSP - 21371/ADSP
    的头像 发表于 03-23 16:35 1073次阅读

    如何配置处理器休眠模式?

    如何配置处理器休眠模式
    发表于 12-05 07:28

    利用Verdi调试协处理器的实现步骤

    本次给大家介绍的是利用Verdi调试协处理器的实现步骤。 有时为了观察协处理器运行情况,需要查看协处理器接口的信号波形,此时可以用Verdi来查看主处理器发给协
    发表于 10-30 08:26

    基于E203 NICE协处理器扩展指令

    1、实现功能 基于官方提供的demo nice的硬件代码,设计一个基于e203 nice协处理的加法器。 2NICE协处理器理论学习 nice协处理器的作用主要是用于控制通路的管理 去年
    发表于 10-21 14:35

    Cortex-M0+处理器的HardFault错误介绍

    在ARM处理器中,如果一个程序产生了错误并且被处理器检测到,就会产生错误异常。Cortex-M0+处理器只有一种异常用以处理错误:HardFault。
    的头像 发表于 10-14 10:50 3781次阅读
    Cortex-M0+<b class='flag-5'>处理器</b>的HardFault错误介绍

    云拼接处理器的性能如何?

    云拼接处理器作为大屏拼接及音视频解决方案中的关键设备,其性能直接影响着展览展示、可视化展厅、中小控制室和园区监控等行业的视觉呈现效果与系统运行稳定性。深圳融大视觉科技有限公司推出的云拼接处理器,在
    的头像 发表于 09-05 00:11 954次阅读

    龙芯处理器支持WINDOWS吗?

    龙芯处理器目前不支持原生运行Windows操作系统,主要原因如下: 架构差异 龙芯架构:龙芯早期基于MIPS架构,后续转向自主研发的LoongArch指令集(与x86/ARM不兼容
    发表于 06-05 14:24

    HPM5E31IGN单核 32 位 RISC-V 处理器

    问题。其单核设计在保证性能的同时实现了优异的能效比,主频可达248MHz,远超同类ARM架构处理器。这种高性能特性使其能够轻松应对实时数据处理、复杂算法运算等挑战性任务。核心特性架构:单核 32 位
    发表于 05-29 09:23

    十万块一颗的芯片值不值?ADM处理器CPU。#半导体#电子

    处理器
    芯广场
    发布于 :2025年05月26日 18:09:31