0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V迎来关键拐点

颖脉Imgtec 2026-03-05 15:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:编译自semiwiki


RVA23 标志着主流 CPU 性能扩展方式的一个转折点。它强制要求使用 RISC-V 向量扩展 (RVV),从而将结构化、显式并行计算提升到与标量执行相同的架构地位。向量计算不再是附加在高负载运算核心上的可选加速器,而是软件可以依赖的基础功能。

RVA23 并非强制标量执行实现确定性,而只是使确定性成为可能,因为标量部分不再负责吞吐量。向量单元显式地处理并行工作,而标量核心则成为一个协调器,在不牺牲性能的前提下,实现简单、可预测和低功耗。

要理解这种转变为何如此重要,不妨回顾一下推测执行是如何彻底主导高性能 CPU 设计的。它确实带来了速度提升,但代价也越来越高——功耗、复杂性、验证负担和安全风险都在增加。RVA23 并非否定推测执行,而是力求恢复平衡。它承认,可预测的、向量驱动的并行计算如今已成为提升性能的可靠主流途径。

强制向量支持从根本上改变了软件性能契约。编译器、库和应用程序现在可以假定每个兼容的核心都存在 RVV(资源向量向量)。优化策略从“让 CPU 猜测”转向显式、结构化的并行处理。工具链必须能够可靠地生成向量代码。数学和 DSP 库可以减少或消除标量回退。应用程序开发人员获得了一个可预测的模型,用于扩展循环和数据并行工作负载。

这种文化转变意义重大:并行性不再是硬件试图推断的东西,而是软件直接表达的东西。对于硬件设计者而言,这种转变虽然不同,但同样意义深远。向量单元现在是强制性的,但规范仍然保留了微架构的自由度。

实现者可以选择通道宽度、流水线深度、指令发出策略和内存设计。改变的是性能重心。设计者不再被迫完全依赖更深层次的推测——更大的分支预测器、更宽的重排序缓冲区和日益复杂的恢复机制——来保持竞争力。

相反,面积和功耗可以转移到向量吞吐量和内存带宽上。对于曾经需要复杂推测性机制的工作负载而言,配备强大向量引擎的更简单的顺序执行内核变得可行。

推测执行并非一蹴而就,而是从放宽严格顺序执行限制的技术中逐步发展而来。1967 年,罗伯特·托马苏洛 (Robert Tomasulo) 在IBM System/360 Model 91上的工作引入了动态调度和寄存器重命名,使得指令可以乱序执行而不违反程序语义。大约在同一时期,詹姆斯·桑顿 (James Thornton) 在CDC 6600中设计的记分板机制,使得流水线在遇到冲突时也能保持运行。这些机制本身并不进行推测,但它们消除了曾经迫使处理器停顿的结构性障碍。一旦乱序执行成为可能,推测便势不可挡。

20世纪70年代末80年代初,詹姆斯·E·史密斯正式提出了分支预测的概念,将推测性操作建立在概率基础之上。内存不再是处理器被动等待的对象,而是需要预先获取的对象。数据在确认需要之前就被提取出来。缓存也从局部性优化器演变为能够吸收推测性执行过程中各种波动的缓冲区。

学术界也强化了这一方向。斯坦福大学和伯克利大学的指令级并行研究将推测视为前进的方向。约翰·亨尼西将推测定义 为一种在不放弃顺序编程的前提下提高性能的方法。大卫·帕特森阐述了“内存墙”的概念,鼓励采用更深层次的缓存和分层存储。

业界纷纷效仿。英特尔奔腾Pro(P6)将具有深度缓存层次结构的推测性乱序执行技术确立为主流CPU模板。IBM POWER和AMD Zen强化了这一模式:通过扩展缓冲、带宽和内存级并行性来支持日益增长的在执行推测性工作量。每一代CPU都在扩展推测能力,而不是质疑它。

随着时间的推移,成本问题变得愈发清晰。在2014年国际计算机科学与技术大会(ISSCC)全体会议上,马克·霍洛维茨指出,能源——而非晶体管密度或原始逻辑速度——已成为计算领域的主要制约因素。算术运算仅消耗几个皮焦耳的能量。缓存访问的成本要高出一个数量级。DRAM访问的成本则要高出两到三个数量级。数据传输而非计算,才是能源消耗的主要来源。

电压调节停滞不前,频率调节也达到了散热极限。简单地增加核心数已无法恢复以往的性能曲线。与此同时,末级缓存和寄存器文件体积庞大,其能耗开始与它们所服务的核心相当,甚至往往超过后者。现代内存层次结构并非独立演进,而是与推测执行协同发展。它们成为支撑大量进行中、不确定工作所需的框架。推测执行旨在优化程序运行的假象。内存系统的存在正是为了维持这种假象,并在预测失败时进行清理。

在 DRAM 层面上,Onur Mutlu展示了现代处理器如何通过干扰、行冲突和不可预测的访问模式来给内存系统带来压力——其中许多并非由已提交的计算驱动,而是由最终会被丢弃的推测驱动。

从这个角度来看,现代CPU内存层次结构并非独立演化而来,而是与推测性乱序执行共同演化,成为支撑这种机制的物理基础。推测性执行的核心在于优化一种错觉——即通过预测未来执行的线程,使单个顺序线程的运行速度看起来更快。

相比之下,确定性执行针对已知因素进行优化。它将延迟视为可调度因素,而不是需要通过不断增加带宽来掩盖的问题。推测性架构通过增加复杂性来弥补不确定性,而确定性架构则通过提高可预测性和持续吞吐量来提升性能。

推测并非不可避免。西摩·克雷的向量机证明,推测绝非唯一的出路。他们完全摒弃了推测,转而依赖可预测的内存步长模式、明确的向量长度和确定性调度。并行性直接暴露在硬件面前,而非通过猜测推断,延迟也需要提前规划,而不是试图隐藏。

他们的内存系统设计旨在实现稳定、高吞吐量的访问,而不是后来推测性架构所需的猜测和恢复行为。从这个意义上讲,Cray 的方法更接近 RVV 的结构化、长度无关模型,而不是后来主导通用 CPU 的推测性超标量架构。

历史上,推测编程之所以能够胜出,是因为它保留了顺序编程模型,并将软件中断降至最低。但这种成功也造成了路径依赖。内存层次结构为了提高推测吞吐量而进行了优化,却导致功耗、验证复杂性和架构不透明性不断增加。

人工智能机器学习信号处理工作负载具有结构化特征,并且本质上是数据并行的。它们的访问模式通常是可知的,而非概率性的。在这些领域,显式并行比推测性猜测更具优势。RVA23 通过强制使用 RVV,确保了硬件对这类工作负载的支持。结构化并行从可选扩展转变为架构基线。这并没有消除推测,而是消除了排他性。

诸如 Simplex Micro 探索的那种确定性、基于时间的调度方法等架构,现在可以将向量计算能力作为基础。它们不再弥补推测性计算的低效,而是显式地协调计算和内存。性能的扩展取决于资源利用率和可预测性,而非推测深度。对于向量和矩阵工作负载而言,这与其说是一场革命,不如说是回归到曾经被推测性计算所取代的架构传统。

RVA23 的意义远不止于指令编码。编译器基础设施可以假定支持向量。操作系统可以考虑向量资源进行调度。硬件实现可以优化向量效率,而无需担心生态系统是否会忽略它。三十年来,推测性技术获得了持续的架构投资,而结构化并行技术却没有。

RVA23 改变了这一点。它并非强制放弃推测式架构,而是强制要求架构上的对等性。设计人员可以在适当的情况下同时部署这两种架构,但结构化并行不再是次要的。非此即彼的错误二元论——要么通过推测式架构扩展,要么接受性能下降——不再适用。

借助 RVA23,向量运算能力的不确定性降低,确定性方法能够实现一流性能的疑虑减少,扩展性方面对推测计算的依赖也降低。不再仅仅依赖推测计算来实现扩展。如今的工作负载本身就是并行的,而非通过编译器从顺序代码中巧妙提取而来。对于这类工作负载,推测计算的成本越来越大于其收益。

RVA23 并没有终结投机时代,而是终结了投机垄断。这种转变——而非任何单一的技术特性——或许才是它对处理器架构最重要的贡献。

参考链接:

https://semiwiki.com/ip/risc-v/367094-rva23-ends-speculations-monopoly-in-risc-v-cpus/

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20378

    浏览量

    255616
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11370

    浏览量

    226406
  • RISC-V
    +关注

    关注

    49

    文章

    2985

    浏览量

    53714
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    你的RISC-V芯片,合规吗?

    本文转自:半导体行业观察验证涉及多个学科,每个学科都至关重要,而且都变得日益复杂。RISC-V又增加了一个学科——架构一致性——直到最近,这方面的研究还只是少数几家公司在私下进行。采用RISC-V
    的头像 发表于 03-13 14:33 343次阅读
    你的<b class='flag-5'>RISC-V</b>芯片,合规吗?

    RISC-V不支持 Nx吗?

    RISC-V architecture! · nrwl/nx · Discussion #27915 如果能够支持 RISC-V,那就太好了。目前我无法在我的 VisionFive2 板上
    发表于 02-04 06:27

    RISC-V,正式崛起

    编译自financialcontent全球半导体行业迎来里程碑式的变革:开源指令集架构(ISA)RISC-V已于2026年1月正式占据全球处理器市场25%的份额。这一里程碑标志着x86和Arm长期双
    的头像 发表于 01-16 15:17 982次阅读
    <b class='flag-5'>RISC-V</b>,正式崛起

    RISC-V市占,直逼25%

    全球半导体格局已迎来历史性转折点——开源RISC-V架构本月正式实现25%的市场渗透率,标志着专有巨头长期占据的架构垄断时代落幕。这一里程碑经行业分析师2025年12月末验证,预示着全球最先进硬件
    的头像 发表于 12-30 10:36 824次阅读
    <b class='flag-5'>RISC-V</b>市占,直逼25%

    新思科技全栈工具链助力RISC-V设计高效进阶

    RISC-V 架构席卷全球的当下,新思科技(Synopsys)通过在整个硅生命周期开发工具、验证平台与定制 IP 方面的深厚积累,成为 RISC-V 生态中最为关键的“隐形推手”,在整个 R
    的头像 发表于 12-17 10:29 971次阅读
    新思科技全栈工具链助力<b class='flag-5'>RISC-V</b>设计高效进阶

    跃昉科技亮相2025 RISC-V产业发展大会暨RDSA国际论坛

    2025年11月24日,珠海与澳门双城联动,迎来了一场全球RISC-V与人工智能领域的顶级盛会——“2025 RISC-V产业发展大会暨RDSA国际论坛”。
    的头像 发表于 11-30 09:36 673次阅读

    为什么RISC-V是嵌入式应用的最佳选择

    最近RISC-V基金会在社交媒体上发文,文章说物联网和嵌入式系统正在迅速发展,需要更高的计算性能、更低的功耗和人工智能。RISC-V是为未来而建的,包括超高效的MCU到高性能应用处理器,RISC-V使开发人员能够设计以下解决方案
    的头像 发表于 11-07 10:09 1959次阅读

    大湾区RISC-V生态全景展示:RISC-V生态发展论坛、开发者Workshop和生态应用专区

    继7月份上海的RISC-V中国峰会之后,中国RISC-V生态和产业发展最新动态将在10月份深圳的湾芯展上全景展示。   RISC-V,这个以开放、简约、模块化重塑处理器架构格局的开源指令集(ISA
    的头像 发表于 10-13 09:18 840次阅读
    大湾区<b class='flag-5'>RISC-V</b>生态全景展示:<b class='flag-5'>RISC-V</b>生态发展论坛、开发者Workshop和生态应用专区

    普华基础软件亮相2025 RISC-V中国峰会

    此前,7月16日至18日,第五届RISC-V中国峰会在上海盛大召开。普华基础软件副总经理兼战略研究院院长张晓先受邀参会,发表《开源小满助力RISC-V软硬协同生态发展》主题演讲,分享了开源小满
    的头像 发表于 07-28 16:51 1436次阅读
    普华基础软件亮相2025 <b class='flag-5'>RISC-V</b>中国峰会

    RISC-V 手册

    以下是关于RISC-V的详细介绍,结合其核心技术特点与当前发展现状:核心概念RISC-V(第五代精简指令集)是一种基于精简指令集(RISC)的开源指令集架构(ISA),由加州大学伯克利分校于2010
    发表于 07-28 16:27 11次下载

    2025新思科技RISC-V科技日活动圆满结束

    新思科技深度参与2025 RISC-V中国峰会并于2025年7月16日举办同期活动“新思科技RISC-V科技日”技术论坛,聚焦“从芯片到系统重构RISC-V创新”主题,议题覆盖当前最前沿的技术领域
    的头像 发表于 07-25 17:31 1681次阅读

    RISC-V如何盈利?本土企业率先破局

    了全行业对RISC-V美好未来的信心。 RISC-V崛起:芯片产业高质量发展的必由之路 当前,全球两大处理器架构中,x86完全封闭,Arm需付费购买。关键技术被境外垄断,相关芯片也依赖境外的生态和软件,使国内供应链面临着巨大的风
    的头像 发表于 07-18 11:32 3674次阅读
    <b class='flag-5'>RISC-V</b>如何盈利?本土企业率先破局

    RISC-V 发展态势与红帽系统适配进展

    2025 年 7 月 18 日,在第五届(2025)RISC-V 中国峰会的软件与生态系统分论坛上,红帽软件(北京)有限公司首席软件工程师、RISC-V 国际基金会大使傅炜分享的主题是《红帽在
    发表于 07-18 10:55 4282次阅读
    <b class='flag-5'>RISC-V</b> 发展态势与红帽系统适配进展

    RISC-V International CEO:RISC-V 应用全面开花,2031 年渗透率将达 25.7%

    7 月 16 日~19 日,第五届(2025)RISC-V 中国峰会在上海张江科学会堂拉开帷幕。峰会设置 1 场主论坛、8 大垂直领域分论坛、多场研习会及多项同期活动。在 7 月 17 日的主论坛上
    发表于 07-17 10:28 3836次阅读
    <b class='flag-5'>RISC-V</b> International CEO:<b class='flag-5'>RISC-V</b> 应用全面开花,2031 年渗透率将达 25.7%

    RISC-V和ARM有何区别?

    在微处理器架构领域,ARM与RISC-V是两个备受关注的体系。ZLG致远电子在推出ARM核心版后,又推出了基于RISC-V的MR6450核心版,这引发了人们对这两种架构差异的深入探讨。ARM
    的头像 发表于 06-24 11:38 2374次阅读
    <b class='flag-5'>RISC-V</b>和ARM有何区别?