0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V向量处理器:现代计算的革命性引擎

StarFive 2025-06-04 10:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在数字化高速发展的当下,人工智能、大数据处理、物联网等前沿技术日新月异,现代计算需求面临着严峻挑战。海量数据的爆发式增长,让传统计算架构在处理大规模数据时显得力不从心,效率低下、能耗过高、处理速度瓶颈等问题愈发突出。以人工智能领域为例,深度学习模型训练需要进行海量矩阵运算和复杂的神经网络计算,对计算设备的计算能力和并行处理能力要求极高;在大数据分析场景中,快速处理TB甚至PB级数据,传统架构难以在可接受时间内完成任务。这些挑战迫切需要计算架构创新,以突破现有局限,满足不断增长的计算需求。


为应对上述难题,向量扩展(Vector Extension,RVV)作为RISC-V指令集架构的重要拓展被正式引入。RISC-V指令集架构以其开源开放特性著称,赋予了开发者在设计处理器时极大的灵活性与可扩展性,可针对不同应用场景进行定制化设计。RVV向量扩展通过引入向量指令,实现了对多个数据元素的并行处理,为提升计算性能提供了全新的途径。相较于传统的标量计算模式,向量计算在多媒体数据处理、科学计算等领域展现出显著优势,能够有效减少指令执行次数,进而降低计算延迟,全面提升系统整体性能。RVV的出现,为开发者提供了一种高效、灵活且具有成本效益的解决方案,有力推动了计算架构的创新发展,在诸多领域呈现出巨大的应用潜力。在RVV发展浪潮中,赛昉科技昉·天枢-83(Dubhe-83) CPU IP 崭露头角。


162eee66-40e8-11f0-986f-92fbcf53809c.jpg

昉·天枢-83 RISC-V CPU IP




Dubhe-83是一款能效卓越的处理器,具备诸多先进特性:



1. 指令集支持

全面兼容RVA23与RVV Crypto指令集,赋予芯片卓越的指令处理能力,从容应对复杂计算任务。在加密应用场景中,RVV Crypto指令集提供硬件级加密加速,极大提升数据加密与解密效率,为数据安全提供坚实保障。


2. 前端取指和分支预测策略

前端取指和分支预测采用Decouple策略,将取指和分支预测两个关键操作解耦,更高效地处理指令流。同时,分支预测采用业界先进的TAGE-Style算法,能更精准预测程序分支走向,减少因分支预测错误导致的流水线停顿,提升处理器执行效率。


3. 流水线设计

拥有10-14 Stage的Pipeline,合理的流水线深度设计在保障指令处理效率的同时,兼顾硬件复杂度与成本。通过多级流水线操作,指令可在不同阶段并行处理,加快指令执行速度。


4. 解码和提交机制

采用3-Way Decode/Rename/Commit机制,可同时对三条指令进行解码、重命名和提交操作,进一步提升指令处理并行度,提高处理器整体性能。


5. 性能表现

在Benchmark SPECint2006测试中,Dubhe-83分数达9.4/GHz,充分展现其在整数计算性能方面的出色表现,能满足多种对整数运算要求较高的应用场景。




Dubhe-83在RVV上具有显著的技术亮点和优势:




1. 向量计算单元设计

Dubhe-83的Vector的VLEN=DLEN=256,配备2条128-bit的计算单元。此设计大幅提升向量计算能力,可同时处理2x128-bit的数据元素,在向量运算中充分发挥并行计算优势,加速数据处理。


2. 存储加载单元(LSU)设计

LSU采用2条Pipeline实现方式,Vector Load/Store和 Scalar Load/Store深度融合。Vector Load/Store带宽为2x128-bit,这种融合设计在满足高带宽需求的同时尽可能节省资源(面积)的开销,在数据加载和存储过程中,无论是向量数据还是标量数据,均可高效传输和处理,减少数据访问延迟,提高数据处理效率。


3. 向量工作方式与指令实现

Vector支持LMUL工作方式,每条Vector宏指令采用拆分uop实现方式。只要uop的所有Element在连续两个Cache Line范围内,则该 uop可一次性完成读/写操作。该设计优化了向量指令执行过程,减少指令执行周期,提升向量带宽。


4. 向量Load/Store uop实现优势

Vector Load/Store采用拆分uop实现方式,相较于一些厂商拆分Element的实现方式,在绝大多数应用场景中具有绝对性能优势。这种实现方式能更高效利用存储带宽,减少数据传输次数,提高数据加载和存储效率,进而提升整个系统性能。


5. 乱序执行机制

不仅Scalar采用深度乱序实现方式,Vector也采用深度乱序实现机制。与Vector按序实现方式相比,乱序方式能天然解决许多数据依赖场景。在实际应用中,数据间存在复杂依赖关系,按序执行可能因数据未准备好导致流水线停顿,而乱序执行可灵活调整指令执行顺序,优先执行不依赖未就绪数据的uop,显著提升性能。


6. RVV性能表现

与市场上一些通过In-Order实现的RVV产品相比,Dubhe-83在RiVEC基准测试套件(RiVEC Benchmark Suite,是一个由来自不同领域的数据并行应用程序组成的集合,该套件专注于对向量微架构进行基准测试,各个case的描述详见下表格)上有着显著的性能提升,提升从最少22%(Pathfinder)到最高817%(Matmul),其中,应用于高性能计算领域的几个BLAS算子模型的平均性能提升为357.55%,应用于金融分析/物理仿真/数据挖掘等领域的几个Dense Linear Algebra算子模型的平均性能提升为315.70%。这些实际应用场景中的性能优势,充分证明 Dubhe-83在RVV架构和微架构上的先进性和卓越性能表现,能更好满足用户对高性能计算的需求。

16556cb2-40e8-11f0-986f-92fbcf53809c.png

RiVEC Benchmark Suite


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20150

    浏览量

    247278
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261609
  • RISC-V
    +关注

    关注

    48

    文章

    2797

    浏览量

    51929
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于E203 RISC-V的音频信号处理系统 -协处理器的乘累加过程

    处理器简介 RISC-V具有很高的可扩展性,既预留出了指令编码空间,也提供了预定义的Custom指令;RISC-V的标准指令集仅使用了少部分指令编码空间,更多的指令编码空间被预留给用户进行扩展
    发表于 10-28 06:18

    提高RISC-V在Drystone测试中得分的方法

    Drystone 是一种常用的计算机性能基准测试,主要用来测量整数(非浮点)计算性能。 影响 RISC-V 在 Drystone 测试中得分的因素主要有以下几个: 处理器核心设计:
    发表于 10-21 13:58

    明晚开播 |开源芯片系列讲座第28期:高性能RISC-V处理器芯片

    鹭岛论坛开源芯片系列讲座第28期「高性能RISC-V处理器芯片」明晚(30日)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目高性能RISC-V处理器芯片报告简介
    的头像 发表于 07-29 17:02 1063次阅读
    明晚开播 |开源芯片系列讲座第28期:高性能<b class='flag-5'>RISC-V</b>微<b class='flag-5'>处理器</b>芯片

    知合计算RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为
    的头像 发表于 07-18 14:17 2376次阅读
    知合<b class='flag-5'>计算</b>:<b class='flag-5'>RISC-V</b>架构创新,阿基米德系列剑指高性能<b class='flag-5'>计算</b>

    直播预约 |开源芯片系列讲座第28期:高性能RISC-V处理器芯片

    鹭岛论坛开源芯片系列讲座第28期「高性能RISC-V处理器芯片」7月30日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目高性能RISC-V处理器芯片报告
    的头像 发表于 07-14 17:34 1002次阅读
    直播预约 |开源芯片系列讲座第28期:高性能<b class='flag-5'>RISC-V</b>微<b class='flag-5'>处理器</b>芯片

    RISC-V架构下的编译自动向量

    高性能算力生态的建设,正投入编译自动向量化优化等多项关键技术,全面助力RISC-V的高性能发展。RISC-V向量设计SpacemiT在
    的头像 发表于 06-06 16:59 942次阅读
    <b class='flag-5'>RISC-V</b>架构下的编译<b class='flag-5'>器</b>自动<b class='flag-5'>向量</b>化

    HPM5E31IGN单核 32 位 RISC-V 处理器

    HPM5E31IGN单核 32 位 RISC-V 处理器在当今嵌入式系统领域,RISC-V架构正以开源、灵活和高性价比的优势快速崛起。HPM5E31IGN作为先楫半导体的一款单核32位RISC
    发表于 05-29 09:23

    HXS320F28027数字信号处理器(32位RISC-V DSP)

    HXS320F28027数字信号处理器(32位RISC-V DSP)HXS320F28027是中科昊芯(Haawking)基于自主研发的H28x内核推出的32位定点RISC-V DSP架构数字信号
    发表于 05-21 10:21

    Condor使用Cadence托管云服务开发高性能RISC-V处理器

    Condor 是一家美国初创企业,致力于开发高性能 RISC-V处理器。公司的目标是通过创新技术彻底革新整个行业,打破高性能计算的极限。
    的头像 发表于 05-08 09:03 818次阅读

    关于RISC-V芯片的应用学习总结

    电子、医疗设备等领域,对处理器的可靠、实时和低功耗有较高要求。RISC-V芯片通过提供丰富的外设接口和高效的指令集,满足了嵌入式系统的多样化需求。同时,其开源特性降低了开发成本,加
    发表于 01-29 08:38

    RISC-V MCU技术

    发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V处理器、开发板还有软件工具啥的。 它为啥这么厉害呢?我跟你讲讲哈。 首先它是开源的,不要钱的,随便
    发表于 01-19 11:50

    Imagination放弃RISC-V处理器内核开发

    电子发烧友网报道(文/吴子鹏)根据外媒的最新报道,半导体IP大厂Imagination Technology已经停止了RISC-V处理器内核的开发,转而更加专注于其核心的GPU和AI产品
    的头像 发表于 01-10 00:15 3263次阅读

    Andes晶心科技推出D45-SE RISC-V处理器

    RISC-V International 的创始高级会员,今天宣布推出其领先行业的AndesCore D45-SE功能安全 RISC-V 处理器,该处理器以获得 ISO 26262
    的头像 发表于 12-26 10:54 1505次阅读

    RISC-V架构及MRS开发环境回顾

    Sherwani的预测,5年后RISC-V指令的处理器就有可能进军服务市场。 ③、RISC-V的应用之三:存储市场 硬盘本身并不需要像SSD那样庞大的
    发表于 12-16 23:08

    RISC-V 与 ARM 架构的区别 RISC-V与机器学习的关系

    现代计算机架构中,RISC-V和ARM是两种流行的处理器架构。它们各自具有独特的特点和优势,适用于不同的应用场景。 1. RISC-V架构
    的头像 发表于 12-11 17:50 4364次阅读