0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通用计算仍有差距,RISC-V可靠矢量处理弯道超车

E4Life 来源:电子发烧友网 作者:周凯扬 2022-10-20 03:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)对于高效的数据并行负载处理来说,矢量架构的吸引力越来越大,主流ISA都开始注意到这一点。就拿我们熟悉的前超算王者——日本的富岳来说,其处理器富士通A64FX就是基于Arm可伸缩矢量扩展(SVE)的。

Arm也在随后推出的Armv9架构中提出了改良版的SVE2,并在其中加入了对NEON的兼容,SVE2在HPC之外的市场应用中做出了指令优化,甚至可以用于手机、汽车等智能设备中。

正是因为有了SVE的存在,富岳才得以单靠通用处理器完成高性能的大数据运算,而不是像其他主流超算一样,还要靠堆积GPUFPGAAI加速器等片外加速器才能实现可观的性能,我国的神威太湖之光同样运用了这样的矢量设计思路。但以上这些都是专有架构,微架构不透明的同时也限制了开源和定制化方案的出现,而这些均可以在RISC-V上一一实现。

RISC-V矢量处理器的吸引力

RISC-V的矢量扩展RVV自2015年提出以来,已经有了长足的进展,也有了正式的1.0版本规范。与传统的SIMD指令相比,RVV提供动态的矢量长度修改,做到了更高的效率、更小的代码体积和更简单的循环结束。我们近期已经看到了不少RISC-V处理器被广泛使用的新闻,比如谷歌选择在其TPU上加入SiFive的X280处理器,其实看重的就是它在矢量处理上的优势。
CleanShot 2022-10-19 at 16.01.37@2x
SiFive矢量处理器 / SiFive
所以我们看到在SiFive的处理器产品中,像Performance P270和Intelligence X280都拥有优秀的矢量处理能力,后者更是引入了一个512位矢量寄存器长度的架构,在完全支持矢量扩展标准的同时,还支持动态可变矢量长度的运算。SiFive也在其矢量扩展上做出了改进,称其为SiFive智能扩展,与直接基于RV64GCV架构的设计相比,X280的智能扩展在INT8格式下的矩阵乘法运算时可将执行速度提高12倍。

而且这不仅仅造福的是数据中心,还有受制于功耗却又需要高吞吐量和单线程性能的边缘应用,比如AR/VR数码相机等等。SiFive同样测试了可用于移动端或嵌入式设备的轻量级神经网络MobileNet,相较基于RISC-V标量的架构,SiFive智能扩展可以将速度提升144倍。

同样的还有晶心科技推出的RISC-V矢量处理器NX27V,该处理器采用了5级流水线的设计,晶心为其设计了强大的矢量处理单元,拥有32个矢量寄存器,最高支持512位的矢量长度,为了进一步支持AI应用,晶心还为其增加了BF16和INT4的数据格式支持。据正在打造可扩展的高性能AI超算的初创公司Luminous Computing透露,他们打造的系统用到了数百个NX27V VPU核心,极大地提升了该系统的深度学习性能。

开源RISC-V矢量处理器

RISC-V作为开源架构最棒的一点就在于,总是不缺香山处理器这样优秀的开源方案。比如2019年推出的Ara就是一款高效矢量协处理器,用于辅助OpenHW的CVA6 RISC-V应用处理器Ara,只不过Ara刚发布之际还是基于早期的RVV规范设计的。

来自苏黎世联邦理工学院(ETH)和华为苏黎世研究中心的研究员们借助Ara的启发,基于RVV1.0发表了一个开源的高效RISC-V矢量处理器设计。他们基于格芯的22FDX工艺进行了吞吐量和PPA的验证,整个系统运行频率为1.34GH,在关键的矩阵乘法内核下,FPU的利用率可以达到98%以上。

相较之下,SiFive的X280和另一个开源矢量协处理器Vicuna宣称的FPU利用率大于90%,伯克利的开源方案Hwacha可以做到95%以上。为了展示从RVV扩展这么多年以来的改进,他们也与基于RVV 0.5版下的设计做了对比,结果是在面积占用上有了15%的提升,吞吐量也有了6%的提升,双精度计算效率也做到了37.1GFLOPS/W。

结语

AI时代下,矢量处理的应用场景已经远超我们的现象,包括深度学习、推荐系统、键值存储和HPC等,都已经广泛利用了矢量计算。但如何做到高效高性能,才是未来所有ISA的努力方向,而RISC-V作为后来者,反而能在这上面找到弯道超车的机会。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • RISC-V
    +关注

    关注

    49

    文章

    2996

    浏览量

    53735
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    图解芯技术 | RISC-V 同构融合计算

    图解芯技术 | RISC-V 同构融合计算
    的头像 发表于 05-20 18:04 130次阅读
    图解芯技术 | <b class='flag-5'>RISC-V</b> 同构融合<b class='flag-5'>计算</b>

    奕斯伟计算RISC-V创新成果亮相Embedded World 2026

    2026年3月10-12日,全球嵌入式领域顶级盛会Embedded World 2026在德国纽伦堡举行。作为基于RISC-V架构的芯片产品提供商,奕斯伟计算RISC-V创新成果亮相,充分展现了奕斯伟
    的头像 发表于 03-11 16:48 535次阅读
    奕斯伟<b class='flag-5'>计算</b>携<b class='flag-5'>RISC-V</b>创新成果亮相Embedded World 2026

    RISC-V vs ARM:为什么工业与边缘计算仍然选择 ARM 架构?

    完整,占据工业与边缘计算主流。 既然 RISC-V 看起来更“先进”,为什么工业界和工程项目依然大量选择 ARM? 本文从 工程实现、软件生态和项目风险 三个技术视角,拆解这个问题。 一、先明确事实:RISC-V 不由任何公司控
    的头像 发表于 01-21 17:33 1101次阅读
    <b class='flag-5'>RISC-V</b> vs ARM:为什么工业与边缘<b class='flag-5'>计算</b>仍然选择 ARM 架构?

    RISC-V,正式崛起

    编译自financialcontent全球半导体行业迎来里程碑式的变革:开源指令集架构(ISA)RISC-V已于2026年1月正式占据全球处理器市场25%的份额。这一里程碑标志着x86和Arm长期双
    的头像 发表于 01-16 15:17 986次阅读
    <b class='flag-5'>RISC-V</b>,正式崛起

    Banana Pi BPI-CM6 计算模块将 8 核 RISC-V 处理器带入 CM4 外形尺寸

    Banana Pi BPI-CM6是一款紧凑型“计算模块”,本质上是一块小型高性能计算机板,它采用的是 RISC-V 处理器,而非更常见的 ARM 芯片。其
    发表于 12-20 09:01

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    之后,要打造的是高可靠性、高能效还支持可扩展的 RISC-V 设计方案。而且合作的核心目标特别明确: 让 RISC-V 处理器在嵌入式、物联网、AI 系统里更快普及; 用集成式 IP
    发表于 12-18 12:01

    探索RISC-V在机器人领域的潜力

    的硬件配置给人留下了深刻的第一印象: • 核心处理器: 搭载了进迭时空的K1系列高性能RISC-V处理器,具备强大的通用计算能力和AI加速特性。 • 内存与存储: 板载LPDDR4
    发表于 12-03 14:40

    为什么RISC-V是嵌入式应用的最佳选择

    最近RISC-V基金会在社交媒体上发文,文章说物联网和嵌入式系统正在迅速发展,需要更高的计算性能、更低的功耗和人工智能。RISC-V是为未来而建的,包括超高效的MCU到高性能应用处理
    的头像 发表于 11-07 10:09 1966次阅读

    大湾区RISC-V生态全景展示:RISC-V生态发展论坛、开发者Workshop和生态应用专区

    继7月份上海的RISC-V中国峰会之后,中国RISC-V生态和产业发展最新动态将在10月份深圳的湾芯展上全景展示。   RISC-V,这个以开放、简约、模块化重塑处理器架构格局的开源指
    的头像 发表于 10-13 09:18 850次阅读
    大湾区<b class='flag-5'>RISC-V</b>生态全景展示:<b class='flag-5'>RISC-V</b>生态发展论坛、开发者Workshop和生态应用专区

    奕斯伟计算亮相2025 RISC-V中国峰会

    国际交流合作。奕斯伟计算高级副总裁、首席技术官何宁博士在主论坛发表《产业赋能:RISC-V场景化方案创新与生态协同》主题演讲,阐述了奕斯伟计算RISC-V场景化应用与生态建设上的战略
    的头像 发表于 07-22 17:34 1461次阅读

    知合计算RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为
    的头像 发表于 07-18 14:17 3119次阅读
    知合<b class='flag-5'>计算</b>:<b class='flag-5'>RISC-V</b>架构创新,阿基米德系列剑指高性能<b class='flag-5'>计算</b>

    RISC-V 工具链的版本更新、开发动态及生态建设愿景

    架构能否突破 “硬件强、软件弱” 的瓶颈,真正成为具有竞争力的通用计算架构。   2025 年 7 月 18 日,在第五届(2025)RISC-V 中国峰会的软件与生态系统分论坛上,SiFive
    发表于 07-18 11:08 5225次阅读
    <b class='flag-5'>RISC-V</b> 工具链的版本更新、开发动态及生态建设愿景

    RISC-V International CEO:RISC-V 应用全面开花,2031 年渗透率将达 25.7%

    and RISC-V Adoption in 2025》。   当前,RISC-V 的成功已从嵌入式计算领域加速向存储技术与高性能计算(HPC)领域渗透,展现出跨行业的颠覆性潜力。A
    发表于 07-17 10:28 3843次阅读
    <b class='flag-5'>RISC-V</b> International CEO:<b class='flag-5'>RISC-V</b> 应用全面开花,2031 年渗透率将达 25.7%

    RISC-V和ARM有何区别?

    在微处理器架构领域,ARM与RISC-V是两个备受关注的体系。ZLG致远电子在推出ARM核心版后,又推出了基于RISC-V的MR6450核心版,这引发了人们对这两种架构差异的深入探讨。ARM
    的头像 发表于 06-24 11:38 2399次阅读
    <b class='flag-5'>RISC-V</b>和ARM有何区别?

    HPM5E31IGN单核 32 位 RISC-V 处理

    HPM5E31IGN单核 32 位 RISC-V 处理器在当今嵌入式系统领域,RISC-V架构正以开源、灵活和高性价比的优势快速崛起。HPM5E31IGN作为先楫半导体的一款单核32位RISC
    发表于 05-29 09:23