0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI大模型这股东风,RISC-V该如何乘?

时光流逝最终成了回忆 来源:电子发烧友网 作者:吴子鹏 2023-12-04 06:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)说起AI大模型的训练和推理,很多人的第一想法肯定是英伟达芯片,那么背后也就是ARM架构。统计数据显示,在AI芯片领域,英伟达一家独占七成市场份额;如果单独看AI大模型训练芯片,正如花旗研究分析师Christopher Danely提到的,英伟达的市场占比超过九成。

实际上,即便是谷歌、亚马逊、Meta、IBM及其他一些企业提供的AI芯片,背后的架构也基本是ARM架构。那么,目前同样大火的RISC-V架构是否能够在AI大模型市场捕捉到机会呢?

RISC-V在AI大模型领域的尝试

当然,虽然在芯片性能方面还无法和ARM架构芯片正面抗衡,不过RISC-V架构阵营也没有坐以待毙,而是在积极探索进入AI大模型市场的机会,且已经有一些成果。

在今年的世界互联网大会乌镇峰会上,希姆计算联合国鑫发布基于RISC-V架构打造的大模型系列一体机,包括2U4卡、4U8卡机,支持部署6B、7B、13B参数规模的大模型。

这就是很好的联动,希姆计算成立于2019年4月,成立之初就确立了基于RISC-V指令集设计数据中心高性能芯片的技术路线、由专用计算(DSA,领域专用架构)向通用计算(CPU)逐步演进的发展战略。目前,该公司已经有一款加速卡产品——STCP920。

STCP920是希姆计算基于RISC-V架构打造的人工智能计算加速卡,混合支持FP16/INT8数据类型。算力表现为:半精度浮点运算速度(FP16)为128TFLOPS;整数运算速度(INT8)为256 TOPS。内存类型为LPDDR4X,内存带宽为119.4GB/S。

国鑫则是中国领先的服务器解决方案供应商,具有全产业链的自主研发能力和生产能力,是目前中国屈指可数的集研发、生产、销售、服务于一体的服务器和存储软硬件厂商之一。目前,该公司在智算中心方面的服务器主要还是基于英特尔AMD的芯片产品。

再看另一个案例,来自芯至科技。该公司今年才开始正式运营,不过却在助推RISC-V进入大模型运算方面做出了突出的成绩。根据该公司官网信息,芯至科技在今年发布了全球首款Risc-V based GPGPU SIMT核——焦山核(Turbocore)V100。

焦山核V100全面支持SIMT,支持RV32G指令集,支持Tensor扩展指令集,支持类CUDA编程模型,提供硬件任务调度,指令并行度为32Threads*128。可被用于GPGPU进行AI推理等多种场景,单核性能不低于16T Int8/GHz,预计采用12nm工艺流片,频率将不低于1.2GHZ。

芯至科技联合创始人、首席芯片架构师兼副总裁尹文此前表示,AI大模型落地到推理侧的新机会与RISC-V架构创新不谋而合,Scaler小标量+SIMT大算力的指令集/微架构融合将是未来RISC-V发力的重点,能以相对低的成本,为AI推理侧应用提供高效支持。

尹文这种“RISC-V可以做线程级并行AI计算”的想法,和英特尔是不谋而合的。英特尔Piuma是一个定制RISC内核的特殊芯片,它的特殊之处在虽然只有8个核心,但是却有528个线程,单核拥有66个线程。另外,Piuma芯片还具有非常恐怖的互联能力,最多可以实现131072个Piuma芯片互连,让一个芯片集群拥有1680万个核心,这会带来非常恐怖的数据并行能力。虽然英特尔没有说这是RISC-V内核,但是技术上是一脉相通的,给行业发展提供了一个全新的思路。

另外,我们看一下阿里平头哥,该公司最近连发了三颗RISC-V处理器内核——首次实现AI矩阵扩展的C907、满足Vector1.0标准的C920,以及实时处理器R910。其中,C920已经新增支持Transformer模型,C907首次实现了独立矩阵运算(Matrix)扩展,这些内核都表明商用RISC-V内核确实在向着AI大模型的核心战场进展,满足性能指标只会是时间问题。

除了上述提到的,另外国芯科技和上海清华国际创新中心、智绘微电子已经签署了关于开源RISC-V GPGPU合作开发的备忘录,这也是一种积极的探索。从理论上说,RISC-V的Vector扩展支持用GPGPU方式来执行,那么基于RISC-V实现GPGPU就有了可行性。

RISC-V在AI大模型领域的挑战

根据此前的报道,在一项专业基准测试中,专注高性能RISC-V芯片的Tenstorrent推出基于自有处理器内核的RISC-V CPU芯片,该芯片的评分领先于英特尔的Sapphire Rapids、英伟达的Grace和AMD的Zen4。这说明,在传统CPU方向上,RISC-V架构已经开始崭露头角,证明了RISC-V架构做高性能芯片的能力,那么在AI大模型方面会遇到哪些挑战呢?

在AI大模型这类型应用中,RISC-V架构第一大挑战肯定是内核本身。通过美国对于我国的AI芯片禁令就可以看出,AI芯片做大模型训练是有一定门槛的,低于这个门槛效果就会大打折扣,虽然RISC-V架构已经做了很多尝试,不过总体性能和长期深耕GPU领域的ARM架构肯定没法比。当然,英特尔和芯至科技这类尝试说明,RISC-V架构可以率先攻克大模型推理芯片市场以及终端一体机市场。

在性能背后就会牵扯出第二问题——专利。英伟达等芯片厂商以及Arm公司在高性能计算芯片领域储备了大量的专利,为了追求极致的运算性能,很多方式方法都已经被论证过了,并形成了专利,要绕开这些专利限制实现高性能计算芯片,进一步提升了相关厂商的研发难度。

第三个问题也是一个老生常谈的问题,那就是生态。AI大模型这类型的应用,无论是训练端还是推理端,都会是一个软硬件结合的系统,尤其是具体到某一个细分领域的推理应用,具有丰富的上层应用,也就需要更高效的软硬件融合。不过,目前对于RISC-V架构而言,很多生态还是荒漠,比如DDK、接口、中间件这些关键的生态工具,基本还没有。

小结

还记得之前平头哥的观点:RISC-V将成为AI时代的原生架构,各行业芯片都值得用RISC-V做一次。那么,应用于AI大模型的芯片也是如此。不过,目前应用于这一领域的芯片还在高速地发展,这给RISC-V架构增加了追赶的难度,且生态封闭的问题需要从业者有更大的勇气和决心。目前,RISC-V在AI大模型应用中已经有所尝试,接下来要做到的就是完善产品和生态,没有其他捷径可走。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41479

    浏览量

    302803
  • RISC-V
    +关注

    关注

    49

    文章

    2961

    浏览量

    53619
  • AI芯片
    +关注

    关注

    17

    文章

    2170

    浏览量

    36872
  • 阿里平头哥
    +关注

    关注

    0

    文章

    9

    浏览量

    1964
  • 大模型
    +关注

    关注

    2

    文章

    3814

    浏览量

    5283
  • 芯至科技
    +关注

    关注

    0

    文章

    4

    浏览量

    339
  • AI大模型
    +关注

    关注

    0

    文章

    413

    浏览量

    1049
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Andes晶心科技剖析RISC-V在生成式AI浪潮下的关键角色

    。为协助开发者在复杂应用情境中精准定位,从实务开发的技术支持,到前瞻AI模型的架构演进,RISC-V展现极高的灵活性与适应力。
    的头像 发表于 04-23 11:28 420次阅读

    凌思微亮相2026玄铁RISC-V生态大会

    3月24日,2026玄铁RISC-V生态大会于上海圆满落幕,这场汇聚政企研大咖与领军企业的全球RISC-V生态核心盛会,全方位展现了架构在AI
    的头像 发表于 03-25 14:06 419次阅读

    RT-Thread 邀您参与“开放・连接”2026玄铁 RISC-V 生态大会,携手共铸 RISC-V“芯”纪元

    上海世博桐森酒店盛大启幕。此次玄铁RISC-V生态大会将同步设置2场分论坛,与主论坛形成「1+2」的创新洞见矩阵,届时大会全天将全景呈现RISC-VAI模型时代
    的头像 发表于 03-22 10:05 650次阅读
    RT-Thread 邀您参与“开放・连接”2026玄铁 <b class='flag-5'>RISC-V</b> 生态大会,携手共铸 <b class='flag-5'>RISC-V</b>“芯”纪元

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架构的AI开发板,搭载KY X1八核处理器。板以“CPU 融合AI”为核心理念,内置2TOPS算力,并支持双M.2 NVMe
    发表于 03-03 20:19

    新思科技VC Formal解决方案在RISC-V验证中的应用

    ——地球上人均 6 颗。从“RISC-V 将无处不在”到“RISC-V,就现在”,RISC-V 已几乎覆盖所有应用。当前,RISC-V 已成功跻身世界主流处理器市场,不再局限于低功耗小
    的头像 发表于 02-24 16:38 849次阅读

    进迭时空发布新一代RISC-V AI CPU芯片,满足端侧大模型算力需求

    电子发烧友网报道 1月29日,进迭时空线上发布新一代AI CPU芯片——K3。作为全球首颗符合RVA23规范的量产RISC-V芯片,K3实现多项技术创新:首次全球量产1024位宽高并行计算,达成
    的头像 发表于 01-30 14:06 9602次阅读

    Powered by XuanTie,Qwen Inside:阿里通义大模型携手玄铁 RISC-V开启“端侧智能”新纪元

    AI 迈向“端边云协同”的新时代,大模型的价值不仅在于云端的超强算力,更在于能否高效、低成本地部署到千行百业的终端设备中。近日,阿里通义大模型与达摩院旗下玄铁 RISC-V 宣布将
    的头像 发表于 01-12 11:49 427次阅读
    Powered by XuanTie,Qwen Inside:阿里通义大<b class='flag-5'>模型</b>携手玄铁 <b class='flag-5'>RISC-V</b>开启“端侧智能”新纪元

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 在嵌入式、AI 系统等
    发表于 12-18 12:01

    探索RISC-V在机器人领域的潜力

    的硬件配置给人留下了深刻的第一印象: • 核心处理器: 搭载了进迭时空的K1系列高性能RISC-V处理器,具备强大的通用计算能力和AI加速特性。 • 内存与存储: 板载LPDDR4内存和eMMC
    发表于 12-03 14:40

    为什么RISC-V是嵌入式应用的最佳选择

    最近RISC-V基金会在社交媒体上发文,文章说物联网和嵌入式系统正在迅速发展,需要更高的计算性能、更低的功耗和人工智能。RISC-V是为未来而建的,包括超高效的MCU到高性能应用处理器,RISC-V使开发人员能够设计以下解决方案
    的头像 发表于 11-07 10:09 1892次阅读

    十万元奖金池!首届全国RISC-V高水平创新及应用大赛火热进行中

    应用创新赛道 :依托自主研发的K1 芯片平台MUSE Pi Pro单板计算机进行命题,围绕边缘计算智能终端开发、AI模型部署落地、AI人工智能助手、开源鸿蒙软件应用四大方向的RISC-V
    发表于 09-25 13:56

    RISC-V 手册

    以下是关于RISC-V的详细介绍,结合其核心技术特点与当前发展现状:核心概念RISC-V(第五代精简指令集)是一种基于精简指令集(RISC)的开源指令集架构(ISA),由加州大学伯克利分校于2010
    发表于 07-28 16:27 11次下载

    2025新思科技RISC-V科技日活动圆满结束

    新思科技深度参与2025 RISC-V中国峰会并于2025年7月16日举办同期活动“新思科技RISC-V科技日”技术论坛,聚焦“从芯片到系统重构RISC-V创新”主题,议题覆盖当前最前沿的技术领域
    的头像 发表于 07-25 17:31 1639次阅读

    RISC-V和ARM有何区别?

    RISC-VARM是一种精简指令集(RISC),以指令集为基础的处理器通常被称为ARM芯片,它在全球范围内得到了极为广泛的应用。而RISC-V也是精简指令集,是美国加
    的头像 发表于 06-24 11:38 2316次阅读
    <b class='flag-5'>RISC-V</b>和ARM有何区别?

    DC-ROMA RISC-V AI PC 正式发布!

    01RISC-V历史进程的重要里程碑深度数智携手Framework,并采用奕斯伟计算的先进RISC-V多功能智能计算SoC——EIC7702X(搭载8核SiFive高性能P550CPU内核,预装
    的头像 发表于 05-13 08:03 1273次阅读
    DC-ROMA <b class='flag-5'>RISC-V</b> <b class='flag-5'>AI</b> PC 正式发布!