0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI浪潮下的基于RISC-V的DSA架构芯片

时擎科技 2023-08-05 08:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近,世界半导体大会在南京顺利闭幕。展会期间,记者采访到了时擎科技董事长蒋寿美,聊了聊关于DSA架构芯片的发展与时擎科技的战略规划。

时擎科技成立于2018年,一直专注于边端智能交互和信号处理芯片的研发。公司现有员工近百人,总部位于上海张江,并在无锡、深圳和香港设有子公司或分公司,成立以来先后完成过SIG海纳亚洲、浦东科创、邦明资本、海望资本、新尚资本、济南高新等知名投资机构的多轮投资。据了解,时擎科技是国内最早投入RISC-V处理器研发的团队之一,基于RISC-V指令架构研发了一系列领域专用架构的DSA智能处理器和DSP信号处理器。

过去,RISC-V在业界总被认为是ARM的替代品,而蒋寿美认为,在AI时代,RISC-V架构可以发挥更多潜力。

另起炉灶,没包袱


进入2023年,AI让芯片的算力得到无与伦比的表现。作为软件,AI可以说已经榨干了所有芯片的极限。而当摩尔定律脚步放缓,硬件成长速度变慢,算力从哪来?

目前,面对AI算法对硬件算力的压榨,实行专用架构,或者说对AI算法进行特定优化的芯片成为化解高算力需求的新趋势。目前专用芯片可以分为常规的CPUGPU,以及FPGAASIC。芯片从CPU到ASIC,专用性依次提升,但通用性也相应下降。ASIC作为专用芯片,它甚至只能跑固定算法,不过换来的则是超越所有芯片的运行速度与更低的功耗。有数据显示,相对同级别CPU、GPU,该类ASIC芯片可提高运算性能15倍至30倍,并提高能耗效率30倍至80倍。不过,目前AI算法还正处于快速迭代中,将算法直接固定下来显然不划算。因此,专用性与通用性两手抓的DSA架构与FPGA受到更多的关注。

2017年,David Patterson与John Hennessy在“体系结构的黄金年代”主题演讲中提出了DSA架构。相比FPGA,DSA更像是ASIC的升级版或回调版,而不是FPGA的改进。DSA可以为某类应用进行特定优化,实现更高的能效比。在RSIC-V高灵活性优势的加持下,DSA架构还能发挥出更多优势,其中就包括能耗。从另一方面来说,目前FPGA已较为成熟,已经有不少服务器用上了FPGA,但在新兴的边缘计算领域,由于对功耗较为敏感,DSA正在获取更多市场。

边缘AI,RISC-V的舞台


RISC-V并不是适合所有的AI模型。很明显,在AI大模型方面,由于其需要的极高算力与超高的相关资源消耗,让几乎所有RISC指令集望而却步。以ChatGPT这类大模型为例,据OpenAI测算,ChatGPT训练阶段总算力消耗约为3640 PF-days(约1PFLOP/s效率跑3640天),GPT-3训练成本预计能达到500万美元/次。

边缘AI,无法承载大模型对算力的高需求,瞄准单一领域、对算力要求相对低的小模型AI则可以施展拳脚,RISC-V的机会就来了。尤其是物联网领域,RISC-V已经展现出了优势。前文提到,RISC-V的轻量化带来灵活性优势,这一点也正好匹配了IOT领域的发展。2021年,RISC-V芯片数量已经突破10亿颗,其中最多应用在语音识别、AI视觉、智能家电、工业控制、物联网安全等领域。

c10f02da-3325-11ee-bbcf-dac502259ad0.pngc19ae188-3325-11ee-bbcf-dac502259ad0.png

基于AT1601的环形全向麦克风方案模组和成品应用

蒋寿美表示,时擎科技创立之初就瞄准AI物联网领域。“目前的物联网市场还相对碎片化,并不像手机、笔记本电脑等有很大很完整的市场,不过也应发现其发展趋势,凭借RISC-V架构的优势走进赛道,才有更好的发展。成立5年以来,时擎科技一直聚焦在AIOT领域,并不断在更多细分领域拓展业务。

从算法角度看,RISC-V指令集恰好与边缘AI算法相匹配,自然能在AIOT领域呼风唤雨。有专家认为,RISC-V的指令集可以根据具体的应用需求进行裁剪和定制,因此可以更好地适应不同的AI算法,包括深度学习神经网络等。更重要的是,AI算法,无论是大模型还是小模型,都离不开算力属性的支持。既要算力高,又要迭代快适应广,更轻更便捷的RISC-V非常适合。

还有一点非常重要,由于RISC-V指令集非常灵活,在设计芯片时,单个IP可以更加灵活的进行组合或重构(自行增减指令集或者核心数量),而不是必须遵守固有的IP协议,较死板的应用IP核。简单来说,RISC-V的IP相比其他IP还能继续“拆解”,以解决芯片设计的多种情况。同时,这也为RISC-V架构带来了更高的扩展性,设计师可以像玩乐高积木一样任意拆分模块,组合出理想中的芯片来。

c1ea0024-3325-11ee-bbcf-dac502259ad0.png

AT5050端侧智能视觉处理芯片及基于AT5050的UVC模组

时擎科技眼中的AI时代


就ARM或X86的选择上,一家中小规模的公司,一旦选择在某个指令集上发力,就要投入大量人力资源去迎合。那么RISC-V怎么从早已成熟的ARM架构中抢夺本来就稀缺的芯片人才呢?

蒋寿美表示,其实应用RISC-V指令集并不会给芯片设计工程师造成很大困难。ARM与RISC-V之间的切换,就像是具有数据结构知识的程序员,在C语言Python之间的切换一样。变化的只是指令,不变的是整体的设计理念。蒋寿美认为,一个熟练掌握ARM架构的设计师,可能仅需半个月就能切换到RISC-V的开发上来。

AI浪潮下,时擎科技发展加速。

据官方消息,公司近3年来取得了业绩的快速成长,尤其是在疫情和行业周期双重压力的2022年,公司依然取得了50%以上的业绩增长。2023年7月初,时擎科技宣布在上半年连续完成B+和B++轮融资。最近,国家工业和信息化部审核并公布了第五批专精特新“小巨人”企业名单,时擎科技凭借在端侧智能处理和交互领域的专业化深耕和自主创新能力,荣膺国家级专精特新“小巨人”企业称号。

最后,引用蒋寿美曾经讲过的一段话:“目前来说,端侧市场发展趋势快,且还没有形成确定的格局,但端侧AI芯片将会是千亿级人民币的市场。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54632

    浏览量

    470948
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077
  • DSA
    DSA
    +关注

    关注

    0

    文章

    54

    浏览量

    15909
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-VAI 基础设施创新路径探讨

    大模型浪潮AI 算力正向“本地推理”与“AI 工厂”两极延伸,而传统架构在低延迟与规模化之间往往顾此失彼。
    发表于 05-15 12:15

    Andes晶心科技剖析RISC-V在生成式AI浪潮的关键角色

    随着AI运算、功耗限制与成本压力重塑芯片设计市场,RISC-V已成为企业重新评估处理器策略的核心。在RISC-V生态系蓬勃发展的今日,开发者面临的核心挑战在如何于效能、功耗与硬件资源之
    的头像 发表于 04-23 11:28 497次阅读

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架构AI开发板,搭载KY X1八核处理器。该板以“CPU 融合AI”为核心理念,内置2TOPS算力,并支持双M.2 NVMe
    发表于 03-03 20:19

    RISC-V vs ARM:为什么工业与边缘计算仍然选择 ARM 架构

    芯片架构讨论中,RISC-V 和 ARM 的对比,已经从“技术选型”升级为“路线之争”。 一边是  RISC-V :开源、免授权、可定制、不受单一厂商控制;另一边是  ARM :成熟
    的头像 发表于 01-21 17:33 1085次阅读
    <b class='flag-5'>RISC-V</b> vs ARM:为什么工业与边缘计算仍然选择 ARM <b class='flag-5'>架构</b>?

    RISC-V市占,直逼25%

    的设计、授权与部署模式将发生巨变。在行业集体推动“架构主权”的浪潮RISC-V已从学术实验演进为下一代计算的核心支柱。两场重塑硅谷权力格局的重磅收购,进一步巩固
    的头像 发表于 12-30 10:36 824次阅读
    <b class='flag-5'>RISC-V</b>市占,直逼25%

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 在嵌入式、AI 系统等
    发表于 12-18 12:01

    探索RISC-V在机器人领域的潜力

    2基础包和相关依赖。 • 设置环境变量,确保ROS 2命令可以被正确识别。 遇到的挑战与解决: 在编译某些复杂的ROS功能包时,由于部分依赖库在RISC-V架构的版本较新或存在细微差异,曾出现过
    发表于 12-03 14:40

    是德科技如何解决RISC-V芯片测试难题

    想理解 RISC-V,得先从“指令集架构”说起,这是芯片的“语言”。
    的头像 发表于 11-14 09:44 2040次阅读
    是德科技如何解决<b class='flag-5'>RISC-V</b><b class='flag-5'>芯片</b>测试难题

    瑞芯微RISC-V芯片已量产,性能、功耗平衡更佳

    电子发烧友网综合报道 瑞芯微日前在互动平台公开表示,公司已基于RISC-V架构推出并量产新产品,后续将继续研发基于RISC-V架构的产品。   瑞芯微长期以Arm
    的头像 发表于 10-23 09:13 1.2w次阅读
    瑞芯微<b class='flag-5'>RISC-V</b><b class='flag-5'>芯片</b>已量产,性能、功耗平衡更佳

    借势 RISC-VAI 浪潮,元石智算打造算力新范式

    RISC-V架构崛起的双重浪潮,国产服务器系统行业正迎来关键发展机遇。 武汉元石智算科技有限公司(下文简称“元石智算”)作为国产服务器系统创新的佼佼者,敏锐洞察这一趋势,凭借对
    的头像 发表于 07-25 14:51 879次阅读
    借势 <b class='flag-5'>RISC-V</b>与 <b class='flag-5'>AI</b> <b class='flag-5'>浪潮</b>,元石智算打造算力新范式

    RISC-V+DSA:跃昉科技袁博浒解析芯算格局重塑的技术路径

    RISC-V+DSA:重塑芯算格局的必然选择》的主题演讲,深入探讨了RISC-V架构与特定领域加速架构DSA)结合的技术路径及其在高性能
    的头像 发表于 07-23 10:32 1057次阅读
    <b class='flag-5'>RISC-V+DSA</b>:跃昉科技袁博浒解析芯算格局重塑的技术路径

    同一水平的 RISC-V 架构的 MCU,和 ARM 架构的 MCU 相比,运行速度如何?

    ARM 架构RISC-V 架构的 MCU 在同一性能水平的运行速度对比,需从架构设计原点、指令集特性及实际测试数据展开剖析。以 ARM
    的头像 发表于 07-02 10:29 1825次阅读
    同一水平的 <b class='flag-5'>RISC-V</b> <b class='flag-5'>架构</b>的 MCU,和 ARM <b class='flag-5'>架构</b>的 MCU 相比,运行速度如何?

    RISC-V架构AI融合算力及其软件栈实践

    面对未来大模型(LLM)、AIGC等智能化浪潮的挑战,进迭时空在RISC-V方向全面布局,通过精心设计的RISC-VDSA架构以及软硬一体的优化策略,将全力为未来打造高效且易用的
    的头像 发表于 06-06 17:04 1696次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>架构</b><b class='flag-5'>下</b><b class='flag-5'>AI</b>融合算力及其软件栈实践

    RISC-V架构CPU的RAS解决方案

    RISC-V架构以追赶者的姿态在多个应用领域与X86架构和ARM架构展开竞争。在服务器应用领域,RISC-V
    的头像 发表于 06-06 17:03 2106次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>架构</b>CPU的RAS解决方案

    RISC-V架构的编译器自动向量化

    进迭时空专注于研发基于RISC-V的高性能新AICPU,对于充分发挥CPU核的性能而言,编译器是不可或缺的一环,而在AI时代,毫无疑问向量算力将发挥越来越重要的作用。进迭时空非常重视RISC-V
    的头像 发表于 06-06 16:59 1557次阅读
    <b class='flag-5'>RISC-V</b><b class='flag-5'>架构</b><b class='flag-5'>下</b>的编译器自动向量化