0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

进迭时空同构融合技术加速大模型AI应用创新

进迭时空 2025-06-06 16:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

同构融合技术


为了加速AI计算,芯片企业设计了多种专用处理器架构,如GPGPU、NPU、TPU等。这些专用处理器架构在执行调度代码及应用层代码时,需要主控CPU的配合,如下图所示。因此,通常需要构建复杂的异构调度系统来协调CPU和XPU的额外数据交互和同步。


进迭时空践行的同构融合技术,创新性地在CPU内集成TensorCore,以RISC-V指令集为统一的软硬件接口,驱动Scalar标量算力、Vector向量算力和 Matrix AI算力,支持软件和AI模型同时在RISC-V AI核上运行,并通过程序正常跳转实现软件和AI模型之间的事件和数据交互,进而完成整个AI应用执行。我们将这种使用同构融合技术,得到具有AI算力的CPU称为AI CPU。


f223d4dc-42b3-11f0-986f-92fbcf53809c.png



同构融合技术以更轻的软件基础设施构建接近Nvidia的软件层级


虽然市面上已有多种不同架构且硬件做的非常出色的AI加速器,但是除了AIOT细分场景之外,Nvidia占据了AI计算绝大多数市场份额,成为AI计算主流架构,并深刻影响工业界学术界AI计算的发展。Nvidia通过CUDA将异构开发的门槛降至最低,并基于多层级的软件栈构建了护城河。基于这些软件栈,全球开发者都在壮大Nvidia生态。很多企业的GPGPU发展策略是硬件上学习Nvidia,软件上兼容CUDA生态。由于很难跟上Nvidia的快速迭代,这条路径并不容易实现。


同构融合有望成为新的发展路径。相比于异构加速器和CPU的组合,同构融合技术在硬件层面上对AI算力和通用CPU进行了更高层次的封装,用户不需要关心主控CPU和异构加速器之间的数据同步,并且保留了通用CPU的调试和开发方式。厂商不需要开发复杂的异构调度系统,也不需要开发额外的驱动管理就可以让开发者便捷的使用AI算力。另外,同构融合技术中CPU的通用性和RISC-V架构良好的开源生态基础,进一步降低了需要自建软件栈的复杂度。


综上,进迭时空基于开源软件生态,以更轻的基础软件设施,构建了接近Nvidia的软件层级,如下图所示。我们的目标是,基于这些软件层级,达到接近Nvidia的AI通用性。


f235c71e-42b3-11f0-986f-92fbcf53809c.jpg


1

在模型加速层面,与Nvidia一样,进迭时空的推理引擎可以非常便捷的接入各主流第三方框架

2

在Tensor及多维数据块层面,SpineDNN、SpineTriton及SpineJit分别对标CUDNN、CUTLASS及CUTE

3

在Scalar及Vector层面,SpineDPC++可以对标CUDA

4

最底层的寄存器层面,标准的Intrinsic接口则对标Nvidia的PTX接口



进迭时空同构融合技术实践


进迭时空基于同构融合技术完成两代通用RISC-V AI核的研发。


第一代RISC-V AI核A60实现2Tops算力,支持INT8等数据格式。A60核已经应用于RISC-V AI CPU芯片K1,实践表明,同构融合AI算力可以无缝运行所有AI算法,更安全地加速从TEE到REE所有AI应用。RISC-V AI CPU芯片K1也是第一个完整提供Scalar、Vector和Matrix三个维度关键算力的RISC-V芯片。在运行常见的AI算法时,K1的实际性能是传统芯片的3-5倍,某些AI应用帧率提升可达10倍以上。


尤其是在运行大模型算法时,Matrix算力可以从容应对prefill阶段的算力需求,CPU出色的访存系统可以解决decode阶段的带宽需求,无需构建复杂的异构计算调度系统。此外,由于CPU的通用性,可以支持几乎所有低bit量化方式,将带宽需求降至最低。


更重要的是,将整个AI应用涉及的计算步骤全部迁移至AI CPU上,还可以为客户提供更加简单高效的开发方式。不仅能够避免在多个硬件设备上开发和调试,而且在一个编程模型覆盖AI开发全过程,能够让部署和调试变得轻松,让算法快速实现价值。例如,K1芯片在客户场景下,可以把在传统NPU上适配新算法所需的3-6个月时间压缩到1周以内,K1芯片已支持多个客户在语音和机器视觉领域快速开发了基于最新AI大模型的产品。


第二代RISC-V AI核A100已经研发完毕,预期无论在大模型运行效率方面,还是运行传统AI效率方面都能达到业界先进水平。


此外在算力堆叠方面,同构融合技术路线通过采用Core-to-Core coherence和Cluster-to-Cluster coherence,能以与GPU相同的技术实现多芯片级联和算力堆叠。与总线的Die2Die一致性技术结合后,通往多芯片算力堆叠的规模有望接近现有最先进GPU集群。



同构融合技术适合运行MoE大模型


MOE模型(Mixture of Experts,混合专家模型)是一种基于分而治之策略的神经网络架构,它将复杂的问题分解为多个子问题,每个子问题由一个独立的模型(称为专家)进行处理。MOE模型在单请求推理场景,每个token只需要使用部分专家参与计算。这些专家共同组成了MOE模型的激活参数。以DeepSeek-R1模型为例,671B的模型,只有37B的激活参数。对于FP8的模型,相当于需要将近700GB的容量来存放模型所有的权重,但是在进行单请求推理时,每个token只需要使用将近40GB的权重。相比于Dense模型,MOE模型是一个大容量,弱带宽的推理需求。相较于GDDR和HBM,内存容量更容易扩展;再加上专家的选择是动态的,其计算和访存模式是CPU极其擅长的。


GPU与NPU适合密集的重复计算模式,而CPU适合复杂调度场景下的计算模式,AI CPU介于两者之间。MoE的兴起,代表了一个兼具大容量与复杂逻辑的大模型发展趋势,而这正是AI CPU的发力场景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38271

    浏览量

    297321
  • 大模型
    +关注

    关注

    2

    文章

    3462

    浏览量

    4997
  • 进迭时空
    +关注

    关注

    0

    文章

    50

    浏览量

    301
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    聚势前行,携手共进|时空亮相 ICCAD-Expo 2025

    11月20日至21日,2025集成电路发展论坛(成渝)暨第三十一届集成电路设计业展览会(ICCAD-Expo2025)在成都西博城隆重举行。时空作为RISC-V领域的重要创新力量受
    的头像 发表于 11-22 09:04 792次阅读
    聚势前行,携手共进|<b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>亮相 ICCAD-Expo 2025

    时空双周报(20251022-1121)

    = \"okay\"; } 软件与系统 【 问题 】请问一下时空的 K1 芯片,目前有支持 RTOS 吗?我想在 K1 上跑 RTOS,但在网上没找到相关的开发包。请问官方有提供
    发表于 11-21 17:34

    芯聚成都 | 时空邀您共赴 ICCAD-Expo 2025

    芯聚成都 | 时空邀您共赴 ICCAD-Expo 2025
    的头像 发表于 11-14 18:02 3487次阅读
    芯聚成都 | <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>邀您共赴 ICCAD-Expo 2025

    取之于开源,贡献于开源:时空AI计算生态开源贡献

    开放创新时空的企业价值观之一,公司的软硬件技术栈构建在开源之上,同时也积极在操作系统、编译器、AI
    的头像 发表于 10-21 09:03 5325次阅读
    取之于开源,贡献于开源:<b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b><b class='flag-5'>AI</b>计算生态开源贡献

    十万元奖金池!首届全国RISC-V高水平创新及应用大赛火热进行中

    终端需融合多模态感知与决策能力,但面临异构计算资源紧张、多模型协同效率低等挑战。本赛题要求基于时空RISC-V
    发表于 09-25 13:56

    校园招聘 | 时空2026校园招募令

    校园招聘 | 时空2026校园招募令
    的头像 发表于 09-11 09:05 649次阅读
    校园招聘 | <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>2026校园招募令

    时空与青少年共赴RISC-V AI科技未来!

    8月15日至25日,首届乌镇青少年科技嘉年华圆满落幕。时空受邀亮相世界互联网科技馆"乌镇硅谷"体验区,展示了多款基于K1芯片的智能产品,为青少年带来沉浸式的RISC-V与AI
    的头像 发表于 08-28 17:53 1025次阅读
    <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>与青少年共赴RISC-V <b class='flag-5'>AI</b>科技未来!

    芯活力,搏未来——2025时空应届生入职培训

    为助力应届新员工快速融入公司文化、提升团队协作能力,时空精心策划了“芯活力,搏未来”2025应届生入职培训。本次培训以“学习+体验+成长”为核心,采用“室内课程+户外拓展”的形式,让新芯们在互动
    的头像 发表于 08-06 16:42 1615次阅读
    芯活力,搏未来——2025<b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>应届生入职培训

    迎接泛机器人时代:时空如何以RISC-V架构数智未来

    21世纪经济报道记者赵娜杭州报道“这是我们的时代。”今年8月的一天,21世纪经济报道记者来到时空杭州总部。
    的头像 发表于 06-06 17:00 850次阅读
    迎接泛机器人时代:<b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>如何以RISC-V架构数智未来

    高校赛事 | 时空携手蓝桥杯,诚邀全国高校学子共启RISC-V人工智能应用创新赛道

    以下文章来源于RISC-V先锋,作者时空2025年5月12日,第十六届蓝桥杯数字科技创新(RISC-V应用创新)命题赛正式启动。本次大赛
    的头像 发表于 06-06 16:55 1690次阅读
    高校赛事 | <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>携手蓝桥杯,诚邀全国高校学子共启RISC-V人工智能应用<b class='flag-5'>创新</b>赛道

    大象机器人携手时空推出 RISC-V 全栈开源六轴机械臂产品

    全球80多个国家和地区。 近日,大象机器人联合时空推出全球首款RISC-V全栈开源六轴机器臂“myCobot 280 RISC-V”,为开发者打造全新的机器人开源创新平台。 “my
    发表于 04-25 17:59

    大象机器人×时空联合发布全球首款RISC-V全栈开源小六轴机械臂

        在全球AI与机器人技术高速发展的浪潮中,中国公司始终坚定走在自研创新的道路上。     4月25日,大象机器人与 国内RISC-V AI CPU芯片领军企业【
    的头像 发表于 04-25 14:19 1485次阅读
    大象机器人×<b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>联合发布全球首款RISC-V全栈开源小六轴机械臂

    RISC-V+OpenHarmony5.0:时空与中科院共筑数字世界新基石

    为了紧跟产业发展的步伐,满足市场对高效、开放技术解决方案的迫切需求,时空携手中国科学院软件研究所,共同研发出全球首个RISC-V+OpenHarmony5.0原生鸿蒙解决方案。 这
    的头像 发表于 02-19 11:30 1164次阅读

    时空完成A+轮数亿元融资 加速RISC-V AI CPU产品迭代

    及生态建设。在成立至今三年的快速发展中,时空布局了RISC-V高性能CPU核、AI-CPU核、AICPU芯片、系统软件等全栈计算技术,形
    的头像 发表于 02-18 14:22 1075次阅读
    <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>完成A+轮数亿元融资 <b class='flag-5'>加速</b>RISC-V <b class='flag-5'>AI</b> CPU产品迭代

    时空亮相RISC-V产业发展大会:新AI CPU引领大模型时代

    12月28日,以“发挥标准优势,繁荣产业发展”为主题的RISC-V产业发展大会在北京亦庄经开区通明湖会展中心举行。作为基于新一代RISC-V架构的计算生态企业,时空受邀出席此次大会。
    的头像 发表于 12-31 17:32 1180次阅读
    <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>亮相RISC-V产业发展大会:新<b class='flag-5'>AI</b> CPU引领大<b class='flag-5'>模型</b>时代