0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

横空出世!容芯致远创新“智算整机架构”融合DeepSeek应用

yyx2013 来源:yyx2013 作者:yyx2013 2025-02-28 13:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DeepSeek火爆全球,并引发算力行业链式反应。借助混合专家模型(MOE)架构、多头潜在注意力机制(MLA)等算法创新,DeepSeek显著降低大模型计算成本,打破了业界对高算力GPU的路径依赖,全面激活了各行业部署大模型应用的需求。长期受先进制程工艺制约的国产GPU阵营正在迎来新的发展机遇。

2月27日,在北京2025中国RISC-V生态大会上,容芯致远,一家2024年刚成立,致力于创新计算机体系结构的初创企业,推出了全新的AGC智算架构及其整机设计方案,并率先与百度AI技术生态达成合作,这或将开启AI计算机系统架构创新的范式变革。

这是容芯致远首次在全国性顶级行业技术大会上正式亮相,CTO石旭在主题演讲中披露了他对MOE架构下AI计算机体系结构创新和变革方向的思考。在石旭看来,影响AI发展有三个关键要素:芯片、系统和算法。DeepSeek已成功证明中国在算法领域的领先优势,GPU芯片迭代周期长,短期难以一蹴而就,系统结构作为介于芯片与算法之间的重要环节,对于进一步发挥国产芯片有效算力,提升运营效率,降低运营成本,延长设备寿命等,都具有极大的创新空间。

wKgZPGfBTjaAUTW5AAN1Uvt9ydY324.png

几十年来,计算机系统一直是以CPU为核心进行构建,GPU显卡、存储等设备作为外设存在,所有外设之间的数据交换需要通过中央处理器即CPU来处理,使得CPU越来越成为AI时代的计算机系统瓶颈所在。对此,容芯致远的创业团队选择了计算机体系结构这一长期被产业界忽视的方向,率先提出AGC(以GPU为核心)的AI计算机体系结构。在石旭和他的技术团队看来,为更高效地支撑AI时代MOE模型训练推理,需要对计算机体系结构进行一次彻底的变革,即从传统的ACC架构(AI computer system with the CPU at its Core)转向AGC架构(AI computer system with the GPU at its Core),实现以GPU为核心设计AI计算机系统。只有在体系结构层面进行高维度的创新,才能打破成本、效率、灵活性“不可能三角”的魔咒,让GPU与模型服务发挥更大算力效率,同时更具成本优势和灵活的适应性。

wKgZO2fBTjaAKfddAAPZixn6C2o328.png

RISC-V生态大会的展示区,容芯致远在现场展出了多款基于AGC架构设计的AI服务器与AI Station整机方案。

与传统服务器不同,采用AGC架构的8卡GPU服务器,在一个4U机箱内部署2颗国产CPU和8张国产GPU卡,且能支持不同厂商的GPU卡异构混插,整机算力有效值(MFU)可从40%平均值提高到60%以上,并支持DeepSeek的高效推理。

wKgZPGfBTjeAEpTcAANeXQUm3NI20.jpeg

图:全国产AGC架构MOE智算整机(8卡)

现场展出的AI Station适用于ToB办公场景,也是基于AGC架构设计,模块化、免主板、超静音、内置AIOS系统,可插2块全尺寸GPU卡,轻松跑通32B模型,可用于在办公室环境搭建轻量便捷、低成本的DeepSeek推理平台。

wKgZO2fBTjeAObd_AALZjIcSAr044.jpeg

图:基于AGC架构的AI Station

值得关注的是,容芯致远预发布了一款20卡全信创AGC架构服务器设计方案,更充分地体现“以GPU为核心构建计算机系统”的设计理念,一些重要特征包括:20卡超高密度,使其不用量化即可完美兼容全尺寸DeepSeek大模型;支持“GPU暴力热插拔”,当某个GPU卡出现故障时,无须将整个设备断电即可更换GPU,使得维护周期从小时级直接降到分钟级;支持针对每颗GPU而不是整机进行卡级精准能耗控制,可根据负载需要开启或关闭目标GPU卡;全新的高速互联特性支持在5秒内唤醒加载大模型等。该款产品实现了业界首创、全球首创!

wKgZPGfBTjiATs9gAAMAD2Xf9k431.jpeg

图:已预发布的全国产AGC架构MOE智算整机(20卡)关键特性

容芯致远COO王成江表示,尽管目前国内已经有很多整机厂商,但鲜有企业去做计算机体系结构层面的创新,这在国内是一个新的赛道,容芯致远将专注于研发推广更加符合AI时代需要的新型计算机系统架构方案,做智算体系结构的领头羊。目前,AGC智算架构整机已适配几乎所有国产GPU卡,包括天数智芯、寒武纪、燧原、登临科技、墨芯、沐曦、希姆、海光DCU、摩尔线程等,同时也适配了DeepSeek、文心一言、Llama、Qwen、ChatGLM等主流大模型。而且,公司秉承开源开放策略,将相关AGC架构知识产权通过RISC-V生态联盟向内部成员开放共享。

wKgZO2fBTjiAIAJBAAOBs7hlCoo021.png

AGC智算架构创新成果获得了互联网AI大厂的关注与重视。容芯致远已与百度AI技术团队达成生态合作,双方将携手推动计算机体系结构创新,优化基于飞桨、文心大模型、AI生态应用等系统,降低AI应用门槛,加速AI最后一公里落地。

容芯致远,是一家致力于创新计算机体系结构的高科技企业。公司拥有微电子、光子学、AI加速与体系结构等众多领域的专家团队,构建了一支跨学科、技术实力强大的技术团队,为公司持续创新及产品开发奠定了坚实而稳固的基础。凭借在底层技术创新领域的卓越实力,实现了对CPU/GPU的全面赋能加速,并推出了通算/智算加速单元及智算服务器等一系列产品。现场许多专家和客户都表示很期待看到一个创新的技术公司加速崛起。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41972

    浏览量

    303061
  • DeepSeek
    +关注

    关注

    2

    文章

    861

    浏览量

    3469
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    燧弘华创携手致远共筑绿色普惠智底座

    随着大模型参数量指数级增长,传统以CPU为核心的计算架构在处理高密度并行计算时,逐渐暴露出数据调度延迟突出、GPU间通信效率低下及内存一致性难以保障等核心瓶颈。这些挑战直接导致力资源利用率不足,成为制约AI技术规模化落地的“架构
    的头像 发表于 05-13 10:29 227次阅读

    2026年第一季度恩智浦新品大盘点

    新年伊始,马力全开!2026年开年,恩智浦推“”势头强劲,既有新锐产品的横空出世,也有成熟平台的稳步扩展,覆盖从机器人到软件定义汽车等前沿领域,助力开发者解锁智能边缘的无限可能!
    的头像 发表于 03-28 10:16 1428次阅读

    DeepSeek爆火一周年的寂静

    ,争先恐后地展示技术进步。而另一边,则是DeepSeek新模型缺席春节假期,与一年前R1横空出世、引爆全球关注的高光姿态,形成了鲜明对比。   恰逢R1爆火一周年的时刻,我们回溯了过去一年DeepSeek的动向,会发现V3、De
    的头像 发表于 02-26 14:15 1.1w次阅读
    <b class='flag-5'>DeepSeek</b>爆火一周年的寂静

    苹果联姻博通,&quot;Baltra&quot;横空出世!英伟达霸主地位将变?

    电子发烧友网报道(文/莫婷婷)在全球科技巨头竞逐人工智能高地的背景下,苹果公司也在发起一场力革命。业内媒体报道,苹果已启动代号“Baltra”的首款AI服务器芯片研发计划,并与半导体芯片巨头博
    的头像 发表于 12-20 07:43 1.1w次阅读
    苹果联姻博通,&quot;Baltra&quot;<b class='flag-5'>横空出世</b>!英伟达霸主地位将变?

    把CW32L010用FLASH模拟EEPROM

    CW32L010横空出世,定时器和ADC变化很大,FLASH基本和以前型号一样,但有一点改动,BUSY位从CR1寄存器改到ISR寄存器了。 把F003的程序改改就能用,太棒了,拿走不谢。 只有一个
    发表于 11-24 07:40

    云天励飞如何助力中国AI芯片突围

    过去两年,人工智能以惊人的速度席卷全球。从ChatGPT的横空出世,到Sora等多模态模型的突破,再到中国DeepSeek R1的开源,AI技术正以前所未有的节奏重塑产业格局。力消耗不断攀升,模型迭代从“年”缩短到“周”,全球
    的头像 发表于 10-27 10:01 787次阅读

    技术资讯 I 基于粒(小晶片)的架构掀起汽车设计革命

    的通信能力的支持,以提升车辆性能、舒适性和安全性。芯片行业的关键进展之一是粒(小晶片)技术的横空出世粒(小晶片)具有灵活、可扩展且经济高效的特点,能将多种技术集
    的头像 发表于 09-12 16:08 858次阅读
    技术资讯 I 基于<b class='flag-5'>芯</b>粒(小晶片)的<b class='flag-5'>架构</b>掀起汽车设计革命

    CoWoP能否挑战CoWoS的霸主地位

    封装的代名词。但近期,CoWoP(ChiponWaferonPCB)技术横空出世,迅速引发行业关注——它能否挑战CoWoS的霸主地位?今天我们就来拆解这个封装界的“新选手”。
    的头像 发表于 09-03 13:59 3519次阅读
    CoWoP能否挑战CoWoS的霸主地位

    边缘计算AI硬件如何接入DeepSeek吗?需要具备哪些条件?

    2025年伊始,一款来自中国初创公司“深度求索”的AI大模型DeepSeek横空出世,惊艳全球。DeepSeek厉害之处在于,在中国被外国芯片封锁的背景下,在性能上接近美国顶尖AI模型,但研发
    的头像 发表于 08-21 10:30 2106次阅读
    边缘计算AI硬件如何接入<b class='flag-5'>DeepSeek</b>吗?需要具备哪些条件?

    【免费送书】AI芯片,从过去走向未来:《AI芯片:前沿技术与创新未来》

    最重大的技术变革无疑就是大模型的横空出世,人类的时间仿佛被装上了加速器,从ChatGPT到DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一本新的AI芯片图书,以紧跟时代
    的头像 发表于 07-29 08:06 1343次阅读
    【免费送书】AI芯片,从过去走向未来:《AI芯片:前沿技术与<b class='flag-5'>创新</b>未来》

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    感谢平台提供的书籍,实物如下 这本书主讲从年前开始火热的DeepSeek 。书籍看起来轻薄,但言简意赅,通俗易懂,总览全局,比较精炼。 第一章 介绍DeepSeek的一系列技术突破与创新。 第二章
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    问题,又像横在发展路上的巨石,提醒我技术创新并非坦途,新架构在带来优势的同时,也会伴随新挑战。 五、小结 读完第三章,DeepSeek - V3 的技术剖析让我从架构、效率优化、精
    发表于 07-20 15:07

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    这本书有150多页,而且是彩色印刷的,图、表很多而且很有条理性。 书籍前言介绍如下: 第1章 介绍 DeepSeek 的一系列技术突破与创新,如架构创新、训练优化、推理与部署优化等,
    发表于 07-17 11:59

    东芝24TB超大容量CMR硬盘评测

    大模型的横空出世不仅改变了计算行业,也深刻影响了存储行业。
    的头像 发表于 07-10 09:46 2921次阅读
    东芝24TB超大容量CMR硬盘评测

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    DeepSeek-V3技术突破 DeepSeek-V3 的模型架构整体上基于 Transformer 的 MoE 架构,并在细节实现上做了大量的
    发表于 06-09 14:38