0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

横空出世!容芯致远创新“智算整机架构”融合DeepSeek应用

yyx2013 来源:yyx2013 作者:yyx2013 2025-02-28 13:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DeepSeek火爆全球,并引发算力行业链式反应。借助混合专家模型(MOE)架构、多头潜在注意力机制(MLA)等算法创新,DeepSeek显著降低大模型计算成本,打破了业界对高算力GPU的路径依赖,全面激活了各行业部署大模型应用的需求。长期受先进制程工艺制约的国产GPU阵营正在迎来新的发展机遇。

2月27日,在北京2025中国RISC-V生态大会上,容芯致远,一家2024年刚成立,致力于创新计算机体系结构的初创企业,推出了全新的AGC智算架构及其整机设计方案,并率先与百度AI技术生态达成合作,这或将开启AI计算机系统架构创新的范式变革。

这是容芯致远首次在全国性顶级行业技术大会上正式亮相,CTO石旭在主题演讲中披露了他对MOE架构下AI计算机体系结构创新和变革方向的思考。在石旭看来,影响AI发展有三个关键要素:芯片、系统和算法。DeepSeek已成功证明中国在算法领域的领先优势,GPU芯片迭代周期长,短期难以一蹴而就,系统结构作为介于芯片与算法之间的重要环节,对于进一步发挥国产芯片有效算力,提升运营效率,降低运营成本,延长设备寿命等,都具有极大的创新空间。

wKgZPGfBTjaAUTW5AAN1Uvt9ydY324.png

几十年来,计算机系统一直是以CPU为核心进行构建,GPU显卡、存储等设备作为外设存在,所有外设之间的数据交换需要通过中央处理器即CPU来处理,使得CPU越来越成为AI时代的计算机系统瓶颈所在。对此,容芯致远的创业团队选择了计算机体系结构这一长期被产业界忽视的方向,率先提出AGC(以GPU为核心)的AI计算机体系结构。在石旭和他的技术团队看来,为更高效地支撑AI时代MOE模型训练推理,需要对计算机体系结构进行一次彻底的变革,即从传统的ACC架构(AI computer system with the CPU at its Core)转向AGC架构(AI computer system with the GPU at its Core),实现以GPU为核心设计AI计算机系统。只有在体系结构层面进行高维度的创新,才能打破成本、效率、灵活性“不可能三角”的魔咒,让GPU与模型服务发挥更大算力效率,同时更具成本优势和灵活的适应性。

wKgZO2fBTjaAKfddAAPZixn6C2o328.png

RISC-V生态大会的展示区,容芯致远在现场展出了多款基于AGC架构设计的AI服务器与AI Station整机方案。

与传统服务器不同,采用AGC架构的8卡GPU服务器,在一个4U机箱内部署2颗国产CPU和8张国产GPU卡,且能支持不同厂商的GPU卡异构混插,整机算力有效值(MFU)可从40%平均值提高到60%以上,并支持DeepSeek的高效推理。

wKgZPGfBTjeAEpTcAANeXQUm3NI20.jpeg

图:全国产AGC架构MOE智算整机(8卡)

现场展出的AI Station适用于ToB办公场景,也是基于AGC架构设计,模块化、免主板、超静音、内置AIOS系统,可插2块全尺寸GPU卡,轻松跑通32B模型,可用于在办公室环境搭建轻量便捷、低成本的DeepSeek推理平台。

wKgZO2fBTjeAObd_AALZjIcSAr044.jpeg

图:基于AGC架构的AI Station

值得关注的是,容芯致远预发布了一款20卡全信创AGC架构服务器设计方案,更充分地体现“以GPU为核心构建计算机系统”的设计理念,一些重要特征包括:20卡超高密度,使其不用量化即可完美兼容全尺寸DeepSeek大模型;支持“GPU暴力热插拔”,当某个GPU卡出现故障时,无须将整个设备断电即可更换GPU,使得维护周期从小时级直接降到分钟级;支持针对每颗GPU而不是整机进行卡级精准能耗控制,可根据负载需要开启或关闭目标GPU卡;全新的高速互联特性支持在5秒内唤醒加载大模型等。该款产品实现了业界首创、全球首创!

wKgZPGfBTjiATs9gAAMAD2Xf9k431.jpeg

图:已预发布的全国产AGC架构MOE智算整机(20卡)关键特性

容芯致远COO王成江表示,尽管目前国内已经有很多整机厂商,但鲜有企业去做计算机体系结构层面的创新,这在国内是一个新的赛道,容芯致远将专注于研发推广更加符合AI时代需要的新型计算机系统架构方案,做智算体系结构的领头羊。目前,AGC智算架构整机已适配几乎所有国产GPU卡,包括天数智芯、寒武纪、燧原、登临科技、墨芯、沐曦、希姆、海光DCU、摩尔线程等,同时也适配了DeepSeek、文心一言、Llama、Qwen、ChatGLM等主流大模型。而且,公司秉承开源开放策略,将相关AGC架构知识产权通过RISC-V生态联盟向内部成员开放共享。

wKgZO2fBTjiAIAJBAAOBs7hlCoo021.png

AGC智算架构创新成果获得了互联网AI大厂的关注与重视。容芯致远已与百度AI技术团队达成生态合作,双方将携手推动计算机体系结构创新,优化基于飞桨、文心大模型、AI生态应用等系统,降低AI应用门槛,加速AI最后一公里落地。

容芯致远,是一家致力于创新计算机体系结构的高科技企业。公司拥有微电子、光子学、AI加速与体系结构等众多领域的专家团队,构建了一支跨学科、技术实力强大的技术团队,为公司持续创新及产品开发奠定了坚实而稳固的基础。凭借在底层技术创新领域的卓越实力,实现了对CPU/GPU的全面赋能加速,并推出了通算/智算加速单元及智算服务器等一系列产品。现场许多专家和客户都表示很期待看到一个创新的技术公司加速崛起。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296586
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2811
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek横空出世,存储产业的寒武纪大爆发来了

      电子发烧友网报道(文/黄晶晶)DeepSeek-R1是幻方量化旗下深度求索(DeepSeek)公司研发的推理模型。DeepSeek-R1于2025年1月20日正式发布。该模型采用强化学习进行后
    的头像 发表于 02-10 07:35 5062次阅读
    <b class='flag-5'>DeepSeek</b><b class='flag-5'>横空出世</b>,存储产业的寒武纪大爆发来了

    边缘计算AI硬件如何接入DeepSeek吗?需要具备哪些条件?

    2025年伊始,一款来自中国初创公司“深度求索”的AI大模型DeepSeek横空出世,惊艳全球。DeepSeek厉害之处在于,在中国被外国芯片封锁的背景下,在性能上接近美国顶尖AI模型,但研发
    的头像 发表于 08-21 10:30 1697次阅读
    边缘计算AI硬件如何接入<b class='flag-5'>DeepSeek</b>吗?需要具备哪些条件?

    东芝24TB超大容量CMR硬盘评测

    大模型的横空出世不仅改变了计算行业,也深刻影响了存储行业。
    的头像 发表于 07-10 09:46 1976次阅读
    东芝24TB超大容量CMR硬盘评测

    维谛技术:AI普惠浪潮下,如何打造新一代力中枢?

    DeepSeek横空出世,为AI行业注入了新的变量。它凭借开源可用、低成本调用的特性,大幅降低了大模型技术的使用门槛,加速了AI能力向各行各业的渗透。在这场力“民主化”运动中,成千上万的微型智
    的头像 发表于 05-12 14:42 598次阅读
    维谛技术:AI普惠浪潮下,如何打造新一代<b class='flag-5'>算</b>力中枢?

    Deepseek横空出世!中美AI之间的差距逆转了吗?

    DeepSeek横空出世确实在中美AI竞争中引起了巨大反响,但要判断中美AI之间的差距是否因此逆转,还需从多个维度进行深入分析。 一、技术性能与成本 DeepSeek以其卓越的性能和低廉的成本
    的头像 发表于 04-15 18:14 754次阅读

    思尔与玄铁合作IP评测,加速RISC-V生态发展

    引言随着近来Deepseek横空出世,降低力需求,为RISC-V带来了更多的创新机遇。RISC-V计算架构搭乘上AI时代的快车,成为新一
    的头像 发表于 04-09 09:24 764次阅读
    思尔<b class='flag-5'>芯</b>与玄铁合作IP评测,加速RISC-V生态发展

    DeepSeek在昇腾上的模型部署的常见问题及解决方案

    2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见问题困扰着不少
    的头像 发表于 03-25 16:53 1888次阅读
    <b class='flag-5'>DeepSeek</b>在昇腾上的模型部署的常见问题及解决方案

    人工智能与物联网深度融合重新诠释“万物互联”

    ChatGPT的横空出世,到DeepSeek在全球范围引发轰动,再到如今Manus的爆火,这些大型模型犹如巨石投入平静湖面,激起层层涟漪,持续搅动着人工智能领域的“一池春水”。
    的头像 发表于 03-21 14:28 959次阅读

    DeepSeek大模型如何推动“AI+物流”融合创新

    在人工智能技术的迭代浪潮中,大模型(Large Language Models, LLM)正从文本生成、图像创作走向垂直行业赋能。2025年新年,国产 AI 大模型 DeepSeek 横空出世,凭借其低成本、高精度和多模态能力,迅速成为“新晋网红”,并在各行各业引发广泛讨
    的头像 发表于 02-28 16:36 1038次阅读

    研华边缘AI平台测试DeepSeek蒸馏版模型的最新数据

    随着Deepseek大模型的横空出世,预计对整个工业领域会产生颠覆性的影响力,尤其针对边缘部署部分独创动态剪枝与量化技术,DeepSeek大模型支持在边缘设备低功耗运行(最低适配5 TOPS
    的头像 发表于 02-24 10:40 1632次阅读
    研华边缘AI平台测试<b class='flag-5'>DeepSeek</b>蒸馏版模型的最新数据

    华为推出昇腾DeepSeek大模型一体机

    DeepSeek大模型的横空出世,让AI正以前所未有的速度重塑各行各业的发展格局。昇腾DeepSeek一体机深度融合昇腾高性能力底座与
    的头像 发表于 02-18 09:56 2609次阅读

    【实测】用全志A733平板搭建一个端侧Deepseek力平台

    ​ 随着DeepSeek 的蒸馏技术的横空出世,端侧 SoC 芯片上运行大模型成为可能。那么端侧芯片跑大模型的效果如何呢?本文将在全志 A733 芯片平台上部署一个 DeepSeek-R1:1.5B
    发表于 02-13 10:19

    如何在MATLAB中使用DeepSeek模型

    DeepSeek-R1(https://github.com/deepseek-ai/DeepSeek-R1) AI 模型横空出世后,人们几乎就立马开始询问如何在 MATLAB 中
    的头像 发表于 02-13 09:20 4063次阅读
    如何在MATLAB中使用<b class='flag-5'>DeepSeek</b>模型

    DeepSeek如何成为黑马,打造国产力闭环

    在 2025 年春节期间,科技圈杀出一匹黑马“DeepSeek”,其迅速火爆全网,成为众人热议的焦点;回溯过往,人工智能领域能引发如此广泛关注与热议的现象,或将追溯至 ChatGPT 横空出世之际
    的头像 发表于 02-08 11:12 995次阅读
    <b class='flag-5'>DeepSeek</b>如何成为黑马,打造国产<b class='flag-5'>算</b>力闭环

    动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    近期,国产大模型 DeepSeek-R1横空出世,迅速成为AI领域的焦点。 动力在24小时内完成了与DeepSeek-R1大模型的适配。 Deep
    的头像 发表于 02-07 16:55 896次阅读
    <b class='flag-5'>芯</b>动力神速适配<b class='flag-5'>DeepSeek</b>-R1大模型,AI芯片设计迈入“快车道”!