0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek一体机背后,国产算力芯片崛起

晶芯观察 来源:电子发烧友网 作者:黄晶晶 2025-03-10 08:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)自DeepSeek推出以来,最火的硬件产品非DeepSeek一体机莫属。DeepSeek大模型的应用和部署设计需要计算设备的支持,根据不同的大模型参数版本,例如DeepSeek-R1目前已经发布了1.5B/7B/8B/14B/32B/70B/671B共7类,选择不同规格的硬件配置。

自2月份以来,已有多家芯片厂商宣布支持DeepSeek模型,包括华为昇腾、海光、沐曦、昆仑芯、壁仞科技、天数智芯、摩尔线程、燧原科技、云天励飞等等。许多产品已经在DeepSeek一体机中得以广泛应用。例如,联想联合沐曦发布基于DeepSeek大模型的首个国产一体机解决方案,发布一个月以来,累计发货量已突破千台,配备沐曦国产GPU卡近万张,覆盖医疗、教育、制造等十余个核心行业。

昇腾910

软通动力旗舰版超强A800I A2服务器,基于鲲鹏920处理器、昇腾910 AI处理器,8模组高效推理,支持PFLOPS FP16超高算力和高速NPU互联技术,支持DeepSeek全量版本适配。

优刻得 DeepSeek 满血版大模型一体机支持沐曦、壁仞、昇腾、天数智芯等国产 AI 芯片全适配,以软硬一体化的交付模式,提供从底层算力获取、模型微调和推理能力、AI 应用开发的全栈式解决方案。结合云计算平台,提供灵活的 DeepSeek 模型部署与管理服务,支持弹性扩展。

据外媒报道,华为计划在今年量产最新AI芯片昇腾910C,其制良品率已升至40%,相比于一年前的20%(昇腾910B的良品率)已翻了一倍。华为计划今年量产10万块昇腾910C芯片,及30万块昇腾910B芯片。2024年,华为共生产20万块910B芯片。

根据Tom's Hardware报道,昇腾910C芯片是华为最新推出的AI芯片,采用了chiplet封装,晶体管数量达530亿个。实际应用方面,据称910C的推理性能相当于Nvidia H100 GPU的60%。

海光DCU

海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配。DCU是海光信息推出的高性能GPGPU架构AI加速卡,致力于为行业客户提供自主可控的全精度通用AI加速计算解决方案。凭借卓越的算力性能和完备的软件生态,DCU已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。

海光DCU技术团队表示,将持续推动大模型迭代适配与优化更新,携手更多优秀大模型企业为行业客户提供更高效、更经济、更安全的AI解决方案。同时,团队也将积极探索更多应用场景,推动AI技术在更多行业的落地与普及。

沐曦曦思N260、曦云C500

联想联合沐曦发布基于DeepSeek大模型的首个国产一体机解决方案。面向敏捷部署的DeepSeek智能体一体机,采用ThinkStation PX工作站为载体,搭载沐曦曦思N260国产GPU,可支持本地部署DeepSeek各种参数蒸馏模型推理。面向更广泛场景的DeepSeek训推一体机,基于联想问天WA5480 G3 AI服务器,搭载8张曦云C500国产GPU,可为大模型训练和推理提供强大的算力支撑。

据悉,发布一个月以来,累计发货量已突破千台,配备沐曦国产GPU卡近万张,覆盖医疗、教育、制造等十余个核心行业。搭配沐曦曦思N260国产GPU的一体机可支持在本地部署DeepSeek各种参数蒸馏模型,实测数据显示,在相同并发条件下,DeepSeek-R1-Distill-Qwen-14B模型推理性能达到国际主流GPU的110%-130%。

浪潮云联合沐曦股份、铨兴科技等生态伙伴,发布预置DeepSeek-R1和DeepSeek-V3模型的海若一体机,率先实现671B DeepSeek大模型国产GPU单机推理服务,为行业客户提供大模型智能应用落地的一体化解决方案。

另外,Gitee AI在2月2日宣布上线1.5B、7B、14B、32B四个尺寸的DeepSeek R1模型并均部署在国产沐曦曦云GPU上。2月5日,Gitee AI再度发文,宣布经测试已确认DeepSeek-V3全精度满血版(671B)可以成功运行在沐曦训推一体GPU上,并将V3满血版上线到平台上。

昆仑芯P800

DeepSeek的推理模型,通过蒸馏模型(如DeepSeek-R1-Distill-Qwen和DeepSeek-R1-Distill-Llama)、MoE(专家混合系统)、MLA(多头潜在注意力机制)等创新技术,显著降低了计算开销,同时维持了模型的高性能。这使得国产AI芯片厂商能够在推理任务中与英伟达GPU竞争,甚至在某些场景中表现更好。

以百度昆仑芯P800为例,其XPU-R架构将通用计算单元和专用AI加速单元进行了融合,算力水平达到了仅次于昇腾910的水平,支持训练、推理和虚拟化等多模式任务,能够灵活适配AI算法的快速迭代需求。昆仑芯P800特别适用于需要大吞吐量的AI应用,单卡即可支撑高并发、高计算量的实时计算需求。

凭借昆仑芯P800强大的算力,对于DeepSeek R1/V3满血版的本地化部署,只需要8张基于昆仑芯P800的加速卡,即一台8卡的服务器就能够完成,部署起来非常的便捷。

壁仞科技壁砺系列训推产品

壁仞科技自主研发的壁砺TM系列产品完成对DeepSeek-R1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大模型部署与开发解决方案。

壁仞科技已联合上海智能算力科技有限公司、中兴通讯、科华数据、无问芯穹、开源中国(Gitee AI)、UCloud优刻得、一蓦科技等战略伙伴,基于壁砺系列训推产品106M、106B、106E、110E,全面开展DeepSeek全系列模型的适配与上线。

天数 BI-V150

天数智芯成功完成了对DeepSeek R1千问蒸馏模型的适配,为开发者提供了更多灵活选择算力的机会。借助天数智芯强大的算力,DeepSeek模型能够提供更为高效且稳定的推理服务,从而更好地适应不同规模和多样化需求的应用场景。

长城擎天 GF7280 V5 AI 训推一体机配置了双路 S5000C 处理器,CPU 核心数量高达 128 个,并配备了 16 个 DDR5 内存条,总内存容量达到 1024GB。可验证搭配 NV L20 和国产天数 BI-V150 和沐曦C500 三种不同 GPU 算力卡适配 DeepSeek R1 私有化部署情况,具有 “开箱即用、经济高效、持续更新与支持” 三大优势。

摩尔线程KUAE集群

摩尔线程实现了对 DeepSeek 蒸馏模型推理服务部署。DeepSeek-R1-Distill-Qwen系列模型在摩尔线程KUAE集群上成功部署与应用。KUAE(夸娥)智算中心,是摩尔线程首个全国产千卡千亿模型训练平台,是国内首个以国产全功能GPU(图形处理器)为底座的大规模算力集群。

DeepSeek 开源模型(如 V3、R1 系列)在多语言理解与复杂推理任务中展现了卓越性能。通过 DeepSeek 提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产 GPU 上实现高性能推理。

燧原科技第三代推理卡S60

太湖亿芯智算中心采用燧原科技生产的第三代推理卡S60,完成DeepSeek在太湖亿芯智算中心的部署上线。弘信电子战略合作伙伴燧原科技完成对DeepSeek全量模型的高效适配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸馏模型。整个适配进程中,燧原AI加速卡的计算能力得以充分利用,能够快速处理海量数据,同时其稳定性为模型的持续优化和大规模部署提供坚实的基础。

申威AI加速卡

申威DeepSeek大模型一体机将中国电科新一代服务器CPU申威威鑫H8000与DeepSeek深度兼容,实现从硬件到算法完全自主创新,规避数据外泄风险、满足合规要求,通过可视化管控平台与智能运维体系,适配智能办公、写作翻译等基础场景,以及内容创作、文献解读、数学推理、代码生成等专业场景,有效缩短运维周期、降低人力成本,加速智能化升级进程。申威DeepSeek大模型一体机采用轻量化拓扑设计,单机即可运行,并支持平滑扩展,在维持高性能前提下降低硬件成本,实现降本增效与资源集约化利用。

申威一体机搭载的申威威鑫H8000芯片及申威AI加速卡性能强大,以往需要专门建一个智算中心才能完成的计算任务,如今只要部署一两台内置DeepSeek的一体机就能实现。

云天励飞DeepEdge10

云天励飞DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统

景嘉微JM 系列、景宏系列

景嘉微JM系列、景宏系列与DeepSeek R1系列成功适配,进一步推动 DeepSeek 在云边端等各类场景的应用。

景嘉微JM系列完成了DeepSeek-R1-Distill-Qwen-1.5B模型和DeepSeek-R1-Distill-Qwen-7B模型的适配。

同时,景宏系列已全面兼容并适配DeepSeek R1全系列模型,覆盖从1.5B至70B参数规模的LLaMA及千问模型架构。基于vLLM推理框架的部署方案,实现了高效推理性能与经济性的双重优势,为开发者提供了便捷的开发支持。该方案支持快速启动和使用,无需复杂配置,助力AI技术的规模化落地应用。

太初元碁 T100加速卡

龙芯中科联合太初元碁等产业伙伴,在太初T100加速卡上完成DeepSeek-R1系列模型的适配工作,采用龙芯3A6000处理器的诚迈信创电脑和望龙电脑已实现本地部署DeepSeek。

DeepSeek R2发布在即,一体机市场前景乐观

据浙商证券测算,预期DeepSeek快速部署需求有望带动一体机需求增长,2025年到2027年一体机需求量将分别达到15万台、39万台、72万台,对应市场空间分别为1236亿元、2937亿元、5208亿元。

中金认为,当前DeepSeek一体机的软硬件协同仍面临一些挑战,一是主流国产AI芯片缺少对FP8 精度的支持,如果采用FP16 或BF16 精度,硬件效率将下降;二是为了在单台8卡服务器上实现全参数DeepSeek-R1 模型的部署,一体机厂商需要进行定点量化,需在算力效率和模型效果间寻求平衡。

我们此前报道过,面对DeepSeek市场爆发,英伟达H20成为热门选择,不少互联网大厂加大采购英伟达H20。

此外英伟达A100、4090等也都有不小的需求。例如一些企业要完成深度学习、复杂数据分析和高级图像处理等功能,需要选择高性能70B模型,或者适用于气候建模、基因组分析等更加高精尖的场景,选择满血版671B模型版本。而一般来说,进行本土化部署的电脑配置,70B模型需要拥有2个A100 80G显卡或4个RTX4090显卡并行,配备32核CPU和128G的内存。更大规模的DeepSeek-R1 671B(满血版)则需8个A100或H100显卡并行,配备64核CPU及512GB内存。

预计很快,DeepSeek R2人工智能模型将发布,公司最初计划于五月推出,但目前正在努力加快进度。此前,有知情人士表示,希望新模型能生成更好的代码,并能够用英语以外的语言进行推理。业界预估,DeepSeek R2将进一步降低AI算力成本,缓解AI堆算力的路径依赖。这或许将带给国产算力芯片更大的机会。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力芯片
    +关注

    关注

    0

    文章

    59

    浏览量

    5222
  • 算力
    +关注

    关注

    2

    文章

    1658

    浏览量

    16832
  • DeepSeek
    +关注

    关注

    2

    文章

    837

    浏览量

    3392
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    触拓(CHUTO)32 寸立式点餐,大屏触控点餐快人步#触拓 # 自助一体机 #点餐

    一体机
    深圳市触拓科技有限公司
    发布于 :2026年04月08日 12:23:06

    触拓(CHUTO)户外广告一体机,无惧酷暑全天候在线# 触拓 #户外触摸一体机

    一体机
    深圳市触拓科技有限公司
    发布于 :2026年04月08日 12:20:40

    国产录播一体机多功能多接口落实各及行业应用

    国产录播一体机是集‌视频采集、编码、录制、直播、点播、导播、互动、AI智能分析‌等功能于一体的嵌入式设备,广泛应用于教育、企业、医疗、司法等多个行业。
    的头像 发表于 03-09 11:42 321次阅读

    国产录播一体机多领域应用功能与解决方案

    在教育数字化转型加速、远程协作需求激增的当下,国产录播一体机已突破单教学场景限制,成为跨领域高效运转的核心设备。
    的头像 发表于 02-10 17:43 1113次阅读

    OBOO鸥柏交互式查询一体机:展馆里的智能信息导航站

    一体机
    鸥柏科技
    发布于 :2025年12月30日 19:04:58

    AI边缘一体机TS-SG-SE7(1U)系列产品规格书

    一体机,是基于国产能嵌入式ARM架构、超强
    发表于 10-27 17:50 0次下载

    屏掌控全场:OBOO鸥柏65寸国产飞腾D2000触摸查询一体机,高效无忧

    一体机
    鸥柏科技
    发布于 :2025年09月29日 18:55:01

    燧原科技DeepSeek一体机与S60卡:引领国产新潮流

    电子发烧友网报道(文/李弯弯)在日前世界人工智能大会(WAIC)上,国产力量大放异彩。其中,燧原科技展示了其最新的DeepSeek一体机,凭借低门槛、高效率的独特优势,迅速成为全场
    的头像 发表于 08-03 07:35 9899次阅读
    燧原科技<b class='flag-5'>DeepSeek</b><b class='flag-5'>一体机</b>与S60卡:引领<b class='flag-5'>国产</b>智<b class='flag-5'>算</b>新潮流

    人脸识别门禁考勤一体机为什么采用国产操作系统?

    在科技飞速发展的今天,人脸识别门禁一体机已成为众多政企单位、办公园区、酒店公寓等场所的重要安全设备。随着国产操作系统的崛起,越来越多的门禁终端尤其是人脸识别门禁考勤一体机、脸部识别门禁
    的头像 发表于 07-25 10:39 969次阅读
    人脸识别门禁考勤<b class='flag-5'>一体机</b>为什么采用<b class='flag-5'>国产</b>操作系统?

    工业一体机不同的安装系统对应其应用功能有何差异?

    工业一体机种集计算、控制、人机交互等功能于一体的工业自动化设备。它在各个行业中都有广泛的应用,包括制造业、物流业、工业自动化等。工业一体机的性能直接关系到生产效率和质量,因此选择适
    的头像 发表于 06-24 17:14 729次阅读

    开普云「开悟智核」:极致性价比的智能一体机,破局大模型应用难题

    当下,AI一体机凭借开箱即用、数据可控等优势,成为行业大模型落地的重要载体之。然而实际应用时,用户却面临诸多问题:成本与性能难以平衡;非满血版模型存在“幻觉”、精度低等问题;由于
    的头像 发表于 06-09 10:34 1293次阅读
    开普云「开悟智核」:极致性价比的智能<b class='flag-5'>体</b><b class='flag-5'>一体机</b>,破局大模型应用难题

    炸裂!聚徽厂家解读工控一体机狂飙,开启工业 “超跑” 模式

    一体机,已逐渐难以支撑这日益增长的繁重需求。就在这关键时刻,多核异构计算技术强势登场,宛如颗璀璨新星,照亮了工控一体机突破
    的头像 发表于 05-27 16:15 667次阅读

    SATA eSSD排名第三!江波龙企业级存储驱动AI一体机效能跃升

    ,同时也为一体机平台及其核心支撑——企业级存储带来了新的机遇。据IDC调研报告,2024年中国企业级SATASSD总容量排名中,江波龙位列第三。2025年季度
    的头像 发表于 05-15 18:07 2773次阅读
    SATA eSSD排名第三!江波龙企业级存储驱动AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>一体机</b>效能跃升