继 DeepSeek 全套蒸馏模型以及 V3 版本上线后,经过 Gitee AI 和沐曦团队两天紧锣密鼓的适配和机器筹备,DeepSeek-R1全尺寸版本现在已上线 Gitee AI 供开发者们使用。
截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千问蒸馏模型均实现了在国产沐曦训推一体 GPU 上成功运行,且均已上线 Gitee AI 开放使用体验,国内 AI 全链路自主技术闭环踏出了巨大且关键的一步。在此特别感谢沐曦团队的技术支持以及来自上海加佳的算力支撑。
三大「杀手锏」成就国产模型新高度
DeepSeek-R1的性能相信大家已经充分领教了,其「杀手锏」之一就是开放了思维链输出过程,用户可以看到模型进行推理时的每一步逻辑,告别了传统大模型的「黑盒」问题。
DeepSeek-R1另一个「杀手锏」则是在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI-o1 正式版。
DeepSeek-R1的第三个「杀手锏」无疑是开放的许可证和用户协议,模型开源 License 统一使用 MIT,完全开源,不限制商用,无需申请。
同时,产品协议明确可「模型蒸馏」,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
这三大「杀手锏」使得DeepSeek-R1不但拥有极高的透明度和易用性,也为开发者提供了更灵活的训练和应用方式,极大地加速了模型的落地与普及,迅速让国产模型在世界 AI 竞争格局中登上了新的制高点。
沐曦 GPU+曦源一号万卡集群=国产算力新标杆
当然,想要实现技术自主与独立,仅有模型的领先还不够,关键在于 AI 模型对国产 GPU 的深度适配与高效运行。
唯有 DeepSeek-R1 能够在国产 GPU 上稳定运行,中国 AI 技术体系才能真正实现自主可控的完整闭环。
本次DeepSeek-R1部署采用了沐曦训推一体 GPU,使用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。
此外,由上海加佳智云数字科技有限公司运营的曦源一号国产替代万卡集群正以其卓越的性能为本次部署以及各类 AI 平台、AI 模型及 AI 应用提供强大的算力支持。
曦源一号国产替代算力集群是基于沐曦高性能 GPU 加速卡所构建的一个开放、标准、高效的计算架构,有效促进了计算资源、数据资源与智能服务的全面整合。这种创新不仅提升了整体性能,也在 AI 实时推理、大规模模型训练等众多领域展现出巨大的潜力,从而满足了目前急需高效、稳定计算能力的国内市场。
Gitee AI——模型 API 新选择
2024 年初上线以来,Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务,致力于让开发者轻松构建和部署 AI 应用,为企业客户提供更加智能、高效的 AI 应用解决方案。
Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。
点击文末阅读原文访问 Gitee AI,体验基于基于沐曦曦云 GPU 及曦源一号国产替代算力集群的DeepSeek-R1,使用 100% 国产 AI 开发应用吧!
-
gpu
+关注
关注
28文章
5099浏览量
134458 -
AI
+关注
关注
89文章
38091浏览量
296594 -
模型
+关注
关注
1文章
3648浏览量
51712 -
DeepSeek
+关注
关注
2文章
824浏览量
2811
原文标题:继V3之后,沐曦GPU再完成DeepSeek-R1全尺寸适配,已上线Gitee AI
文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
如何使用OpenVINO运行DeepSeek-R1蒸馏模型
RK3588开发板上部署DeepSeek-R1大模型的完整指南
Infinix AI接入DeepSeek-R1满血版
联想moto AI手机接入DeepSeek-R1
了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择
广和通支持DeepSeek-R1蒸馏模型
Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!
AIBOX 全系产品已适配 DeepSeek-R1
DeepSeek-R1本地部署指南,开启你的AI探索之旅
软通动力天璇MaaS融合DeepSeek-R1,引领企业智能化转型
deepin UOS AI接入DeepSeek-R1模型
芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!
原生鸿蒙版小艺App上架DeepSeek-R1, AI智慧体验更丰富
中软国际JointPilot平台上线DeepSeek-R1模型
对标OpenAI o1,DeepSeek-R1发布

DeepSeek-R1全尺寸版本上线Gitee AI
评论