0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek-R1全尺寸版本上线Gitee AI

OSC开源社区 来源:Gitee AI 2025-02-07 15:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于Gitee AI,作者马建仓

继 DeepSeek 全套蒸馏模型以及 V3 版本上线后,经过 Gitee AI 和沐曦团队两天紧锣密鼓的适配和机器筹备,DeepSeek-R1全尺寸版本现在已上线 Gitee AI 供开发者们使用。

截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千问蒸馏模型均实现了在国产沐曦训推一体 GPU 上成功运行,且均已上线 Gitee AI 开放使用体验,国内 AI 全链路自主技术闭环踏出了巨大且关键的一步。在此特别感谢沐曦团队的技术支持以及来自上海加佳的算力支撑。

三大「杀手锏」成就国产模型新高度

DeepSeek-R1的性能相信大家已经充分领教了,其「杀手锏」之一就是开放了思维链输出过程,用户可以看到模型进行推理时的每一步逻辑,告别了传统大模型的「黑盒」问题。

DeepSeek-R1另一个「杀手锏」则是在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI-o1 正式版。

DeepSeek-R1的第三个「杀手锏」无疑是开放的许可证和用户协议,模型开源 License 统一使用 MIT,完全开源,不限制商用,无需申请。

同时,产品协议明确可「模型蒸馏」,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

这三大「杀手锏」使得DeepSeek-R1不但拥有极高的透明度和易用性,也为开发者提供了更灵活的训练和应用方式,极大地加速了模型的落地与普及,迅速让国产模型在世界 AI 竞争格局中登上了新的制高点。

沐曦 GPU+曦源一号万卡集群=国产算力新标杆

当然,想要实现技术自主与独立,仅有模型的领先还不够,关键在于 AI 模型对国产 GPU 的深度适配与高效运行。

唯有 DeepSeek-R1 能够在国产 GPU 上稳定运行,中国 AI 技术体系才能真正实现自主可控的完整闭环。

本次DeepSeek-R1部署采用了沐曦训推一体 GPU,使用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。

此外,由上海加佳智云数字科技有限公司运营的曦源一号国产替代万卡集群正以其卓越的性能为本次部署以及各类 AI 平台、AI 模型及 AI 应用提供强大的算力支持。

曦源一号国产替代算力集群是基于沐曦高性能 GPU 加速卡所构建的一个开放、标准、高效的计算架构,有效促进了计算资源、数据资源与智能服务的全面整合。这种创新不仅提升了整体性能,也在 AI 实时推理、大规模模型训练等众多领域展现出巨大的潜力,从而满足了目前急需高效、稳定计算能力的国内市场。

Gitee AI——模型 API 新选择

2024 年初上线以来,Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务,致力于让开发者轻松构建和部署 AI 应用,为企业客户提供更加智能、高效的 AI 应用解决方案。

Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。

点击文末阅读原文访问 Gitee AI,体验基于基于沐曦曦云 GPU 及曦源一号国产替代算力集群的DeepSeek-R1,使用 100% 国产 AI 开发应用吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136211
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52341
  • DeepSeek
    +关注

    关注

    2

    文章

    861

    浏览量

    3472

原文标题:继V3之后,沐曦GPU再完成DeepSeek-R1全尺寸适配,已上线Gitee AI

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路

    电子发烧友网报道(文/李弯弯)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,当前版本DeepSeek-R1-
    的头像 发表于 06-03 06:34 6472次阅读

    瑞芯微(EASY EAI)RV1126B AI模型部署

    1.AI模型部署DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。DeepSeek-R1采用强化学习
    的头像 发表于 05-14 17:17 526次阅读
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>AI</b>模型部署

    模力方舟上线DeepSeek-V4系列大模型

    围绕这一方向,DeepSeek 在今天上推出了DeepSeek-V4,现已在模力方舟正式上线
    的头像 发表于 04-30 10:35 473次阅读
    模力方舟<b class='flag-5'>上线</b><b class='flag-5'>DeepSeek</b>-V4系列大模型

    中科曙光AI超集群系统和scaleX640超节点等产品全面适配DeepSeek V3.2

    层实现“跨层协同”,曙光AI超集群系统、scaleX640超节点等产品0day完成对DeepSeek版本的深度适配与调优,支持各行各业客户进行量落地部署。
    的头像 发表于 12-05 14:32 1048次阅读

    DeepSeek R1 MTP在TensorRT-LLM中的实现与优化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现了大幅提速
    的头像 发表于 08-30 15:47 4805次阅读
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的实现与优化

    速看!EASY-EAI教你离线部署Deepseek R1大模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。DeepSeek-R1采用
    的头像 发表于 07-25 15:22 1650次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    【「DeepSeek 核心技术揭秘」阅读体验】+混合专家

    感谢电子发烧友提供学习Deepseek核心技术这本书的机会。 读完《Deepseek核心技术揭秘》,我深受触动,对人工智能领域有了全新的认识。了解Deepseek-R1Deepseek
    发表于 07-22 22:14

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    讲解Deepseek的使用方法 第三章 深入剖析Deepseek-V3的模型架构、训练框架、推理阶段优化、后训练优化等关键技术 第四章关于DeepSeek-R1的技术剖析 第五章 从宏观角度分析
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    实现三重超越;而对开源生态、技术趋势的前瞻探讨,则印证了DeepSeek“用开源击穿技术壁垒”的初心。 当DeepSeek-R1以60TPS的生成速度刷新认知,当蒸馏模型让尖端AI跑进个人电脑,我们见证
    发表于 07-17 11:59

    信而泰×DeepSeekAI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(
    发表于 07-16 15:29

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 1501次阅读
    Arm Neoverse N2平台实现<b class='flag-5'>DeepSeek-R1</b>满血版部署

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 个 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景中的性能纪录:在 GTC 2025
    的头像 发表于 07-02 19:31 3742次阅读
    NVIDIA Blackwell GPU优化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延迟场景中的性能纪录

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    2025年年初,DeepSeek 成为全球人工智能(AI)领域的焦点,其DeepSeek-V3 和DeepSeek-R1 版本在行业内引发了
    发表于 06-09 14:38

    DeepSeek开源新版R1 媲美OpenAI o3

    DeepSeek“悄悄”地又放了一个大招,DeepSeek开源了R1最新0528版本。尽管DeepSeek目前还没有对该
    的头像 发表于 05-29 11:23 1646次阅读