0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek-R1全尺寸版本上线Gitee AI

OSC开源社区 来源:Gitee AI 2025-02-07 15:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于Gitee AI,作者马建仓

继 DeepSeek 全套蒸馏模型以及 V3 版本上线后,经过 Gitee AI 和沐曦团队两天紧锣密鼓的适配和机器筹备,DeepSeek-R1全尺寸版本现在已上线 Gitee AI 供开发者们使用。

截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千问蒸馏模型均实现了在国产沐曦训推一体 GPU 上成功运行,且均已上线 Gitee AI 开放使用体验,国内 AI 全链路自主技术闭环踏出了巨大且关键的一步。在此特别感谢沐曦团队的技术支持以及来自上海加佳的算力支撑。

三大「杀手锏」成就国产模型新高度

DeepSeek-R1的性能相信大家已经充分领教了,其「杀手锏」之一就是开放了思维链输出过程,用户可以看到模型进行推理时的每一步逻辑,告别了传统大模型的「黑盒」问题。

DeepSeek-R1另一个「杀手锏」则是在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI-o1 正式版。

DeepSeek-R1的第三个「杀手锏」无疑是开放的许可证和用户协议,模型开源 License 统一使用 MIT,完全开源,不限制商用,无需申请。

同时,产品协议明确可「模型蒸馏」,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

这三大「杀手锏」使得DeepSeek-R1不但拥有极高的透明度和易用性,也为开发者提供了更灵活的训练和应用方式,极大地加速了模型的落地与普及,迅速让国产模型在世界 AI 竞争格局中登上了新的制高点。

沐曦 GPU+曦源一号万卡集群=国产算力新标杆

当然,想要实现技术自主与独立,仅有模型的领先还不够,关键在于 AI 模型对国产 GPU 的深度适配与高效运行。

唯有 DeepSeek-R1 能够在国产 GPU 上稳定运行,中国 AI 技术体系才能真正实现自主可控的完整闭环。

本次DeepSeek-R1部署采用了沐曦训推一体 GPU,使用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。

此外,由上海加佳智云数字科技有限公司运营的曦源一号国产替代万卡集群正以其卓越的性能为本次部署以及各类 AI 平台、AI 模型及 AI 应用提供强大的算力支持。

曦源一号国产替代算力集群是基于沐曦高性能 GPU 加速卡所构建的一个开放、标准、高效的计算架构,有效促进了计算资源、数据资源与智能服务的全面整合。这种创新不仅提升了整体性能,也在 AI 实时推理、大规模模型训练等众多领域展现出巨大的潜力,从而满足了目前急需高效、稳定计算能力的国内市场。

Gitee AI——模型 API 新选择

2024 年初上线以来,Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务,致力于让开发者轻松构建和部署 AI 应用,为企业客户提供更加智能、高效的 AI 应用解决方案。

Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。

点击文末阅读原文访问 Gitee AI,体验基于基于沐曦曦云 GPU 及曦源一号国产替代算力集群的DeepSeek-R1,使用 100% 国产 AI 开发应用吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134458
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296594
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2811

原文标题:继V3之后,沐曦GPU再完成DeepSeek-R1全尺寸适配,已上线Gitee AI

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1在春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑推理、数学问题解决和实时决策的任务。
    的头像 发表于 03-12 13:45 2030次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek-R1</b>蒸馏模型

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效
    发表于 02-27 16:45

    Infinix AI接入DeepSeek-R1满血版

    传音控股旗下Infinix品牌正式宣布接入DeepSeek-R1满血版,2月26日起支持XOS 14.5及以上版本的Infinix机型可通过升级使用,3月份将发布的全新NOTE系列也将接入DeepSeek-R1,开启“Infin
    的头像 发表于 02-21 16:08 1187次阅读

    联想moto AI手机接入DeepSeek-R1

    2月14日,联想moto 宣布旗下AI手机正式接入DeepSeek-R1满血版大模型(671B参数),全面助力天禧生态在AI技术应用领域探索更多可能。通过联想小天的对话,联想moto手机用户即可
    的头像 发表于 02-15 14:39 1213次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实质性
    发表于 02-14 02:08

    广和通支持DeepSeek-R1蒸馏模型

    近期,国产大模型DeepSeek凭借开放性、更低训练成本、端侧部署等优势,迅速成为增速最快的AI应用之一,推动AI普惠化。目前,广和通高算力AI模组及解决方案全面支持小
    的头像 发表于 02-11 09:41 906次阅读

    Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

    模型相比,较小尺寸DeepSeek 蒸馏版本模型 更适合企业内部实施部署,可以极大的降低落地成本 。 同时,这次 Deepseek R1
    的头像 发表于 02-10 09:56 1099次阅读
    <b class='flag-5'>Gitee</b> <b class='flag-5'>AI</b> 联合沐曦首发全套 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 千问蒸馏模型,全免费体验!

    AIBOX 系产品已适配 DeepSeek-R1

    国产AI大模型DeepSeek以出色的性价比和高效的模型技术,迅速成为全球AI关注的焦点。Firefly开源团队率先实现AIBOX系列产品对DeepSeek-R1的全面适配。
    的头像 发表于 02-08 17:30 945次阅读
    AIBOX <b class='flag-5'>全</b>系产品已适配 <b class='flag-5'>DeepSeek-R1</b>

    DeepSeek-R1本地部署指南,开启你的AI探索之旅

    的进一步使用。 论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 1|0一、什么是
    的头像 发表于 02-08 10:30 8324次阅读
    <b class='flag-5'>DeepSeek-R1</b>本地部署指南,开启你的<b class='flag-5'>AI</b>探索之旅

    软通动力天璇MaaS融合DeepSeek-R1,引领企业智能化转型

    驱动”的范式转移,为多行业AI应用落地开辟了新路径。 作为中国数字技术产品和服务创新的领军企业,软通动力积极响应这一技术变革,率先与DeepSeek-R1进行了产品融合创新。通过将DeepSeek-R1接入软通动力的天璇MaaS
    的头像 发表于 02-08 09:57 900次阅读

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自发布以来吸引了众多用户关注,为了让 deepin 用户更好地体验这一前沿技术,UOS AI 现已适配接入 DeepSeek-R1 端侧模型!无需忍受服务器崩溃,两步即可在本地独享
    的头像 发表于 02-08 09:52 2214次阅读

    芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    近期,国产大模型 DeepSeek-R1横空出世,迅速成为AI领域的焦点。 芯动力在24小时内完成了与DeepSeek-R1大模型的适配。 DeepSeek-R1是幻方量化旗下大模型公
    的头像 发表于 02-07 16:55 896次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大模型,<b class='flag-5'>AI</b>芯片设计迈入“快车道”!

    原生鸿蒙版小艺App上架DeepSeek-R1AI智慧体验更丰富

    升级至11.2.10.310版本及以上,打开小艺App,点击“发现”-“智能体”-“DeepSeek-R1”,即可体验DeepSeek。或者也可以唤醒
    的头像 发表于 02-07 13:24 1971次阅读

    中软国际JointPilot平台上线DeepSeek-R1模型

    近日,DeepSeek-R1模型凭借其开源优势,超低训练成本和高性能,在全球人工智能领域引发广泛关注。中软国际积极拥抱AI时代变革,致力于将前沿技术与企业实际需求积极融合,其JointPilot(灵
    的头像 发表于 02-06 09:55 1246次阅读

    对标OpenAI o1,DeepSeek-R1发布

    今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。 DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 DeepSeek-R1
    的头像 发表于 01-22 13:46 3060次阅读
    对标OpenAI o<b class='flag-5'>1</b>,<b class='flag-5'>DeepSeek-R1</b>发布