0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型,全免费体验!

品读IT 来源:品读IT 作者:品读IT 2025-02-10 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Gitee AI 刚刚上线了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。值得关注的是,本次上线的四个模型均部署在国产沐曦曦云 GPU

wKgZPGepXOOAUDYmAA45t-baKr0306.png

与全尺寸 DeepSeek 模型相比,较小尺寸的 DeepSeek 蒸馏版本模型更适合企业内部实施部署,可以极大的降低落地成本

同时,这次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平台,更是实现了从芯片到平台,从算力到模型,全国产研发、中国制造

100%国产AI的力量

国产模型 DeepSeek R1

DeepSeek R1 是一款大型混合专家(MoE)模型,拥有 6710 亿个参数,支持 128000 个 Token 的大输入上下文长度。在数学、代码和自然语言推理等任务上表现出色。

本次部署在沐曦曦云 GPU 上的是四个 DeepSeek R1 蒸馏模型,以更小参数量的资源占用,实现了性能与大参数模型旗鼓相当。

wKgZO2epXOSAc5iJAAtLCvDLw-s632.png

国产 GPU 沐曦曦云

曦云系列通用 GPU 产品(包括 C550、C500、C500X、C290、C280、N260 等型号)采用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。

wKgZPGepXOWAG4JGAAGB18G5mEU984.png

在本次部署适配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同时得到沐曦的算力供应商超讯通信的鼎力支持,最终实现了模型的快速部署、稳定调用。

国产平台 Gitee AI

2024 年初上线以来,Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务,致力于让开发者轻松构建和部署 AI 应用,为企业客户提供更加智能、高效的 AI 应用解决方案。

wKgZO2epXOaAN6ZCAB5VU5ryBKw041.png

100%国产AI免费跑

目前 Gitee AI 上的DeepSeek-R1-Distill系列模型现已面向全体开发者免费使用!免费使用!免费使用!

本次上线的模型参数虽小,但它们表现并不亚于大参数模型,如下图中的DeepSeek-R1-Distill-Qwen-14B,虽然参数较小,但简单任务相较于大参数模型其响应速度更快,同时也具备体现思考过程的能力:

wKgZPGepXOiABXgNABXquu64tLE950.png

模型自强、算力自强、平台自强,100%国产AI的新时代已然来临。与其在“制裁-替代-再制裁”的循环中疲于奔命,不如和我们一起在国产 AI 的土壤上,种出下一个时代的参天大树。

访问 Gitee AI,体验基于沐曦算力的 DeepSeek R1,开启你的100%国产AI开发之旅!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41141

    浏览量

    302608
  • DeepSeek
    +关注

    关注

    2

    文章

    839

    浏览量

    3406
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    股份Day 0适配阿里Qwen3.6-35B-A3B大模型

    阿里巴巴模型团队最新宣布,开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型
    的头像 发表于 04-22 11:13 561次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份Day 0适配阿里<b class='flag-5'>千</b><b class='flag-5'>问</b>Qwen3.6-35B-A3B大<b class='flag-5'>模型</b>

    股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该
    的头像 发表于 03-03 15:25 579次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>联合</b>清华大学发布磁性材料<b class='flag-5'>AI</b>原子基座<b class='flag-5'>模型</b>

    首款AI硬件亮相:“AI眼镜”3月8日首发,全面接入APP

    国补后到手价为1997元,大幅降低了高端AI眼镜的使用门槛。   据悉,AI眼镜还将全面接入
    发表于 03-02 11:48 1211次阅读
    <b class='flag-5'>千</b><b class='flag-5'>问</b>首款<b class='flag-5'>AI</b>硬件亮相:“<b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>AI</b>眼镜”3月8日<b class='flag-5'>首发</b>,全面接入<b class='flag-5'>千</b><b class='flag-5'>问</b>APP

    股份云C系列GPU全面适配通义Qwen3.5三款新模型

    今日,通义团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三个版本。
    的头像 发表于 02-28 10:05 727次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列GPU全面适配通义<b class='flag-5'>千</b><b class='flag-5'>问</b>Qwen3.5三款新<b class='flag-5'>模型</b>

    股份云C系列GPU深度适配通义Qwen3.5模型

    今天,通义今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。
    的头像 发表于 02-26 14:26 796次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列GPU深度适配通义<b class='flag-5'>千</b><b class='flag-5'>问</b>Qwen3.5<b class='flag-5'>模型</b>

    股份云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型股份云C系列GPU完成Day 0适配。
    的头像 发表于 12-17 14:28 838次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份<b class='flag-5'>曦</b>云C系列GPU Day 0适配智谱GLM-4.6V多模态大<b class='flag-5'>模型</b>

    强强联合:之江实验室与股份共建智算集群联合实验室

    总工程师赵志峰、副主任何水兵,以及股份联合创始人、CTO兼首席硬件架构师彭莉等双方代表出席签约仪式。 本次合作旨在响应国家“人工智能+”行动号召,落实浙江省打造人工智能高地的战略部署。双方将围绕算力、数据、
    的头像 发表于 10-23 10:50 1558次阅读

    首款全国产通用GPU芯片发布 集成推出云C600

    ,并支持MetaXLink超节点扩展技术,在硬件性能和软件兼容上完全满足下一代生成式AI的训练和推理需求。 而且,股份与中国科学院合作的国产卡集群,已完成多个大
    的头像 发表于 10-19 20:04 4.7w次阅读

    联合香港科技大学登上AI顶会

    近日,PDE-AI Solution团队与香港科技大学合作,在两大人工智能顶级会议NeurIPS2025与EMNLP 2025上发表重要研究成果,涵盖大语言模型(LLM)的多样化解
    的头像 发表于 10-14 09:46 1848次阅读

    书生大模型实战营魔乐专场MeetUP精彩回顾

    近日,由书生大模型社区、、魔乐社区、算丰和 DaoCloud 道客等联合打造的「书生大模型实战营
    的头像 发表于 08-20 11:33 1247次阅读

    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型
    的头像 发表于 08-12 15:19 4499次阅读
    如何在NVIDIA Blackwell GPU上优化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你离线部署Deepseek R1模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型
    的头像 发表于 07-25 15:22 1579次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    硅基流动携手首发基于云的Kimi K2推理服务

    今天,硅基流动联合集成电路(上海)股份有限公司(简称“”),全球首发基于
    的头像 发表于 07-23 17:33 2162次阅读

    DeepSeek开源新版R1 媲美OpenAI o3

    ;还有一些网友的实测评价都显示, DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。 此外,关于DeepSeek
    的头像 发表于 05-29 11:23 1500次阅读

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1866次阅读
    瑞萨RZ/V2H平台支持部署离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言<b class='flag-5'>模型</b>