0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技顺利部署DeepSeek R1千问蒸馏模型

OSC开源社区 来源:Gitee AI 2025-02-08 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于Gitee AI,作者马建仓

DeepSeek 的国内算力支持队伍进一步壮大:来自上海的壁仞科技顺利部署DeepSeek-R1-Distill千问蒸馏模型(1.5B/7B/14B/32B),并已上线 Gitee AI 免费使用。

蒸馏小模型超越 OpenAI o1-mini

通过 DeepSeek-R1 的输出,DeepSeek 团队蒸馏并开源了 6 个小模型,其中 32B 和 70B 参数的模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

本次壁仞科技共部署了1.5B/7B/14B/32B四个不同参数的千问蒸馏模型,其中 32B 参数模型在输出质量和资源占用中取得了较好的平衡,更推荐开发者们使用。

32B参数模型使用壁仞算力的推理速度

壁仞科技联合科华数据,加速国产算力再升级

壁仞科技成立于 2019 年,致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。

基于壁砺TM系列训推产品 106M、106B、106E、110E,凭借先进的芯片架构、高效的多模型适配能力、广泛的数据精度支持以及强大的解码能力,配合算力集群供应商科华数据的强力支撑,仅用数小时即完成对 DeepSeek R1 全系列蒸馏模型的支持。

科华数据全国智算中心具备极致可靠、超高密度、弹性预制、绿色低碳、多样算力等特性。在智算中心的发展中融合「算网」、「算液」、「算效」,让算力从「用得了」、「用得起」到「用的好」。始终坚守以客户需求为导向,融合多行业场景解决方案和科华数据丰富的产品矩阵及技术底蕴来帮助客户实现价值。

100%国内AI新添强援

壁仞科技的加入,为 DeepSeek R1 千问蒸馏模型带来了又一个国内算力强援,也为开发者提供了新的国内算力选择。

同样,Gitee AI 壁仞科技算力资源包中的DeepSeek-R1-Distill-Qwen系列模型依然面向全体开发者免费使用!

点击文末阅读原文,免费使用壁仞算力感受DeepSeek-R1-Distill-Qwen系列模型的出色表现吧!

更多国产算力与 DeepSeek 和 Gitee AI 的对接工作也正在紧锣密鼓进行中,努力为开发者提供更高效、更灵活的 AI 应用解决方案。

除了国产 GPU 芯片外,Gitee AI 也正在联合国产生态厂商探索更多形态、更多平台的 AI 模型适配,并将于近期正式上线,各位开发者敬请期待。

Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    2

    文章

    1389

    浏览量

    16566
  • 壁仞科技
    +关注

    关注

    1

    文章

    72

    浏览量

    3581
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2828

原文标题:100%国产AI新成员:壁仞科技成功适配DeepSeek R1千问蒸馏模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1385次阅读
    瑞萨RZ/V2H平台支持<b class='flag-5'>部署</b>离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言<b class='flag-5'>模型</b>

    科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,科技完成全
    的头像 发表于 04-30 15:19 1359次阅读

    ORinNano离线部署Deepseek R1模型教程

    ORinNano离线部署Deepseek R1模型教程
    的头像 发表于 04-10 15:32 1060次阅读
    ORinNano离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>教程

    RK3588开发板上部署DeepSeek-R1模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态
    发表于 02-27 16:45

    香橙派发布OrangePi 5Plus本地部署Deepseek-R1蒸馏模型指南

    派官方发布OrangePi5Plus运行Deepseek-R1蒸馏模型实操指南,赶紧收藏起来吧!OrangePi5Plus采用了瑞芯微RK3588八核64位处理器
    的头像 发表于 02-19 16:14 1596次阅读
    香橙派发布OrangePi 5Plus本地<b class='flag-5'>部署</b><b class='flag-5'>Deepseek-R1</b><b class='flag-5'>蒸馏</b><b class='flag-5'>模型</b>指南

    研华发布昇腾AI Box及Deepseek R1模型部署流程

    近日,随着深度求索(DeepSeek)大模型的发布在行业内掀起热议,研华科技正式推出了基于昇腾Atlas平台的边缘AI Box MIC-ATL3S,并同步发布了与Deepseek R1
    的头像 发表于 02-19 10:41 1092次阅读

    研华边缘AI Box MIC-ATL3S部署Deepseek R1模型

    随着深度求索(DeepSeek)大模型的发布引发行业热议,研华科技基于昇腾Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepseek R1
    的头像 发表于 02-14 16:08 2625次阅读
    研华边缘AI Box MIC-ATL3S<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>

    IBM在watsonx.ai平台推出DeepSeek R1蒸馏模型

    ,进一步增强企业在安全、治理以及规模化部署方面的能力。 DeepSeek R1是IBM在AI领域的一项重要创新,它采用了蒸馏模型技术,能够在
    的头像 发表于 02-14 10:21 877次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    ); 二者均支持API调用,可根据业务需求混合部署(如用V3处理前端交互,R1负责后端计算)。 在电子工程领域选用哪个模型最合适,有其他更好的模型推荐吗? 在电子工程领域的电路设计与
    发表于 02-14 02:08

    Deepseek R1模型离线部署教程

    DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型DeepSeek-R1采用强化学习进行后训练,旨在提升推理能力,尤其擅长数学、代码和自然语言
    的头像 发表于 02-12 09:37 2462次阅读
    <b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>离线<b class='flag-5'>部署</b>教程

    Gitee AI 联合沐曦首发全套 DeepSeek R1 蒸馏模型,全免费体验!

    模型相比,较小尺寸的 DeepSeek 蒸馏版本模型 更适合企业内部实施部署,可以极大的降低落地成本 。 同时,这次
    的头像 发表于 02-10 09:56 1104次阅读
    Gitee AI 联合沐曦首发全套 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> <b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>蒸馏</b><b class='flag-5'>模型</b>,全免费体验!

    部署DeepSeek R1于AX650N与AX630C平台

    背景 春节前,国产大模型 DeepSeek 横空出世,迅速成为AI领域的焦点。作为端侧AI能效比优异的 AX650N、AX630C 芯片平台早已在节前完成 DeepSeek R1
    的头像 发表于 02-09 09:32 1911次阅读
    <b class='flag-5'>部署</b><b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>于AX650N与AX630C平台

    鲲云科技AI芯片CAISA 430成功适配DeepSeek R1模型

    鲲云科技全新一代的可重构数据流 AI 芯片 CAISA 430 成功适配 DeepSeek R1 蒸馏模型推理,这一创新举措为大模型应用的高
    的头像 发表于 02-07 09:57 2378次阅读
    鲲云科技AI芯片CAISA 430成功适配<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    。 据悉,DeepSeek开源模型在多语言理解与复杂推理任务中一直表现出卓越的性能,其V3、R1等系列模型更是备受业界关注。而此次摩尔线程所实现的D
    的头像 发表于 02-06 13:49 1185次阅读

    云天励飞上线DeepSeek R1系列模型

    -Distill-Llama-70B大模型DeepSeek V3/R1 671B MoE大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持
    的头像 发表于 02-06 10:39 1085次阅读
    云天励飞上线<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b>