0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技顺利部署DeepSeek R1千问蒸馏模型

OSC开源社区 来源:Gitee AI 2025-02-08 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于Gitee AI,作者马建仓

DeepSeek 的国内算力支持队伍进一步壮大:来自上海的壁仞科技顺利部署DeepSeek-R1-Distill千问蒸馏模型(1.5B/7B/14B/32B),并已上线 Gitee AI 免费使用。

蒸馏小模型超越 OpenAI o1-mini

通过 DeepSeek-R1 的输出,DeepSeek 团队蒸馏并开源了 6 个小模型,其中 32B 和 70B 参数的模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

本次壁仞科技共部署了1.5B/7B/14B/32B四个不同参数的千问蒸馏模型,其中 32B 参数模型在输出质量和资源占用中取得了较好的平衡,更推荐开发者们使用。

32B参数模型使用壁仞算力的推理速度

壁仞科技联合科华数据,加速国产算力再升级

壁仞科技成立于 2019 年,致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。

基于壁砺TM系列训推产品 106M、106B、106E、110E,凭借先进的芯片架构、高效的多模型适配能力、广泛的数据精度支持以及强大的解码能力,配合算力集群供应商科华数据的强力支撑,仅用数小时即完成对 DeepSeek R1 全系列蒸馏模型的支持。

科华数据全国智算中心具备极致可靠、超高密度、弹性预制、绿色低碳、多样算力等特性。在智算中心的发展中融合「算网」、「算液」、「算效」,让算力从「用得了」、「用得起」到「用的好」。始终坚守以客户需求为导向,融合多行业场景解决方案和科华数据丰富的产品矩阵及技术底蕴来帮助客户实现价值。

100%国内AI新添强援

壁仞科技的加入,为 DeepSeek R1 千问蒸馏模型带来了又一个国内算力强援,也为开发者提供了新的国内算力选择。

同样,Gitee AI 壁仞科技算力资源包中的DeepSeek-R1-Distill-Qwen系列模型依然面向全体开发者免费使用!

点击文末阅读原文,免费使用壁仞算力感受DeepSeek-R1-Distill-Qwen系列模型的出色表现吧!

更多国产算力与 DeepSeek 和 Gitee AI 的对接工作也正在紧锣密鼓进行中,努力为开发者提供更高效、更灵活的 AI 应用解决方案。

除了国产 GPU 芯片外,Gitee AI 也正在联合国产生态厂商探索更多形态、更多平台的 AI 模型适配,并将于近期正式上线,各位开发者敬请期待。

Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    2

    文章

    1673

    浏览量

    16833
  • 壁仞科技
    +关注

    关注

    1

    文章

    88

    浏览量

    4201
  • DeepSeek
    +关注

    关注

    2

    文章

    839

    浏览量

    3406

原文标题:100%国产AI新成员:壁仞科技成功适配DeepSeek R1千问蒸馏模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技砺166系列GPU产品率先支持Kimi K2.6模型

    4月20日晚,月之暗面正式发布并开源Kimi K2.6模型,带来行业领先(state-of-the-art)的代码、长程任务执行和Agent集群能力。科技(06082.HK)旗舰通用GPU产品
    的头像 发表于 04-23 16:30 824次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b>砺166系列GPU产品率先支持Kimi K2.6<b class='flag-5'>模型</b>

    科技砺166系列产品深度适配MiniMax M2.5和智谱GLM-5模型

    2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。科技(06082.HK)旗舰产品砺166系列率先完成M2.5的本地化部署
    的头像 发表于 02-26 14:31 753次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b>砺166系列产品深度适配MiniMax M2.5和智谱GLM-5<b class='flag-5'>模型</b>

    DeepSeek爆火一周年的寂静

    ,争先恐后地展示技术进步。而另一边,则是DeepSeek模型缺席春节假期,与一年前R1横空出世、引爆全球关注的高光姿态,形成了鲜明对比。   恰逢R1爆火一周年的时刻,我们回溯了过去
    的头像 发表于 02-26 14:15 1.1w次阅读
    <b class='flag-5'>DeepSeek</b>爆火一周年的寂静

    科技砺166M产品适配模思智能MOSS-TTS Family模型

    MOSS-TTS模型的高性能推理部署。作为国内领军的通用GPU芯片企业,科技成为首家完成MOSS-TTS模型适配的国产算力厂商。
    的头像 发表于 02-11 16:54 1431次阅读

    科技在香港联合交易所挂牌上市

    1月2日,科技在香港联合交易所挂牌上市,股票代码为06082.HK。作为港股2026年首只上市新股,科技发行价19.60港元,募资规
    的头像 发表于 01-05 15:45 2325次阅读

    DeepSeek模型如何在云服务器上部署

    随着大型语言模型(LLM)的应用日益普及,许多开发者和企业希望将像DeepSeek这样的优秀模型部署到自己的云服务器上,以实现私有化、定制化服务并保障数据安全。本文将详细阐述
    的头像 发表于 10-13 16:52 1146次阅读

    广和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,广和通在MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型,显著提升了端侧AI设备的处理效率与智能化水平,特别是在本地化复杂
    的头像 发表于 09-26 13:35 994次阅读

    DeepSeek R1 MTP在TensorRT-LLM中的实现与优化

    。我们在之前的博客[1] 中介绍了 DeepSeek-R1 模型实现超低推理延迟的关键优化措施。本文将深入探讨 TensorRT-LLM 中的 MTP 实现与优化。
    的头像 发表于 08-30 15:47 4683次阅读
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的实现与优化

    如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量

    开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型
    的头像 发表于 08-12 15:19 4499次阅读
    如何在NVIDIA Blackwell GPU上优化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你离线部署Deepseek R1模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型DeepSeek-R1采用
    的头像 发表于 07-25 15:22 1579次阅读
    速看!EASY-EAI教你离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    Janus系列、代码大模型deepseek-coder系列、混合专家模型DeepSeekMoE等等,V3和R1还有其蒸馏(Distill)过
    发表于 07-17 11:59

    DeepSeek开源新版R1 媲美OpenAI o3

    ;还有一些网友的实测评价都显示, DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性价比的平替。 此外,关于DeepSeek
    的头像 发表于 05-29 11:23 1500次阅读

    科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,
    的头像 发表于 05-16 16:23 1167次阅读

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 1865次阅读
    瑞萨RZ/V2H平台支持<b class='flag-5'>部署</b>离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言<b class='flag-5'>模型</b>

    科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,科技完成全
    的头像 发表于 04-30 15:19 1712次阅读