DeepSeek 的国内算力支持队伍进一步壮大:来自上海的壁仞科技顺利部署DeepSeek-R1-Distill千问蒸馏模型(1.5B/7B/14B/32B),并已上线 Gitee AI 免费使用。
蒸馏小模型超越 OpenAI o1-mini
通过 DeepSeek-R1 的输出,DeepSeek 团队蒸馏并开源了 6 个小模型,其中 32B 和 70B 参数的模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
本次壁仞科技共部署了1.5B/7B/14B/32B四个不同参数的千问蒸馏模型,其中 32B 参数模型在输出质量和资源占用中取得了较好的平衡,更推荐开发者们使用。
32B参数模型使用壁仞算力的推理速度
壁仞科技联合科华数据,加速国产算力再升级
壁仞科技成立于 2019 年,致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。
基于壁砺TM系列训推产品 106M、106B、106E、110E,凭借先进的芯片架构、高效的多模型适配能力、广泛的数据精度支持以及强大的解码能力,配合算力集群供应商科华数据的强力支撑,仅用数小时即完成对 DeepSeek R1 全系列蒸馏模型的支持。
科华数据全国智算中心具备极致可靠、超高密度、弹性预制、绿色低碳、多样算力等特性。在智算中心的发展中融合「算网」、「算液」、「算效」,让算力从「用得了」、「用得起」到「用的好」。始终坚守以客户需求为导向,融合多行业场景解决方案和科华数据丰富的产品矩阵及技术底蕴来帮助客户实现价值。
100%国内AI新添强援
壁仞科技的加入,为 DeepSeek R1 千问蒸馏模型带来了又一个国内算力强援,也为开发者提供了新的国内算力选择。
同样,Gitee AI 壁仞科技算力资源包中的DeepSeek-R1-Distill-Qwen系列模型依然面向全体开发者免费使用!
点击文末阅读原文,免费使用壁仞算力感受DeepSeek-R1-Distill-Qwen系列模型的出色表现吧!
更多国产算力与 DeepSeek 和 Gitee AI 的对接工作也正在紧锣密鼓进行中,努力为开发者提供更高效、更灵活的 AI 应用解决方案。
除了国产 GPU 芯片外,Gitee AI 也正在联合国产生态厂商探索更多形态、更多平台的 AI 模型适配,并将于近期正式上线,各位开发者敬请期待。
Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 54 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。
-
算力
+关注
关注
2文章
1673浏览量
16833 -
壁仞科技
+关注
关注
1文章
88浏览量
4201 -
DeepSeek
+关注
关注
2文章
839浏览量
3406
原文标题:100%国产AI新成员:壁仞科技成功适配DeepSeek R1千问蒸馏模型
文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型
壁仞科技壁砺166系列产品深度适配MiniMax M2.5和智谱GLM-5模型
DeepSeek爆火一周年的寂静
壁仞科技壁砺166M产品适配模思智能MOSS-TTS Family模型
壁仞科技在香港联合交易所挂牌上市
DeepSeek模型如何在云服务器上部署?
广和通成功部署DeepSeek-R1-0528-Qwen3-8B模型
DeepSeek R1 MTP在TensorRT-LLM中的实现与优化
如何在NVIDIA Blackwell GPU上优化DeepSeek R1吞吐量
速看!EASY-EAI教你离线部署Deepseek R1大模型
壁仞科技顺利部署DeepSeek R1千问蒸馏模型
评论