0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek在昇腾上的模型部署的常见问题及解决方案

OSC开源社区 来源: OSC开源社区 2025-03-25 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见问题困扰着不少开发者

本文将为你详细阐述昇腾DeepSeek模型部署的优秀实践。

昇腾DeepSeek模型部署的常见问题及解决方案见:
DeepSeek在昇腾上的模型部署 - 常见问题及解决方案
https://modelers.cn/updates/zh/modelers/20250226-deepseek-bestpractice-acend-deploy-part2/

01 硬件要求及组网

推荐参考配置如下,部署DeepSeek-V3/R1量化模型至少需要多节点Atlas 800I A2(8*64G)服务器。

本方案以DeepSeek-R1为主进行介绍,DeepSeek-V3与R1的模型结构和参数量一致,部署方式与R1相同。

b4125938-0952-11f0-9310-92fbcf53809c.jpg

02 运行环境准备

推荐使用镜像部署

1、镜像部署

昇腾官方在Ascend hub提供环境示例镜像,含推理部署配套软件以及模型运行脚本,用户可参考构建运行环境镜像进行部署。

镜像部署及启动参照ModelZoo指南中“加载镜像”章节,该指南中还包含“容器启动”等指引:
https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#加载镜像

镜像申请/下载(含于上述指南):
https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f

b42efc50-0952-11f0-9310-92fbcf53809c.jpg

2、裸机部署

根据MindIE安装指南安装软件包和运行依赖软件。

安装指南:

根据指南安装全部软件包和环境
https://www.hiascend.com/document/detail/zh/mindie/100/envdeployment/instg/mindie_instg_0001.html

模型获取:
https://modelers.cn/models/MindIE/DeepSeek-R1

03 权重文件准备

BF16权重下载:https://modelers.cn/models/State_Cloud/DeepSeek-V3-BF16

INT8量化后权重下载:https://modelers.cn/models/State_Cloud/DeepSeek-R1-W8A8/tree/main

如已下载BF16模型,也可采用以下步骤进行模型量化,权重BF16->INT8转换预计7~8小时。

Step1:安装ModelSlim

git clone https://gitee.com/ascend/msit.git

cd msit/msmodelslim

bash install.sh

Step2: 运行量化命令

cd msit/msmodelslim/example/DeepSeek/

python3 quant_deepseek_w8a8.py

--model_path {浮点权重路径}

--save_path {W8A8量化权重路径}

更多详细量化教程请参考 DeepSeek量化文档 https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim/example/DeepSeek

Msmodelslim代码仓 https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim

04 运行前检查

服务器检查:https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#前置准备 软件版本配套检查,含:HDK、CANN、PTA、MindIE、MindStudio 1、检查组网链接状态 a)检查物理链接for i in {0..7}; do hccn_tool -i $i -lldp -g | grep Ifname; done b)检查链接情况for i in {0..7}; do hccn_tool -i $i -link -g ; done c)检查网络健康情况for i in {0..7}; do hccn_tool -i $i -net_health -g ; done d)查看侦测ip的配置是否正确for i in {0..7}; do hccn_tool -i $i -netdetect -g ; done e)查看网关是否配置正确for i in {0..7}; do hccn_tool -i $i -gateway -g ; done f)检查NPU底层tls校验行为一致性,建议全0for i in {0..7}; do hccn_tool -i $i -tls -g ; done | grep switch g)# NPU底层tls校验行为置0操作for i in {0..7};do hccn_tool -i $i -tls -s enable 0;done

2、根据组网设置准备rank_table_file.json

使用多节点推理时,需要将包含设备ip,服务器ip等信息的json文件地址传递给底层通信算子。参考如下格式,配置rank_table_file.json:

b43fd6b0-0952-11f0-9310-92fbcf53809c.jpg

05 模型部署与配置

独立模型: https://modelers.cn/models/MindIE/DeepSeek-R1

服务化部署:

1、运行指南 https://modelers.cn/models/MindIE/DeepSeek-R1/blob/main/README.md(服务化测试)

2、服务启动 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0004.html

3、接口指引 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0062.html

06 模型运行

‍‍

1、纯模型测试

模型脚本已预制在镜像中,参照以下链接即可拉起精度测试及模型测试https://modelers.cn/models/MindIE/DeepSeek-R1/blob/main/README.md (纯模型测试部分)

b45b45d0-0952-11f0-9310-92fbcf53809c.jpg

2、服务化测试

1. 运行指南 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/MindIE/LLM/DeepSeek/DeepSeek-R1#服务化测试

2. 服务启动 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0004.html

3. 常用接口指引 https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0062.html

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 昇腾
    +关注

    关注

    1

    文章

    175

    浏览量

    7298
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2825

原文标题:DeepSeek在昇腾上的模型部署-优秀实践

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    漫话之《一体机请就位》

    为什么DeepSeek部署「最优解」?
    的头像 发表于 03-07 00:12 1933次阅读
    漫话<b class='flag-5'>昇</b><b class='flag-5'>腾</b>之《一体机请就位》

    Deepseek进入业务深水区,为什么需要大EP?

    行业智能化的高铁,由大EP+DeepSeek的双轨铺成
    的头像 发表于 03-17 15:09 1671次阅读
    <b class='flag-5'>Deepseek</b>进入业务深水区,为什么需要<b class='flag-5'>昇</b><b class='flag-5'>腾</b>大EP?

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    DeepSeek 模型部署与测试,开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板:AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造,其硬件配置堪称豪华,
    发表于 02-14 17:42

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    的核心功能之一,它允许用户将Hugging Face或GGUF格式的大语言模型转换为RKLLM模型,从而将RKLLM模型Rockchip NPU
    发表于 02-27 16:45

    OpenHarmony集成 AI

    OpenHarmony集成 AI:目前,没有提供OpenHarmony系统可用的驱动。如果OpenHarmony要用
    发表于 02-17 11:57

    思原生,助力智谱打造自主创新大模型体系!

    自从全面启动原生开发,越来越多的生态伙伴选择,大模型生态从“应用迁移”走向“原生开发”,充分依托
    的头像 发表于 08-20 18:29 1020次阅读
    <b class='flag-5'>昇</b><b class='flag-5'>腾</b>与<b class='flag-5'>昇</b>思原生,助力智谱打造自主创新大<b class='flag-5'>模型</b>体系!

    中软国际科创中心上线DeepSeek模型

    近日,中软国际科创中心以“DeepSeek+”为引擎,紧跟行业趋势,将DeepSeek全参模型满血版
    的头像 发表于 02-08 18:02 1755次阅读

    研华边缘AI Box MIC-ATL3S部署Deepseek R1模型

    随着深度求索(DeepSeek)大模型的发布引发行业热议,研华科技基于Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepsee
    的头像 发表于 02-14 16:08 2622次阅读
    研华边缘AI Box MIC-ATL3S<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> R1<b class='flag-5'>模型</b>

    华为推出DeepSeek模型一体机

    DeepSeek模型的横空出世,让AI正以前所未有的速度重塑各行各业的发展格局。DeepSeek一体机深度融合
    的头像 发表于 02-18 09:56 2618次阅读

    云轴科技ZStack智塔携手AI实现DeepSeek模型部署

    DeepSeek为人工智能AI产业带来一场革命,为企业级AI应用私有化部署场景(Private AI)注入强劲动力。作为企业级私有化AI Infra平台,云轴科技ZStack智塔携手
    的头像 发表于 02-18 09:59 1254次阅读
    云轴科技ZStack智塔携手<b class='flag-5'>昇</b><b class='flag-5'>腾</b>AI实现<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    研华发布AI Box及Deepseek R1模型部署流程

    。这一举措标志着研华AI边缘计算领域迈出了重要一步。 研华边缘AI Box MIC-ATL3S依托芯片的强大异构计算能力,结合研华边缘计算领域的高可靠特点,为用户提供了高效、稳
    的头像 发表于 02-19 10:41 1091次阅读

    推理服务器+DeepSeek模型 技术培训图为科技成功举办

    DeepSeek模型的全面融合应用即将迈入实质性落地的新阶段。 加持DeepSeek模型
    的头像 发表于 02-26 17:38 1066次阅读
    <b class='flag-5'>昇</b><b class='flag-5'>腾</b>推理服务器+<b class='flag-5'>DeepSeek</b>大<b class='flag-5'>模型</b> 技术培训<b class='flag-5'>在</b>图为科技成功举办

    中软国际发布基于计算架构的“DeepSeek社保基金监管大模型一体机”解决方案

          为了提升社保基金监管效能,推动社保基金管理的智能化、科学化、精准化,中软国际正式推出“DeepSeek社保基金监管大模型一体机”解决方案。该方案基于
    的头像 发表于 03-06 19:19 1687次阅读
    中软国际发布基于<b class='flag-5'>昇</b><b class='flag-5'>腾</b>计算架构的“<b class='flag-5'>DeepSeek</b>社保基金监管大<b class='flag-5'>模型</b>一体机”<b class='flag-5'>解决方案</b>

    润和软件将持续深化“+DeepSeek”技术路线

    近日,“+DeepSeek 智算引擎创新行”江苏省首站活动南京成功举办,本次活动由南京江北新区产业技术研创园指导,江苏省人工智能学会、江苏鲲鹏·
    的头像 发表于 03-08 09:39 1124次阅读

    中软国际推出金融AI解决方案和一体机v1.0

    近日,中软国际重磅推出金融AI解决方案和一体机v1.0,该方案基于AI基础软硬件平台,完
    的头像 发表于 03-28 17:05 1014次阅读