0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OrangePi AI Studio运行Deepseek-R1蒸馏模型,开启你的AI之旅

香橙派 2025-02-11 10:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2025年蛇年春节,DeepSeek强势出圈,以十分之一的训练成本比肩OpenAI GPT-4o的性能,重塑AI世界新秩序。DeepSeek向全世界开源,为全球的数据科学家、AI爱好者乃至中小开发者开辟了一条通往前沿技术的道路。

DeepSeek是一款集成多种AI技术的开发平台,旨在为用户提供高效、便捷的AI模型训练、部署和应用服务。它支持自然语言处理(NLP)、计算机视觉(CV)、语音识别等多个领域的任务,还提供丰富的预训练模型和工具,帮助用户快速构建和优化AI应用。

DeepSeek点燃了AI应用。今天,我们就给大家分享如何利用手中的设备运行Deepseek。我们所采用的设备是OrangePi AI Studio。

wKgZPGeqsHyALNbIAAL5MNGGlJI653.png

OrangePi AI Studio:高算力人工智能算力卡

OrangePi AI Studio采用昇腾AI技术路线,融合“ARM core,AI core,Vector core,Image core”于一体,提供“基础通用算力+超强AI算力+编解码核心”,充分满足推训一体AI任务需求,拥有48GB /96GB LPDDR4X,速率高达4266Mbps。

wKgZPGeqsH2AVsH9AAajDfrCWic698.png

OrangePi AI Studio汇聚了Type-C(USB4.0)、电源接口、电源按键、LED指示灯等,可广泛应用于OCR识别、目标识别、人脸识别、搜索推荐、大模型多模态、内容审核、VR智能、数字医疗、物联网等诸多AI应用场景。

OrangePi AI Studio当前支持Ubuntu22.04.5、内核linux5.15.0.126,即将支持Windows,满足市场对于算力的强烈需求,降低用户的学习成本、开发成本和运营成本。

实操指南:OrangePi AI Studio运行Deepseek

1.1硬件连接

使用USB4数据线连接opi ai studio和Ubuntu PC。开启Ubuntu PC,参考用户手册中驱动安装步骤安装驱动。

正确连接opi ai studio和pc后,在pc开机状态下,左右两侧指示灯常亮,中间指示灯闪烁。

wKgZPGeqsH6AfCaoAAxIFth9zOg172.png

1.2下载docker镜像

1)首先在Ubuntu电脑中安装下docker软件,安装完docker后如果使用docker -v命令能看到版本号说明安装成功。

#apt update

#apt install -y docker.io

#docker -v

2)打开下面的链接,再点击ATB-Models下载选项:

https://www.hiascend.com/developer/download/community/result?module=ie%2Bpt%2Bcann

wKgZPGeqsHyAHC5PAAMwVTINt70709.png

3)然后点击镜像版本中的1.0.0-300I-Duo-py311-openeuler24.03-lts对应的下载选项。

wKgZO2eqsHyAJxbFAAJroE04LI4339.png

4)点击1.0.0-300I-Duo-py311-openeuler24.03-lts右侧的立即下载后会显示下面的安装步骤:

wKgZPGeqsHyASfG_AAGAgh6T2WU449.png

a)使用root用户运行下面的命令获取登录访问权限,然后输入密码登录。不同账号看到的下载地址是不一样的,按照实际获取的信息填写。

#docker login -u cn-south-1@ADW7CJ164S04NRFEELZP swr.cn-south-1.myhuaweicloud.com

Password:

WARNING! Your password will be stored unencrypted in /root/.docker/config.json.

Configure a credential helper to remove this warning. See

https://docs.docker.com/engine/reference/commandline/login/#credential-stores

Login Succeeded

b)然后下载镜像即可。

#docker pull swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:1.0.0-300I-Duo-py311-openeuler24.03-lts

c)下载好的镜像如下所示:

#docker images

REPOSITORY TAG IMAGE ID CREATED SIZE

swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie 1.0.0-300I-Duo-py311-openeuler24.03-lts 74a5b9615370

3weeks ago 17.5GB

1.3 使用docker镜像的方法

1)在任意位置创建一个名为start-docker.sh的启动脚本,内容如下所示:

#vim start-docker.sh

IMAGES_ID=$1

NAME=$2

if [ $# -ne 2 ]; then

echo "error: need one argument describing your container name."

exit 1

fi

docker run --name ${NAME} -it -d --net=host --shm-size=500g \

--privileged=true \

-w /home \

--device=/dev/davinci_manager \

--device=/dev/hisi_hdc \

--device=/dev/devmm_svm \

--entrypoint=bash \

-v /models:/models \

-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \

-v /usr/local/dcmi:/usr/local/dcmi \

-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \

-v /usr/local/sbin:/usr/local/sbin \

-v /home:/home \

-v /tmp:/tmp \

-v /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime \

-e http_proxy=$http_proxy \

-e https_proxy=$https_proxy \

${IMAGES_ID}

2)然后查看下docker镜像的IMAGE ID。

#docker images

REPOSITORY TAG IMAGE ID CREATED SIZE

swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie 1.0.0-300I-Duo-py311-openeuler24.03-lts 74a5b9615370

3weeks ago 17.5GB

3)然后依次执行如下命令启动并进入容器:

a.首先运行start-docker.sh脚本创建运行容器,此命令只需执行一次。74a5b9615370是我们上一步中查询到的docker镜像ID,mindIE是我们自定义的容器名,可以自行更改,之后进入docker容器的时候需要使用这个名字。

#chmod +xstart-docker.sh

#bash start-docker.sh74a5b9615370deepseek

b.然后运行下面的命令进入容器命令行。

#docker exec -itdeepseekbash

1.4 DeepSeek-R1-Distill-Qwen-14B

1)依次执行下面的命令,下载DeepSeek-R1-Distill-Qwen-14B模型权重,将其放到/models目录下。如无法下载可参考国内模型网站使用方法一小节的方法通过国内模型网站下载。

#mkdir /models

#cd /models

#apt install -y git-lfs

#git clone--depth=1https://deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

2)如果是32GB或32GB以下内存的电脑,需要加大内存交换分区的大小,不然转换权重和执行推理程序时会由于内存不够而退出。这一步请在物理机上执行,不支持在docker容器内执行

#fallocate -l 64G /swap_model

#chmod 600 /swap_model

#mkswap /swap_model

#swapon /swap_model

#使用完成后可以使用下面的命令释放空间

#swapoff /swap_model

#rm /swap_model

3)使用chown命令将/models/DeepSeek-R1-Distill-Qwen-14B目录及其所有文件的所有者和组更改为root用户和root组。

#chown root:root -R/models/DeepSeek-R1-Distill-Qwen-14B

4)推理DeepSeek-R1-Distill-Qwen-14B模型的命令如下所示:

#cd $ATB_SPEED_HOME_PATH

#torchrun --nproc_per_node 1 --master_port 20037 -m examples.run_pa --model_path /models/DeepSeek-R1-Distill-Qwen-14B/ --max_output_length 256

5)推理成功后,在输出的最后,可以找到Question和Answer,结果如下所示:

wKgZO2eqsHyAcshrAACk-UQ85io331.png

6)纯模型能够正常推理后,我们修改mindie server配置。

#vim /usr/local/Ascend/mindie/latest/mindie-service/conf/config.json

"httpsEnabled" : false,

"npuDeviceIds" : [[0]],

"modelName" : "DeepSeek",

"modelWeightPath" : "/models/DeepSeek-R1-Distill-Qwen-14B",

"worldSize" :1,

7)我们需要先修改模型目录下的config.json文件的权限为640,否则无法启动server服务。

#chmod 640/models/DeepSeek-R1-Distill-Qwen-14B/config.json

8)执行以下命令启动MindIE Server服务,如果最后有如下的输出,表示启动成功。。

#cd /usr/local/Ascend/mindie/latest/mindie-service/bin

#./mindieservice_daemon

......

Daemon start success!

9)接着拉取聊天机器人案例代码。

#git clone https://gitee.com/toolsmanhehe/chat_robot.git

10)安装依赖。

#cd chat_robot

#pip3 install -r requirements.txt -i https://mirrors.huaweicloud.com/repository/pypi/simple

11)启动聊天机器人demo程序。启动后,会打印如下信息,复制其中的url到浏览器打开。

a)首先程序会自动查询当前设备上MindIE中运行的模型信息,并打印出来。

b)如果提示暂不支持,请核对MindIE Server中的“modelName”字段。

c)然后等一会就会打印两个ip地址。第一个url只能在启动主程序的电脑上访问,第二个url可以通过和启动主程序的电脑同一网络下的设备访问。

# python3 main.py

检测到mindie server中启动了DeepSeek模型。

* Serving Flask app 'main'

* Debug mode: off

WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.

* Running on all addresses (0.0.0.0)

* Running on http://127.0.0.1:5000

* Running on http://10.31.3.139:5000

Press CTRL+C to quit

12)浏览器打开上面的链接后我们可以看到下面这个页面,左侧提供了一些问题,点击可以直接提问。

wKgZO2eqsH2AQ74gAAcf6L5ofDs506.png

1.5 DeepSeek-R1-Distill-Qwen-1.5B

13)依次执行下面的命令,下载DeepSeek-R1-Distill-Qwen-14B模型权重,将其放到/models目录下。如无法下载可参考国内模型网站使用方法一小节的方法通过国内模型网站下载。

#mkdir /models

#cd /models

#apt install -y git-lfs

#git clone--depth=1https://deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

14)如果是32GB或32GB以下内存的电脑,需要加大内存交换分区的大小,不然转换权重和执行推理程序时会由于内存不够而退出。这一步请在物理机上执行,不支持在docker容器内执行

#fallocate -l 64G /swap_model

#chmod 600 /swap_model

#mkswap /swap_model

#swapon /swap_model

#使用完成后可以使用下面的命令释放空间

#swapoff /swap_model

#rm /swap_model

15)使用chown命令将/models/DeepSeek-R1-Distill-Qwen-1.5B目录及其所有文件的所有者和组更改为root用户和root组。

#chown root:root -R/models/DeepSeek-R1-Distill-Qwen-1.5B

16)推理DeepSeek-R1-Distill-Qwen-14B模型的命令如下所示:

#cd $ATB_SPEED_HOME_PATH

#torchrun --nproc_per_node 1 --master_port 20037 -m examples.run_pa --model_path /models/DeepSeek-R1-Distill-Qwen-1.5B/ --max_output_length 256

17)推理成功后,在输出的最后,可以找到Question和Answer,结果如下所示:

wKgZO2eqsHyAcshrAACk-UQ85io331.png

18)纯模型能够正常推理后,我们修改mindie server配置。

#vim /usr/local/Ascend/mindie/latest/mindie-service/conf/config.json

"httpsEnabled" : false,

"npuDeviceIds" : [[0]],

"modelName" : "DeepSeek",

"modelWeightPath" : "/models/DeepSeek-R1-Distill-Qwen-1.5B",

"worldSize" :1,

19)我们需要先修改模型目录下的config.json文件的权限为640,否则无法启动server服务。

#chmod 640/models/DeepSeek-R1-Distill-Qwen-1.5B/config.json

20)执行以下命令启动MindIE Server服务,如果最后有如下的输出,表示启动成功。。

#cd /usr/local/Ascend/mindie/latest/mindie-service/bin

#./mindieservice_daemon

......

Daemon start success!

21)接着拉取聊天机器人案例代码。

#git clone https://gitee.com/toolsmanhehe/chat_robot.git

22)安装依赖。

#cd chat_robot

#pip3 install -r requirements.txt -i https://mirrors.huaweicloud.com/repository/pypi/simple

23)启动聊天机器人demo程序。启动后,会打印如下信息,复制其中的url到浏览器打开。

a)首先程序会自动查询当前设备上MindIE中运行的模型信息,并打印出来。

b)如果提示暂不支持,请核对MindIE Server中的“modelName”字段。

c)然后等一会就会打印两个ip地址。第一个url只能在启动主程序的电脑上访问,第二个url可以通过和启动主程序的电脑同一网络下的设备访问。

# python3 main.py

检测到mindie server中启动了DeepSeek模型。

* Serving Flask app 'main'

* Debug mode: off

WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.

* Running on all addresses (0.0.0.0)

* Running on http://127.0.0.1:5000

* Running on http://10.31.3.139:5000

Press CTRL+C to quit

24)浏览器打开上面的链接后我们可以看到下面这个页面,左侧提供了一些问题,点击可以直接提问。

wKgZO2eqsH2AQ74gAAcf6L5ofDs506.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42156

    浏览量

    303135
  • 开发板
    +关注

    关注

    26

    文章

    6524

    浏览量

    121396
  • orange pi
    +关注

    关注

    0

    文章

    45

    浏览量

    3167
  • DeepSeek
    +关注

    关注

    2

    文章

    862

    浏览量

    3482
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度腾讯抢滩布局!DeepSeek-R1升级和开源背后,国产AI的逆袭之路

    电子发烧友网报道(文/李弯弯)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,当前版本为DeepSeek-R1-0528。次日,
    的头像 发表于 06-03 06:34 6476次阅读

    瑞芯微(EASY EAI)RV1126B AI模型部署

    1.AI模型部署DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型
    的头像 发表于 05-14 17:17 595次阅读
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>AI</b><b class='flag-5'>模型</b>部署

    瑞芯微(EASY EAI)RV1126B AI模型转换

    1.AI模型转换本章主要说明如何实现HuggingFace格式的大语言模型(LargeLanguageModel,LLM)如何转换为RKLLM模型,目前支持的
    的头像 发表于 05-13 16:58 357次阅读
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>AI</b><b class='flag-5'>模型</b>转换

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    /697f13887c1d88441d911697.html)。 实测数据如下 : 平台 :OrangePi AI Station (Ascend 310P RC模式) 推理耗时 :约 200ms (端到端,包含图像渲染和
    发表于 03-10 14:19

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    2 TOPS 融合算力 :在端侧轻量模型(如MobileNet、DeepSeek-R1蒸馏版)上可流畅运行 框架支持 :官方宣称兼容主流AI
    发表于 03-03 20:19

    模型 ai coding 比较

    框架:llm-coding-bench v1.0 统一代码执行超时:10秒 统一随机种子:42 统一裁判模型DeepSeek-Chat(第三方交叉验证) ? 综合评分公式: scss 体验AI代码
    发表于 02-19 13:43

    DeepSeek R1 MTP在TensorRT-LLM中的实现与优化

    。我们在之前的博客[1] 中介绍了 DeepSeek-R1 模型实现超低推理延迟的关键优化措施。本文将深入探讨 TensorRT-LLM 中的 MTP 实现与优化。
    的头像 发表于 08-30 15:47 4826次阅读
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的实现与优化

    速看!EASY-EAI教你离线部署Deepseek R1模型

    1.Deepseek简介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型
    的头像 发表于 07-25 15:22 1657次阅读
    速看!EASY-EAI教你离线部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    实现三重超越;而对开源生态、技术趋势的前瞻探讨,则印证了DeepSeek“用开源击穿技术壁垒”的初心。 当DeepSeek-R1以60TPS的生成速度刷新认知,当蒸馏模型让尖端
    发表于 07-17 11:59

    信而泰×DeepSeekAI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI模型。其核心优势
    发表于 07-16 15:29

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 1504次阅读
    Arm Neoverse N2平台实现<b class='flag-5'>DeepSeek-R1</b>满血版部署

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 个 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景中的性能纪录:在 GTC 2025
    的头像 发表于 07-02 19:31 3753次阅读
    NVIDIA Blackwell GPU优化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延迟场景中的性能纪录

    超低延时重构AI推理体验!白山云发布“大模型API”产品

    白山云科技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全
    的头像 发表于 07-02 17:26 1335次阅读
    超低延时重构<b class='flag-5'>AI</b>推理体验!白山云发布“大<b class='flag-5'>模型</b>API”产品

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    的基础。对 DeepSeek-R1-Zero 的组相对策略优化**(GRPO)算法、奖励模型**等关键技术的深入剖析,可以帮助读者了解 DeepSeek 在强化学习领域的创新性探索。对Deep
    发表于 06-09 14:38

    成本狂降90%!国产芯片+开源模型如何改写AI玩具规则

    成本实现更人性化的体验。这种技术迭代不仅重塑了玩具的定义,更悄然重构着人与机器的关系图谱。   轻量级模型的出现,本质上是将云端大模型的智慧浓缩至终端设备的过程。以DeepSeek-R1为代表的技术路径,通过知识
    的头像 发表于 05-29 00:52 4224次阅读