0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

实战案例 | 眺望RK3588 RKLLM部署DeepSeek-R1全流程

眺望电子 2025-02-12 08:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


前言:

在RK3588上部署Deepseek有两种方法,分别是使用Ollama工具部署和使用瑞芯微官方的 RKLLM量化部署。Ollama 是一个开源的大模型服务工具,调用的是CPU进行的运算,如果要将RK3588强悍的NPU性能发挥出来,可以重点了解一下RKLLM量化部署。

一、RKLLM介绍

为了使用RK NPU,用户需要先在计算机上安装RKLLM-Toolkit工具。RKLLM-Toolkit 是为用户提供在计算机上进行大语言模型的量化、转换的开发套件。通过该 工具提供的接口可以便捷地完成模型转换和模型量化。

b42466e0-e8d8-11ef-9434-92fbcf53809c.png

RKLLM的整体开发步骤主要分为:模型转换和板端部署运行。

模型转换是使用RKLLM-Toolkit将预训练的大语言模型转换为RKLLM格式。

板端部署运行是调用RKLLM Runtime库加载RKLLM模型到Rockchip NPU平台,然后进行推理等操作。


二、DeepSeek-R1介绍

`DeepSeek-R1是深度求索(DeepSeek)公司推出的开源多模态大语言模型,专为长上下文理解和多模态交互优化。DeepSeek-R1基于开源模型进行了微调,提供了1.5B、7B等参数版本的DeepSeek-R1-Distill模型,适合部署到边缘设备。


b42fade8-e8d8-11ef-9434-92fbcf53809c.png

三、部署过程

3.1获取模型

从 deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B 获取模型文件;

# 获取DeepSeek-R1-Distill-Qwen-1.5Bgitclonehttps://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B


3.2安装转换工具

在Ubuntu虚拟机安装RKLLM-Toolkit,以便将DeepSeek-R1大语言模型转换为RKLLM模型格式和编译板端推理的可执行程序,具体RKLLM-Toolkit环境安装步骤不在此详述;

3.3安装转换工具

使用RKLLM-Toolkit对模型进行转换。运行模型转换脚本;

cd rknn-llm/examples/rkllm_api_demo/bash build-linux.sh

生成的可执行文件在:

build/build_linux_aarch64_Release/llm_demo

3.4板端部署

将转换成功后的 DeepSeek-R1-Distill-Qwen-1.5B.rkllm 模型与编译后的二进制文件 llm_demo 复制到板端,并导入环境变量

exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:rknn-llm/rkllm-runtime/Linux/librkllm_api/aarch64

3.5运行测试

运行 llm_demo

./demo_Linux_aarch64/llm_demo./Deepseek-R1-Disti11-Qwen-1.5B.rkllm1000010000

b439e5b0-e8d8-11ef-9434-92fbcf53809c.png

四、测试效果

4.1环境说明

b4452d58-e8d8-11ef-9434-92fbcf53809c.png

使用眺望电子EVM-RK3588开发套件,搭载8GB内存配置,板载运行Ubuntu20.04系统。通过SSH登入主板运行模型,Debug调试口用于监测运行器件资源消耗。

b45691a6-e8d8-11ef-9434-92fbcf53809c.png

b461901a-e8d8-11ef-9434-92fbcf53809c.png

4.2推理过程

Connecting to 192.168.0.37:22...Connection established.To escape to local shell, press 'Ctrl+Alt+]'.WARNING! The remote SSH server rejected X11 forwarding request._____ _ |_ _| __ _ | | ___ __ __ ___| | / _` | | | / _ \ \ \ /\ / / / _ \| | | (_| | | | | (_) | \ V V / | __/|_| \__,_| |_| \___/ \_/\_/ \___|
Welcome to Ubuntu 20.04.6 LTS (GNU/Linux 6.1.84 aarch64)* Documentation: https://help.ubuntu.com* Management: https://landscape.canonical.com* Support: https://ubuntu.com/proLast login: Tue Feb 11 1425 2025-bash: /opt/ros/noetic/setup.bash: No such file or directory-bash: /opt/ros/noetic/setup.bash: No such file or directoryroot@talowe-rk3588:~#root@talowe-rk3588:~# lsDeepseek-R1-Disti11-Qwen-1.5B.rkllm demo_Linux_aarch64root@talowe-rk3588:~# ./demo_Linux_aarch64/llm_demo ./Deepseek-R1-Disti11-Qwen-1.5B.rkllm 10000 10000rkllm init startI rkllm: rkllm-runtime version: 1.1.4, rknpu driver version: 0.9.8, platform: RK3588rkllm init success**********************可输入以下问题对应序号获取回答/或自定义输入********************[0] 现有一笼子,里面有鸡和兔子若干只,数一数,共有头14个,腿38条,求鸡和兔子各有多少只?[1] 有28位小朋友排成一行,从左边开始数第10位是学豆,从右边开始数他是第几位?*************************************************************************user: 0现有一笼子,里面有鸡和兔子若干只,数一数,共有头14个,腿38条,求鸡和兔子各有多少只?robot: 首先,设鸡的数量为x只,兔子的数量为y只。根据题意,我们知道每只鸡有1个头和2条腿,每只兔子也有1个头但有4条腿。因此,总共有14个头,可以列出方程:x + y = 14同时,总腿数是38条,所以:2x + 4y = 38接下来,可以通过解这个方程组来找到x和y的值。首先,从第一个方程中解出x:x = 14 - y然后将x代入第二个方程:2(14 - y) + 4y = 38展开并简化:28 - 2y + 4y = 38合并同类项:2y = 10解得:y = 5最后,代入x = 14 - y:x = 14 - 5 = 9因此,鸡有9只,兔子有5只。think>要解决这个问题,我们可以设鸡的数量为 \( x \) 只,兔子的数量为 \( y \) 只。根据题意,我们知道:- 每只鸡和兔子都有1个头,所以总共有14个头,可以列出方程:\[x + y = 14\]- 鸡有2条腿,兔子有4条腿,总腿数为38条,可以列出另一个方程:\[2x + 4y = 38\]接下来,我们可以通过解这个方程组来找到 \( x \) 和 \( y \) 的值。**步骤一:从第一个方程中解出 \( x \)**\[x = 14 - y\]**步骤二:将 \( x \) 代入第二个方程**\[2(14 - y) + 4y = 38\]展开并简化:\[28 - 2y + 4y = 38 \\2y = 10 \\y = 5\]**步骤三:代入 \( y \) 的值求出 \( x \)**\[x = 14 - 5 = 9\]因此,鸡有 \(\boxed{9}\) 只,兔子有 \(\boxed{5}\) 只。

4.3资源消耗

DeepSeek-R1模型输出的回答结果清晰流畅,内存资源占用797MB,NPU负载约为64%,在无风扇环境下,温升约10℃。

b46f8300-e8d8-11ef-9434-92fbcf53809c.png

总而言之,DeepSeek-R1模型的强力有目共睹,同时也验证了眺望电子对RK3588系列处理器的深度优化与强大可靠。如果您对部署过程感兴趣,欢迎随时与我们联系,我们可以为您提供专业的技术支持,期待与您合作!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • RK3588
    +关注

    关注

    8

    文章

    493

    浏览量

    7062
  • LLM
    LLM
    +关注

    关注

    1

    文章

    340

    浏览量

    1257
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2817
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek到Qwen,AI大模型的移植与交互实战指南-飞凌嵌入式

    在不久前发布的《技术实战|OK3588-C开发板上部署DeepSeek-R1大模型的完整指南》一文中,小编为大家介绍了DeepSeek-R1
    的头像 发表于 03-28 08:06 2528次阅读
    从<b class='flag-5'>DeepSeek</b>到Qwen,AI大模型的移植与交互<b class='flag-5'>实战</b>指南-飞凌嵌入式

    【幸狐Omni3576边缘计算套件试用体验】DeepSeek 部署及测试

    /DeepSeek-R1-Distill-Qwen-1.5B_Demo/Readme.md 文档)即可实现 DeepSeek 部署。 这里使用瑞芯微转换好的 rkllm 进行推演。 仓
    发表于 03-21 19:31

    实战案例 | 299元国产工业级AI核心板部署DeepSeek-R1

    前言:在AIoT领域,搭载Ubuntu系统的眺望T527开发板,仅凭2GB内存便成功运行15亿参数的DeepSeek-R1轻量级大模型!在边缘端上演一场算力革命,这一突破性进展不仅刷新了边缘AI设备
    的头像 发表于 03-06 08:30 1201次阅读
    <b class='flag-5'>实战</b>案例 | 299元国产工业级AI核心板<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    扩展规划、嵌入式适配等技术维度的突破。 RK3588作为瑞芯微推出的旗舰级芯片,凭借多核异构计算能力以及强大的CPU、GPU和NPU性能,成为嵌入式AI应用的理想平台。DeepSeek-R1
    发表于 02-27 16:45

    米尔RK3576开发板评测】+ RKLLM-Toolkit 环境安装

    模型,在安装Ollama工具之后,使用以下命令即可一键部署15亿参数的deepseek-r1模型,ollama其实就是AI届的Docker,所以使用起来也非常方便。 5.2、自动安装 同样受网络音响
    发表于 02-22 09:41

    案例分享 ▏【瑞芯微RK3588】HZHY-AI300G智能盒部署DeepSeek-R1模型实战指南

    地和我们交流,我们可以在HZHY-AI300G智能盒上部署DeepSeek-R1模型。接下来,我们将一步步带你完成DeepSeek-R1模型的部署,这一过程不仅能
    的头像 发表于 02-21 18:25 2551次阅读
    案例分享 ▏【瑞芯微<b class='flag-5'>RK3588</b>】HZHY-AI300G智能盒<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>模型<b class='flag-5'>实战</b>指南

    飞凌RK3588开发板上部署DeepSeek-R1大模型的完整指南(一)

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态扩展规划、嵌入式适配等技术维度的突破。
    的头像 发表于 02-21 14:55 2990次阅读
    飞凌<b class='flag-5'>RK3588</b>开发板上<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>大模型的完整指南(一)

    Banana Pi开源社区基于瑞芯微RK3588开发板,DeepSeek开发利器

    Banana Pi开源社区基于瑞芯微RK3588开发板,DeepSeek开发利器
    的头像 发表于 02-19 18:25 3225次阅读
    Banana Pi开源社区基于瑞芯微<b class='flag-5'>RK3588</b>开发板,<b class='flag-5'>DeepSeek</b>开发利器

    香橙派发布OrangePi 5Plus本地部署Deepseek-R1蒸馏模型指南

    派官方发布OrangePi5Plus运行Deepseek-R1蒸馏模型实操指南,赶紧收藏起来吧!OrangePi5Plus采用了瑞芯微RK3588八核64位处理器
    的头像 发表于 02-19 16:14 1586次阅读
    香橙派发布OrangePi 5Plus本地<b class='flag-5'>部署</b><b class='flag-5'>Deepseek-R1</b>蒸馏模型指南

    分享 |迅为基于RK3588开发板部署测试DeepSeek模型

    分享 |迅为基于RK3588开发板部署测试DeepSeek模型
    的头像 发表于 02-18 14:26 2078次阅读
    分享 |迅为基于<b class='flag-5'>RK3588</b>开发板<b class='flag-5'>部署</b>测试<b class='flag-5'>DeepSeek</b>模型

    宇芯基于T527成功部署DeepSeek-R1

    近日,宇芯成功在志T527 Linux系统上本地部署并运行了DeepSeek-R1 1.5B模型。
    的头像 发表于 02-15 09:06 1633次阅读
    宇芯基于T527成功<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    DeepSeek 模型的部署与测试,开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板:AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造,其硬
    发表于 02-14 17:42

    ATK-DLRK3588开发板deepseek-r1-1.5b/7b部署指南

    _demo rkllm_model/deepseek-1.5b-w8a8-rk3588.rkllm 5000 5000 运行deepseek-R1-7b程序 ./atk_deepseek
    发表于 02-14 16:33

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实质性
    发表于 02-14 02:08

    RK3588开发板上部署并测试DeepSeek模型

    DeepSeek免费向全球开发者开放,加速了AI技术普及。   RK3588性能优势 RK3588作为一款高性能AI芯片,采用了8nm LP 制程,搭载八核处理器,四核GPU以及6TOPS算力的NPU,依靠
    的头像 发表于 02-09 09:36 3229次阅读
    在<b class='flag-5'>RK3588</b>开发板上<b class='flag-5'>部署</b>并测试<b class='flag-5'>DeepSeek</b>模型