0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在英特尔哪吒开发套件上部署DeepSeek-R1的实现方式

英特尔物联网 来源:英特尔物联网 2025-03-12 13:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01本地部署 DeepSeek 的必要性

随着人工智能技术的快速发展,企业对 AI 模型的部署方式有了更多选择。本地部署 DeepSeek-R1 模型具有以下显著优势,使其成为许多企业和开发者的首选:

1. 数据隐私与安全

在本地环境中部署 DeepSeek-R1 模型,可以确保敏感数据完全隔离于外部网络,避免数据泄露的风险。这对于处理涉及商业机密、个人隐私或受监管数据的应用场景至关重要。

2. 定制化能力

本地部署允许企业根据自身业务需求对模型进行微调和优化。例如,通过领域知识微调,DeepSeek-R1 可以更好地适应特定行业的应用场景,从而提升模型的准确性和实用性。

3. 低延迟响应

本地部署减少了对云端服务的依赖,避免了网络传输带来的延迟。DeepSeek-R1 在本地环境中能够实现毫秒级的推理速度,这对于需要实时响应的应用(如智能客服、自动化流程等)尤为重要。

4. 成本可控

与依赖云端 API 调用相比,本地部署可以显著降低长期使用成本。例如,通过优化硬件配置和资源利用,DeepSeek-R1 的部署成本可以大幅降低,同时避免了按调用次数计费的高昂费用。

02在边缘终端部署本地大模型的好处

边缘终端,如树莓派英特尔哪吒开发套件,通常具有较低的功耗和成本,同时具备一定的计算能力。在这些设备上部署 DeepSeek-R1 大模型,可以带来以下好处:

1. 降低云端依赖
边缘终端的本地化部署减少了对云端服务的依赖,使得设备能够在离线或网络不稳定的情况下独立运行。这对于一些需要在偏远地区或网络受限环境中使用的场景(如智能家居、工业物联网等)非常有价值。

2. 应用场景拓展
在边缘终端部署 DeepSeek-R1 可以推动 AI 技术在更多领域的应用,如教育、开发实验、智能家居等。这不仅降低了 AI 技术的使用门槛,还促进了技术的普及。

3. 隐私保护

由于数据处理完全在本地完成,边缘终端部署可以有效避免敏感信息的外泄,尤其适合对隐私有高要求的场景。

03在树莓派上部署 DeepSeek-R1 的实现方式

目前网上看到的在树莓派上部署大模型的主流实现方式是通过Ollama。

Ollama 是一个轻量级的 AI 模型部署工具,支持在树莓派等低功耗设备上运行 DeepSeek-R1 模型。用户可以通过简单的命令行操作下载并启动模型,例如运行 `ollama run deepseek-r1:1.5b` 来部署 1.5B 版本。它具有部署简单和资源占用低的优势,Ollama 提供了简洁的命令行操作界面,降低了部署的技术门槛。1.5B 版本的 DeepSeek-R1 模型对硬件资源的需求较低,适合树莓派等低配设备。

但也存在一些劣势,比如:

性能限制:树莓派的硬件性能有限,推理速度较慢,可能无法满足实时性要求较高的应用。

内存瓶颈:运行较大模型(如 8B 版本)时,树莓派可能面临内存不足的问题。

功能受限:部分高级功能可能因硬件限制无法充分发挥,例如复杂的多任务处理。

04在英特尔哪吒开发套件上部署 DeepSeek-R1 的实现方式

目前暂未看到有在英特尔哪吒开发套件上部署 DeepSeek-R1 的介绍。为填补这一空白,本文介绍如何采用 WasmEdge 本地部署 DeepSeek-R1 的方式。

537acacc-fb35-11ef-9310-92fbcf53809c.png

英特尔哪吒开发套件搭载了英特尔N97处理器(3.6GHz),配备64GB eMMC存储和8GB LPDDR5内存。英特尔N97处理器属于 Intel Alder Lake-N 系列,采用仅 E-Core 的设计,专为轻量级办公、教育设备和超低功耗笔记本电脑设计,成本和功耗更低,更适合嵌入式设备。

更关键的是!英特尔哪吒最大的优势就是自带集成显卡,Intel UHD Graphics,我们可以在iGPU上运行大模型。

WasmEdge 是一种高性能的 WebAssembly 运行时,适用于在边缘设备上部署轻量级应用。WasmEdge 提供了良好的跨平台支持,能够在多种硬件平台上运行,包括树莓派和 Intel 哪吒开发套件。这使得开发者可以使用同一套部署方案适配不同的硬件环境,降低了开发成本。

WasmEdge 本身轻量级,启动速度快,适合资源受限的边缘设备。通过 WebAssembly 的高效执行机制,可以显著提升模型的推理速度,优化资源利用率。


WebAssembly 的设计使得模型能够在边缘设备上以接近原生的速度运行。此外,WasmEdge 还支持多线程和并行计算,进一步提升了推理效率。

05具体部署方案

1、下载依赖

apt update && apt install -y libopenblas-dev

2、克隆 WasmEdge 仓库

git clone https://github.com/WasmEdge/WasmEdge.git

3、源码编译

cmake -GNinja -Bbuild -DCMAKE_BUILD_TYPE=Release 
 -DWASMEDGE_PLUGIN_WASI_NN_BACKEND="GGML" 
 -DWASMEDGE_PLUGIN_WASI_NN_GGML_LLAMA_BLAS=OFF 
 -DCMAKE_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu 

4、执行编译后的文件

cmake --build build

5、安装

cd build
sudo cmake --install . --prefix /home/hans/WasmEdge

6、运行模型

选用的是8B的DeepSeek- R1蒸馏模型(量化后3G大小),一般看到树莓派上只能跑1.5B的DS蒸馏模型。

53a4dea2-fb35-11ef-9310-92fbcf53809c.jpg

运行命令

wasmedge --dir .:. --nn-preload defaultAUTO:/home/DeepSeek-R1-Distill-Llama-8B.gguf llama-chat.wasm -p llama-3-chat

7、运行效果

53c61194-fb35-11ef-9310-92fbcf53809c.jpg

53c61194-fb35-11ef-9310-92fbcf53809c.jpg

总结

在探索了 DeepSeek-R1 的本地部署之旅后,我们不禁感叹:AI 的世界正变得越来越触手可及!从企业对数据隐私的严守,到边缘设备上的高效推理,再到英特尔哪吒开发套件上的灵活部署,DeepSeek-R1 正在以一种前所未有的方式,将智能的力量带到每一个角落。

而当我们站在技术的十字路口,回望这一路的探索,或许会发现,真正的魔法并非来自模型本身,而是我们对技术的掌控和创新。

最后,让我们以 DeepSeek-R1 的智慧之光,照亮未来的每一步。正如那句诗所言:“智能入世万象新,笑与人间共潮生。”在这个充满无限可能的时代,Intel 哪吒开发套件不仅仅是一个开发板,它是我们通往智能未来的钥匙。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179303
  • 开发板
    +关注

    关注

    25

    文章

    6122

    浏览量

    113325
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
  • DeepSeek
    +关注

    关注

    2

    文章

    824

    浏览量

    2812

原文标题:开发者实战|DeepSeek在英特尔哪吒开发板部署大模型实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek-R1实现自动生成Manim动画

    ​ 作者:算力魔方创始人/英特尔创新大使刘力 前面我们分享了本地运行能与OpenAI-o1 能力相媲美的DeepSeek-R1 模型。本文将介绍如何使用
    的头像 发表于 02-07 12:31 4646次阅读
    用<b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>实现</b>自动生成Manim动画

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑
    的头像 发表于 03-12 13:45 2031次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek-R1</b>蒸馏模型

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 更适合聊天机器人、内容创作、多语言翻译、基础数据分析等通用需求。 DeepSeek-R1 聚焦科研辅助、数学教育、金融建模、代码审查等需强逻辑推理的场景,尤其需要分步推导(如数
    发表于 02-14 02:08

    添越智创基于 RK3588 开发部署测试 DeepSeek 模型全攻略

    ,Gemma 和其他多种模型,安装Ollama工具之后,使用以下命令即可一键部署15亿参数的deepseek-r1模型,运行之后如下图所示: ollama run deepseek-r1
    发表于 02-14 17:42

    RK3588开发上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效
    发表于 02-27 16:45

    英特尔82801HM IO控制器开发套件

    英特尔 82801HM I/O 控制器开发套件英特尔 凌动 处理器系列包括板载处理器,该处理器采用 45 纳米制程技术的集成优化图形和内存控制器,与上一代英特尔 凌动 处理器 N2
    发表于 12-07 14:05 29次下载
    <b class='flag-5'>英特尔</b>82801HM IO控制器<b class='flag-5'>开发套件</b>

    英特尔BOOT Loader开发套件-高级嵌入式开发基础

    从技术角度概括介绍用于快速开发部署启动加载器的英特尔 Boot Loader 开发套件(英特尔 BLDK),该
    发表于 12-07 14:57 59次下载
    <b class='flag-5'>英特尔</b>BOOT Loader<b class='flag-5'>开发套件</b>-高级嵌入式<b class='flag-5'>开发</b>基础

    英特尔的945GME高速芯片组开发套件

    英特尔的945GME高速芯片组开发套件
    发表于 10-30 11:57 3次下载

    使用英特尔物联网商业开发套件改变世界

    使用英特尔®物联网商业开发套件改变世界。
    的头像 发表于 05-31 10:06 2428次阅读

    基于OpenVINO英特尔开发套件实现眼部追踪

    本文将以训练一个眼部追踪 AI 小模型为背景,介绍从 Pytorch 自定义网络模型,到使用 OpenVINO NNCF 量化工具优化模型,并部署英特尔开发套件爱克斯开发板 AIx
    的头像 发表于 09-18 10:11 1261次阅读

    【转载】英特尔开发套件哪吒”快速部署YoloV8 on Java | 开发者实战

    OpenVINO 工具套件基于OneAPI开发,可以加快高性能计算机视觉和深度学习应用开发速度的工具套件,适用于从边缘到云的各种英特尔计算平
    的头像 发表于 03-23 08:05 1487次阅读
    【转载】<b class='flag-5'>英特尔</b><b class='flag-5'>开发套件</b>“<b class='flag-5'>哪吒</b>”快速<b class='flag-5'>部署</b>YoloV8 on Java | <b class='flag-5'>开发</b>者实战

    英特尔开发套件哪吒Java环境实现ADAS道路识别演示 | 开发者实战

    本文使用来自OpenModelZoo的预训练的road-segmentation-adas-0001模型。ADAS代表高级驾驶辅助服务。该模型识别四个类别:背景、道路、路缘和标记。硬件环境此文使用了英特尔开发套件家族里的『哪吒
    的头像 发表于 04-29 08:07 1400次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>开发套件</b>『<b class='flag-5'>哪吒</b>』<b class='flag-5'>在</b>Java环境<b class='flag-5'>实现</b>ADAS道路识别演示 | <b class='flag-5'>开发</b>者实战

    使用英特尔哪吒开发套件部署YOLOv5完成透明物体目标检测

    英特尔哪吒(Nezha)开发套件是一款专为边缘AI和物联网应用设计的高性能计算平台,搭载了英特尔 N97处理器、内置英特尔 UHD Gra
    的头像 发表于 11-25 17:15 1085次阅读
    使用<b class='flag-5'>英特尔</b><b class='flag-5'>哪吒</b><b class='flag-5'>开发套件</b><b class='flag-5'>部署</b>YOLOv5完成透明物体目标检测

    行芯完成DeepSeek-R1大模型本地化部署

    近日,行芯正式宣布完成 DeepSeek-R1 大模型本地化部署实现在多场景、多产品中应用。解锁“芯”玩法,开启“芯”未来!
    的头像 发表于 02-24 15:17 1143次阅读

    DeepSeek-R1:别被它的光环迷了眼,这些能力局限你得知道!

    作者:算力魔方创始人/英特尔创新大使刘力 最近,DeepSeek-R1 可是火遍了全网,号称“超越人类专家”,数学竞赛夺冠、代码能力碾压人类开发者……听起来是不是很厉害?但别急着被这些光环迷了眼
    的头像 发表于 03-11 17:19 770次阅读
    <b class='flag-5'>DeepSeek-R1</b>:别被它的光环迷了眼,这些能力局限你得知道!