0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在ZYNQ本地部署DeepSeek模型

FPGA技术江湖 来源:OpenFPGA 2025-12-19 15:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

以下文章来源于OpenFPGA,作者碎碎思

一个将最小号 DeepSeek 模型部署到 AMD Zynq UltraScale+ MPSoC 处理系统的项目。

ccb047e2-da13-11f0-8c8f-92fbcf53809c.png

1. 引言

如果你过去几年没注意人工智能的大趋势,那么你可能不知道大型语言模型(LLM)已在 AI 领域占据重要地位。

这些模型能够理解人类的文本查询,并生成文本回应。之所以称“大模型”,是因为它们通常在大量网页、书籍、对话、代码等数据上训练。

其本质并非“真正的智能”,而是深度学习模型——基于复杂数学运算(如线性代数、优化算法)实现的预测机制。

常见的做法是:若希望获得良好性能,通常依赖高性能的 GPU(例如 AMD Instinct GPU)进行推理。

但在某些应用场景,我们可能希望将 LLM 部署在 边缘设备(edge device) 本地执行。出于这个目的,本项目将在 ZUBoard(含 Arm Cortex-A53 内核的 Zynq UltraScale+ MPSoC)上运行一个较小的 DeepSeek 模型。

部署在边缘设备的优势包括:

隐私:模型在本地运行,无需上传数据到云端。

离线访问:不依赖宽带或云服务。

成本:节省托管云推理的费用。

但工程中必须在 隐私、成本、性能之间做权衡。

2. 什么是 DeepSeek

如果你还不熟悉 DeepSeek:这是一系列高性能的开放权重 LLM 和大规模多模态模型(LMM),用于推动开放 AI 研究。

这些模型从零开始训练,使用了数万亿 tokens 的多语言网页、学术文献、代码库及精编数据集。

架构上基于 Transformer,并加入了诸如:Grouped Query Attention (GQA)、SwiGLU 激活函数、多查询注意力层,以提升推理效率。

模型尺寸可选范围:1.5B、7B、13B 参数及以上,以便在资源使用与准确度之间平衡。

DeepSeek-VL(视觉-语言版本)扩展支持图像数据与文本监督,能够进行跨模态推理、视觉问答、图片-文本生成。

其还提供量化版本(4 bit、8 bit)以适配边缘设备与移动部署。

在多个基准上(如 MMLU、GSM8K、HumanEval、MMMU)表现出接近或达到最先进水平,同时优化 CPU/GPU 推理效率。

3. 在 Zynq UltraScale+ MPSoC 上开始

项目使用 PYNQ 平台作为 DeepSeek 安装基础。

步骤如下:

从 PYNQ 官网下载适用于 Avnet ZUBoard 的镜像,并将镜像烧录至 SD 卡。

cd191a4c-da13-11f0-8c8f-92fbcf53809c.png

将板上的启动开关设为 SD 卡启动,插入 SD 卡,并通过 USB UART以太网将 ZUBoard 连接至主机。

cd7b3c22-da13-11f0-8c8f-92fbcf53809c.jpg

启动后使用浏览器访问 http://pynq:9090,密码通常为 xilinx。

cddaba08-da13-11f0-8c8f-92fbcf53809c.png

打开终端,准备安装 DeepSeek 模型。

ce2eddcc-da13-11f0-8c8f-92fbcf53809c.png

4. 准备工作

由于 ZUBoard 仅配备 1 GB 的 LPDDR4 内存,需在 SD 卡上建立足够的交换(swap)空间,以防止内存耗尽导致系统崩溃。

具体命令示例:

swapon --show 
sudo swapoff /var/swap 
sudo rm /var/swap 
sudo chmod 600 /var/swap 
sudo mkswap /var/swap 
sudo swapon /var/swap

执行完成后,通过 swapon --show 可确认现在有约 4 GB 的 swap 空间。

ce890dba-da13-11f0-8c8f-92fbcf53809c.png

5. 安装 Ollama 与 DeepSeek

使用开源工具 Ollama 来运行 LLM,本项目使用 Ollama 框架。

安装命令示例:

curl -fsSL https://ollama.com/install.sh | sh

系统无 GPU,可忽略相应警告。

cee699c6-da13-11f0-8c8f-92fbcf53809c.png

在安装成功后,下载 DeepSeek 1.5B 参数版本。示例命令:

mkdir deepseek 
exportHOME=/home/xilinx/deepseek 
ollama pull deepseek-r1:1.5b

cf45bf5a-da13-11f0-8c8f-92fbcf53809c.png

6. 测试

在 ZUBoard 上运行模型示例命令:

ollama run deepseek-r1:1.5b

系统将显示提示符,等待你的输入。

cf99c51e-da13-11f0-8c8f-92fbcf53809c.png

我做的第一件事就是询问它关于模型的问题。

cff32190-da13-11f0-8c8f-92fbcf53809c.png

模型信息如下图所示。

d04c1b6a-da13-11f0-8c8f-92fbcf53809c.png

然后,像操作普通 LLM 一样与该模型进行交互。

d0a93a84-da13-11f0-8c8f-92fbcf53809c.png

可在另一个终端运行 top 命令来观察系统资源消耗。

d0fd8300-da13-11f0-8c8f-92fbcf53809c.png

需要注意:

参数较少(1.5B)意味着推理能力有限。

使用 swap 空间意味着性能会受到影响。

7. 总结

该项目展示了:即便没有 GPU,也能在边缘设备(如 ZYNQ)上部署 LLM。尽管性能受限,但具备“本地离线自动推理”的能力,在特定应用场景中极具价值。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5727

    浏览量

    140698
  • 模型
    +关注

    关注

    1

    文章

    3882

    浏览量

    52374
  • Zynq
    +关注

    关注

    10

    文章

    636

    浏览量

    49663
  • DeepSeek
    +关注

    关注

    2

    文章

    862

    浏览量

    3499

原文标题:边缘 AI 新玩法:在 ZYNQ 本地部署 DeepSeek 模型

文章出处:【微信号:HXSLH1010101010,微信公众号:FPGA技术江湖】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ElfBoard技术实战|ELF 2开发板本地部署DeepSeek模型的完整指南

    ELF 2开发板本地部署DeepSeek模型的完整指南
    的头像 发表于 05-16 11:13 2872次阅读
    ElfBoard技术实战|ELF 2开发板<b class='flag-5'>本地</b><b class='flag-5'>部署</b><b class='flag-5'>DeepSeek</b>大<b class='flag-5'>模型</b>的完整指南

    本地部署openWebUI + ollama+DeepSeek 打造智能知识库并实现远程访问

    DeepSeek 作为一个开源的大语言模型,我们可以通过 ZeroNews + openWebUI + ollama的方式,轻松的在本地私有化部署
    的头像 发表于 09-10 16:41 5614次阅读
    <b class='flag-5'>本地</b><b class='flag-5'>部署</b>openWebUI + ollama+<b class='flag-5'>DeepSeek</b> 打造智能知识库并实现远程访问

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    DeepSeek 模型部署与测试,开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板:AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造,其硬件配置堪称豪华,在 AI
    发表于 02-14 17:42

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态
    发表于 02-27 16:45

    【幸狐Omni3576边缘计算套件试用体验】DeepSeek 部署及测试

    【幸狐 Omni3576 边缘计算套件测评】DeepSeek 部署及测试 本文介绍了幸狐 Omni3576 边缘计算套件实现 DeepSeek 部署及测试的相关流程,包括
    发表于 03-21 19:31

    DeepSeek-R1本地部署指南,开启你的AI探索之旅

    春节期间突然被DeepSeek刷屏了,这热度是真大,到处都是新闻和本地部署的教程,等热度过了过,简单记录下自己本地部署及相关的内容,就当电子
    的头像 发表于 02-08 10:30 9342次阅读
    <b class='flag-5'>DeepSeek</b>-R1<b class='flag-5'>本地</b><b class='flag-5'>部署</b>指南,开启你的AI探索之旅

    DeepSeek本地部署硬件配置推荐

    近日,关于 DeepSeek 的话题如同一场风暴,席卷了整个大语言模型领域。
    的头像 发表于 02-11 10:54 4497次阅读
    <b class='flag-5'>DeepSeek</b><b class='flag-5'>本地</b><b class='flag-5'>部署</b>硬件配置推荐

    何在MATLAB中使用DeepSeek模型

    DeepSeek-R1(https://github.com/deepseek-ai/DeepSeek-R1) AI 模型横空出世后,人们几乎就立马开始询问如
    的头像 发表于 02-13 09:20 4885次阅读
    如<b class='flag-5'>何在</b>MATLAB中使用<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b>

    DeepSeek R1模型本地部署与产品接入实操

    针对VS680/SL1680系列大算力芯片,我们的研发团队正在研究将蒸馏后的轻量级DeepSeek模型DeepSeek-R1-Distill-Qwen-1.5B)部署到SOC
    的头像 发表于 04-19 16:32 927次阅读
    <b class='flag-5'>DeepSeek</b> R1<b class='flag-5'>模型</b><b class='flag-5'>本地</b><b class='flag-5'>部署</b>与产品接入实操

    华为云发布DeepSeek本地部署方案

    华为云正式推出基于华为云Stack混合云的DeepSeek本地部署方案。
    的头像 发表于 02-18 10:05 1856次阅读

    曙光顺利完成DeepSeek模型本地化多点私有部署

    计算中心等政务云服务商,依托本地政务云资源池,顺利完成DeepSeek模型本地化多点私有部署,并打造出数字人“抚小智”。抚州市还计划将
    的头像 发表于 02-22 14:16 1548次阅读

    行芯完成DeepSeek-R1大模型本地部署

    近日,行芯正式宣布完成 DeepSeek-R1 大模型本地部署,实现在多场景、多产品中应用。解锁“芯”玩法,开启“芯”未来!
    的头像 发表于 02-24 15:17 1489次阅读

    博实结完成DeepSeek模型本地部署

    近日,公司完成DeepSeek R1 671B大模型本地部署。通过构建自主可控的AI基础设施,公司同步实现研发智能升级、研发成本重构、数据安全闭环与应用场景突破,为产业智能化赋能。
    的头像 发表于 03-19 16:31 1529次阅读

    ORinNano离线部署Deepseek R1大模型教程

    ORinNano离线部署Deepseek R1大模型教程
    的头像 发表于 04-10 15:32 1643次阅读
    ORinNano离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> R1大<b class='flag-5'>模型</b>教程

    DeepSeek模型何在云服务器上部署

    随着大型语言模型(LLM)的应用日益普及,许多开发者和企业希望将像DeepSeek这样的优秀模型部署到自己的云服务器上,以实现私有化、定制化服务并保障数据安全。本文将详细阐述
    的头像 发表于 10-13 16:52 1257次阅读