0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在FPGA部署AI模型

FPGA研究院 来源:OpenFPGA 2025-09-24 10:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如果你已经在用 MATLAB深度学习,那一定知道它的训练和仿真体验非常丝滑。但当模型要真正落地到 FPGA 上时,往往就会卡住:怎么把网络结构和权重优雅地搬到硬件里?

这就是 MathWorks Deep Learning HDL Toolbox 出场的地方。

它能干什么?

简单来说,这个工具就是把你的神经网络“翻译”成 FPGA 能跑的电路。它提供了一个现成的 Deep Learning Processor (DLP) IP 核,能直接放到 FPGA 里跑模型推理。

22fadfdc-8f68-11f0-8c8f-92fbcf53809c.png

主要功能有:

自动生成 FPGA 工程:不需要手写 RTL,只要在 MATLAB 定义好网络结构,就能一键生成 Vivado 工程。

支持常见网络层:卷积层、全连接层、激活层等常见模块都内置好,拖上去就能用。

硬件加速 AI 推理:推理过程完全在硬件里跑,没有软件瓶颈,延迟低、确定性强。

AXI 接口对接:DLP IP 自带 AXI4-Lite/AXI4-Stream 接口,方便和其他 FPGA 逻辑或外设对接。

可定制化:支持修改网络拓扑、算子精度,还能扩展自定义层。

参考设计入门

最快捷的入门方法是先在 MATLAB 中生成参考设计,然后 MATLAB 会生成一个针对 ZCU102 评估板的 Vivado 项目。该设计可以直接在 MATLAB 中使用 JTAG 接口进行测试。

设计架构概述

该架构非常简单,只需几分钟即可运行应用程序。

尽管参考设计使用了 SoC 设备,但处理器仅负责时钟和复位信号

该过程从定义 DLP 及其接口的配置文件开始。

接下来,从 MATLAB 库中导入了一个预训练的MNIST 分类网络。通过分析它,我们可以了解待实现网络的结构。

235d00cc-8f68-11f0-8c8f-92fbcf53809c.png

定义网络后,处理器就会对其进行配置和优化。

23b9d98c-8f68-11f0-8c8f-92fbcf53809c.png24115d38-8f68-11f0-8c8f-92fbcf53809c.png246ba84c-8f68-11f0-8c8f-92fbcf53809c.png

一旦处理器得到优化,我们就可以让 MATLAB 在 Vivado 中构建深度学习 IP 设计。

24c35100-8f68-11f0-8c8f-92fbcf53809c.png

完成后就可以打开 Vivado 并探索该项目。将看到 AXI 互连、深度学习 IP 和 AXI 基础架构。

251fab44-8f68-11f0-8c8f-92fbcf53809c.png2573d67e-8f68-11f0-8c8f-92fbcf53809c.png25d1af88-8f68-11f0-8c8f-92fbcf53809c.png

构建和运行设计

优化完成后,MATLAB 即可为 Vivado 构建 DLP IP 设计。编译只需几分钟,之后 Vivado 项目将显示 AXI 互连、DLP IP 以及相关基础架构。

运行硬件示例之前,必须正确配置 Zynq 处理系统 (PS),否则将不提供时钟。这可以通过 从附加组件管理器安装适用于 Xilinx FPGA 和 SoC 设备的深度学习 HDL 工具箱支持包来完成。

262fd964-8f68-11f0-8c8f-92fbcf53809c.png268cb76a-8f68-11f0-8c8f-92fbcf53809c.png26f065e4-8f68-11f0-8c8f-92fbcf53809c.png274e8dcc-8f68-11f0-8c8f-92fbcf53809c.png

附加管理器还提供为 ZCU102 编程 SD 卡的工具,确保 PS 提供所需的时钟和复位信号。

设置完成后,打开 ZCU102 的电源,将 JTAG 连接到开发板,并从 MATLAB 下载比特流。这还会使用网络的权重和激活函数配置 FPGA 存储器。

27a63da6-8f68-11f0-8c8f-92fbcf53809c.png2805f278-8f68-11f0-8c8f-92fbcf53809c.png

测试网络

然后,加载一张简单的图像并进行推理。经过训练识别手写数字的 MNIST 网络通过 JTAG 链路返回了正确的预测。

285f4a44-8f68-11f0-8c8f-92fbcf53809c.png28b3d488-8f68-11f0-8c8f-92fbcf53809c.png

由于启用了分析功能,可以查看推理结果和性能指标。虽然这是一个简单的网络,但速度还是很快的。

小结

MathWorks Deep Learning HDL Toolbox 其实就是一条“AI 模型到 FPGA 的高速通道”

它帮你把 MATLAB 里的深度学习模型,直接翻译成可运行在 FPGA 上的硬件结构,还自带了一个成熟的 DLP 引擎,降低了从算法到部署的门槛。

一句话:如果你在 FPGA 上搞 AI,这个工具能帮你把“想法”快速变成“硬件”。

来源:本文转载自OPENFPGA公众号

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1656

    文章

    22297

    浏览量

    630455
  • matlab
    +关注

    关注

    189

    文章

    3018

    浏览量

    237638
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123921

原文标题:FPGA 上的 AI“神器”:MathWorks Deep Learning HDL Toolbox

文章出处:【微信号:FPGA研究院,微信公众号:FPGA研究院】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用CUBEAI部署tflite模型到STM32F0中,模型创建失败怎么解决?

    看到CUBE_AI已经支持到STM32F0系列芯片,就想拿来入门嵌入式AI。 生成的模型很小,是可以部署到F0上的,但是一直无法创建成功。 查阅CUBE
    发表于 03-15 08:10

    何在STM32f4系列开发板上部署STM32Cube.AI

    已下载STM32Cube.AI扩展包,但是无法使用,感觉像是没有部署AI模型,我是想要通过摄像头拍照,上传图像后,经过开发板处理器进行AI
    发表于 11-18 09:39

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    DeepSeek 模型部署与测试,开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板:AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造,其硬件配置堪称豪华,在
    发表于 02-14 17:42

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    如何将AI模型部署到嵌入式系统中

    本期我们分享主题是如何将 AI 模型部署到嵌入式系统中,下一期将介绍如何在 RT-Thread 操作系统上运行 Mnist Demo(手写数字识别)。 嵌入式关联 AIAI落地一直是一
    发表于 12-14 07:55

    介绍在STM32cubeIDE上部署AI模型的系列教程

    介绍在STM32cubeIDE上部署AI模型的系列教程,开发板型号STM32H747I-disco,值得一看。MCUAI原文链接:【嵌入式AI开发】篇四|
    发表于 12-14 09:05

    部署基于嵌入的机器学习模型

    1、如何在生产中部署基于嵌入的机器学习模型  由于最近大量的研究,机器学习模型的性能在过去几年里有了显著的提高。虽然这些改进的模型开辟了新的可能性,但是它们只有在可以
    发表于 11-02 15:09

    如何通过cube-ai扩展将机器学习模型部署到STM32H743ZIT6?

    我正在尝试通过 cube-ai 扩展将机器学习模型部署到 STM32H743ZIT6。该模型采用 .tflite 格式。当我尝试分析模型时,
    发表于 12-30 08:57

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    量化 七、Vitis AI 通过迁移学习训练自定义模型 八、Vitis AI 将自定义模型编译并部署到KV260中 铺垫 Vitis
    发表于 10-14 15:34

    何在小型集群中部署Xilinx FPGA

    Xilinx FPGA是支持OpenStack的第一个(也是目前唯一的)FPGA。 该视频快速介绍了如何在小型集群中部署Xilinx FPGA
    的头像 发表于 11-23 06:14 4224次阅读

    企业AI模型部署怎么做

    AI模型部署作为这一转型过程中的关键环节,其成功实施对于企业的长远发展至关重要。在此,AI部落小编为您介绍企业AI
    的头像 发表于 11-04 10:15 1350次阅读

    AI模型部署和管理的关系

    AI模型部署与管理是AI项目成功的两大支柱,它们之间既相互独立又紧密相连,共同推动着AI技术从实验室走向实际应用。
    的头像 发表于 11-21 10:02 1001次阅读

    企业AI模型部署攻略

    当下,越来越多的企业开始探索和实施AI模型,以提升业务效率和竞争力。然而,AI模型部署并非易事,需要企业在多个层面进行细致的规划和准备。下
    的头像 发表于 12-23 10:31 1314次阅读

    何在RAKsmart服务器上实现企业AI模型部署

    AI模型的训练与部署需要强大的算力支持、稳定的网络环境和专业的技术管理。RAKsmart作为全球领先的服务器托管与云计算服务提供商,已成为企业部署A
    的头像 发表于 03-27 09:46 767次阅读

    企业部署AI模型怎么做

    当下,AI模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高、成本失控等困境。如何突破瓶颈,实现高效、稳
    的头像 发表于 06-04 09:26 686次阅读