0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3个DNN的项目介绍

FPGA技术江湖 来源:FPGA技术江湖 作者:FPGA技术江湖 2022-06-16 09:27 次阅读

介绍

深度神经网络 (DNN) 是一种人工神经网络(ANN),在输入层和输出层之间具有多层。有不同类型的神经网络,但它们基本由相同的组件组成:神经元、突触、权重、偏差和函数。这些组件的功能类似于人类大脑,可以像任何其他 ML 算法一样进行训练。

3241cbd6-ed13-11ec-ba43-dac502259ad0.png

例如,经过训练以识别狗品种的 DNN 将遍历给定的图像并计算图像中的狗是某个品种的概率。用户可以查看结果并选择网络应该显示哪些概率(超过某个阈值等)并返回建议的标签。每个数学操作都被认为是一个层,复杂的 DNN 有很多层,因此被称为“深度”网络。

324f329e-ed13-11ec-ba43-dac502259ad0.png

关于DNN、ANN、CNN区别,请看下图:

326b7cf6-ed13-11ec-ba43-dac502259ad0.png

https://blog.csdn.net/lff1208/article/details/77717149

IBM_AccDNN

https://github.com/IBM/AccDNN

AccDNN(深度神经网络加速器核心编译器)又名;DNNBuilder

项目介绍

在这个项目中,我们提出了一种新颖的解决方案,可以自动将经过 Caffe 训练的深度神经网络转换为 FPGA RTL 级别的实现,无需任何编程工作,并为用户的识别任务提供统一的 API

因此,没有任何 FPGA 编程经验的开发人员可以将他们的 FPGA 加速深度学习服务部署在数据中心或边缘设备中,仅提供他们经过训练的 Caffe 模型。该作品发表在 ICCAD'18 上,并获得了前端最佳论文奖。了解更多设计细节。请参考我们的论文(https://docs.wixstatic.com/ugd/c50250_77e06b7f02b44eacb76c05e8fbe01e08.pdf)。

转换过程

转换包括三个阶段:

首先对 Caffe 网络文件进行解析,得到网络结构。我们估计每一层的工作量以确定在 FPFA 资源约束下的并行度。

该网络中定义的每一层通过在库中实例化相应的神经层来生成一个定制的 Verilog 模块。顶层模块也是根据net文件中定义的层顺序将这些自定义实例连接在一起生成的,并且在这个阶段也生成了权重所需的片上内存。

综合生成的源文件、布线和布局,生成可执行的 FPGA 位文件。

327d5520-ed13-11ec-ba43-dac502259ad0.png

AccDNN 缺点

仅支持 Caffe 框架训练的模型。

仅支持卷积层、最大池化层、全连接层和批量归一化层。

Caffe .prototxt 中定义的网络中卷积层和全连接层的总数应少于 15 层

DNN-Hardware-Accelerator

https://github.com/ryaanluke/DNN-Hardware-Accelerator

https://github.com/gwatcha/dnn_accelerator

介绍

在本实验中,将以嵌入式 Nios II 系统为核心构建深度神经网络加速器。在本项目中还将学习如何与片外 SDRAM 连接,以及如何使用 PLL 生成具有特定属性的时钟

由于整个系统比我们之前构建的系统更复杂,因此在将设计的所有部分连接在一起之前,编写大量的测试单元并仔细调试将变得尤为重要。

深度神经网络

我们将使用一种称为多层感知器 (MLP) 的神经网络对 MNIST 手写数字数据集进行分类。也就是说,我们的 MLP 将以 28×28 像素的灰度图像作为输入,并确定该图像对应的数字 (0..9)。

MLP 由几个线性层组成,它们首先将前一层的输出乘以权重矩阵,并为每个输出添加一个恒定的“偏差”值,然后应用非线性激活函数来获得当前层的输出(称为激活)。我们的 MLP 将有一个 784 像素的输入(28×28 像素的图像)、两个 1000 个神经元的隐藏层和一个 10 个神经元的输出层;具有最高值的输出神经元将告诉我们网络认为它看到了哪个数字。对于激活函数,我们将使用整流线性单元 (ReLU),它将所有负数映射到 0,将所有正数映射到自身。

在推理过程中,每一层计算a' = ReLU( W · a + b ),其中W是权重矩阵,a是前一层的激活向量,b是偏置向量,a'是当前层的激活向量。

不要被神经网络等花哨的术语吓倒——你实际上是在构建一个加速器来进行矩阵向量乘法。这里的大部分挑战来自与片外 SDRAM 存储器的交互以及正确处理诸如waitrequest和readdatavalid 之类的信号

不需要知道这些网络是如何训练的,因为我们已经为您训练了网络并预先格式化了图像(请参阅data文件夹的内容和测试输入列表)。但是,如果好奇,可以查看scripts/train.py我们是如何训练 MLP 的。

328a56a8-ed13-11ec-ba43-dac502259ad0.png

关于该项目的一些补充说明请查看下面的PDF:

https://github.com/ryaanluke/DNN-Hardware-Accelerator/blob/main/Deep%20Neural%20Networks%20on%20FPGA.pdf

DNN-accelerator-on-zynq

https://github.com/joycenerd/DNN-accelerator-on-zynq

https://github.com/karanam1997/Dnnweaver-Zed-board-/tree/master/DNNWeaver_original

https://github.com/anonsum/DNNWeaver_Simulations

设计要求:

329b95a8-ed13-11ec-ba43-dac502259ad0.png

整个系统框图如下:

32adb51c-ed13-11ec-ba43-dac502259ad0.png

相关的设计文档:

https://github.com/joycenerd/DNN-accelerator-on-zynq/blob/master/2019DD_lab12Finalv4.pdf

Handwritting-number-distinguishing-with-DNN-by-Nexys-4-DDR-in-Verilog-HDL

https://github.com/MaxMorning/Handwritting-number-distinguishing-with-DNN-by-Nexys-4-DDR-in-Verilog-HDL

用 Verilog HDL 实现 DNN 区分手写数字,在Nexys 4 DDR 上运行。

32bd3b18-ed13-11ec-ba43-dac502259ad0.png

总结

今天介绍了3个DNN的项目,主要是DNN复杂度较TPU或者CNN高了几个台阶,所以用它来直接对FPGA进行移植难度很大,还是只建议对第一个IBM项目进行研究,其他在ZYNQ上进行数字识别适合实现,其他都不怎么推荐

关于DNN或者CNN也介绍了几十个项目了,这些只适合学习研究,并不适合拿来商用,所以后台喷我的小伙伴要求也不要太高,这些开源的项目能直接商用的少之又少,大部分项目只适合学习。还有一些项目是学生做的,所以你们也不必喷:说是拿一些学生做的项目能干什么,我这里只想说,这些项目至少能给您一些参考,什么事情总比从零开始好,或者让你们了解一些同龄人在学校里在干什么,最后,这些项目您又看不上您开源几个出来~

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4562

    浏览量

    98643
  • dnn
    dnn
    +关注

    关注

    0

    文章

    56

    浏览量

    8947

原文标题:​优秀的 Verilog/FPGA开源项目- 深度神经网络 (DNN)

文章出处:【微信号:HXSLH1010101010,微信公众号:FPGA技术江湖】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【Longan Pi 3H 开发板试用连载体验】基于 Longan Pi 3H 开发板完成智能家居控制小型项目

    及4铜柱 与树莓派3B来个对比,尺寸差不多只有树莓派3B的三分之一,性能可是提升不少 详细板卡介绍可以看官网板卡介绍 二、开机 手头上有一
    发表于 04-02 22:37

    基于OpenCV DNN实现YOLOv8的模型部署与推理演示

    基于OpenCV DNN实现YOLOv8推理的好处就是一套代码就可以部署在Windows10系统、乌班图系统、Jetson的Jetpack系统
    的头像 发表于 03-01 15:52 404次阅读
    基于OpenCV <b class='flag-5'>DNN</b>实现YOLOv8的模型部署与推理演示

    HTTP服务器项目实现介绍

    项目介绍项目实现的是一个HTTP服务器,项目中将会通过基本的网络套接字读取客户端发来的HTTP请求并进行分析,最终构建HTTP响应并返回给客户端。 HTTP在网络应用层中的地位是不
    的头像 发表于 11-08 16:54 306次阅读
    HTTP服务器<b class='flag-5'>项目</b>实现<b class='flag-5'>介绍</b>

    基于OpenCV的DNN图像风格迁移

    /deep-photo-styletransfer 项目,需要安装 CUDA、pytorch、cudnn等等,配置能花一天的时间。 不过最近我发现一个非常好的开源应用项目,那就是基于OpenCV的DNN图像风格迁移。你只需要安装
    的头像 发表于 10-30 10:03 233次阅读

    AI芯片设计DNN加速器buffer管理策略

    如前所述,数据缓存是创建高效DNN加速器的关键组件之一。因此,除了选择适当的数据流(控制数据缓存的位置和时间)外,DNN加速器还需要一个缓存方案
    的头像 发表于 10-17 17:23 811次阅读
    AI芯片设计<b class='flag-5'>DNN</b>加速器buffer管理策略

    使用赛灵思Alveo加速器卡加速DNN

    电子发烧友网站提供《使用赛灵思Alveo加速器卡加速DNN.pdf》资料免费下载
    发表于 09-18 09:27 0次下载
    使用赛灵思Alveo加速器卡加速<b class='flag-5'>DNN</b>

    FPGA在新兴DNN推理领域的应用

    电子发烧友网站提供《FPGA在新兴DNN推理领域的应用.pdf》资料免费下载
    发表于 09-15 10:52 0次下载
    FPGA在新兴<b class='flag-5'>DNN</b>推理领域的应用

    新兴DNN推理领域的FPGA

    电子发烧友网站提供《新兴DNN推理领域的FPGA.pdf》资料免费下载
    发表于 09-15 10:09 0次下载
    新兴<b class='flag-5'>DNN</b>推理领域的FPGA

    使用ldquo cv2.dnn.readnet rdquo时,无法从中间表示(IR)读取网络怎么解决

    安装了 opencv-python 无头 和 openvino 封装。 随 Python* 导入 OpenCV* 使用 cv2.dnn.readNet(): cv2.error: Build
    发表于 08-15 07:20

    Gaudi Training系统介绍

    大型DNN工作负载的大规模计算需求,并为大规模系统提供前所未有的效率:高迪训练处理器。在训练过程中,神经网络的内部参数会针对目标应用进行调整和优化。一典型的网络包含数十亿内部参数,所有这些参数在
    发表于 08-04 06:48

    工程师说 | R-Car DNN模拟器的介绍 (2)

    摘要 在瑞萨提供的R-Car SoC相关的一些DNN模拟器中,本文将重点介绍 能够实现与实际硬件等价运算的Accurate Simulator ,并说明如何应用它来 分析和提高神经网络的精度
    的头像 发表于 07-13 18:15 245次阅读
    工程师说 | R-Car <b class='flag-5'>DNN</b>模拟器的<b class='flag-5'>介绍</b> (2)

    PCBA检验项目四大分类介绍

    一致性检验四类。接下来深圳PCBA厂家为大家介绍PCBA检验项目的分类。 PCBA检验项目四大分类 1.材料检验 贴片电子厂中材料检验是PCBA板生产方生产过程质量控制的重要组成部分,也是对用户的质量保证的一部分,证明PCBA板
    的头像 发表于 07-04 08:58 1212次阅读
    PCBA检验<b class='flag-5'>项目</b>四大分类<b class='flag-5'>介绍</b>

    介绍一下高低温试验箱的校验项目与方法

    介绍一下高低温试验箱的校验项目与方法
    的头像 发表于 06-12 09:49 256次阅读
    <b class='flag-5'>介绍</b>一下高低温试验箱的校验<b class='flag-5'>项目</b>与方法

    用NodeMCU v3模块做一项目,电源有问题怎么解决?

    我正在用 NodeMCU v3 模块做一项目,但电源有问题。该设备将由四节 AAA 电池供电,提供 6V 电压。现在,我应该如何将 hx711 模块与 esp8266 连接,因为 NodeMCU
    发表于 05-22 09:24

    介绍一下高低温试验箱的校验项目与方法

    介绍一下高低温试验箱的校验项目与方法
    的头像 发表于 05-11 09:39 321次阅读
    <b class='flag-5'>介绍</b>一下高低温试验箱的校验<b class='flag-5'>项目</b>与方法