0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超星未来NE100开箱体验,15分钟部署目标检测模型

超星未来 来源:超星未来 2023-09-27 17:14 次阅读

「NE100」是超星未来基于自研计算芯片「惊蛰R1」和全流程开发工具链「鲁班」打造的智能计算平台开发套件,包括完备的推理环境。其中鲁班工具链以 docker 形式提供,完整包括剪枝、量化、编译工具以及相应实例。NE100 配套完整,开箱即用,无需繁琐的安装过程。

下面以目标检测模型 YOLOv5 为例,展示部署过程。

注:开发环境为Linux 系统的 PC 或服务器,神经网络需要导出为 ONNX 格式文件。

可通过标准命令加载工具链 docker 文件:

gunzip -c nova_development_kit.tar.gz | sudo docker load

参考用户手册中示例脚本启动容器,进入开发环境。

基于原始模型导出 ONNX 文件时,请确保网络已经处于推理模式,并且计算图的输入节点为首个 CONV 算子的输入(格式[1,C,H,W]),输出节点为最后一个(组)CONV 算子的输出,详细信息请参考用户手册。

#1模型量化与编译

1个API,5行代码,轻松完成

量化工具以 ONNX 文件和部分图片为输入,将神经网络从 FP32 量化为 INT8 精度,目前支持 PTQ 与 QAT 功能。仅需在代码中将量化和编译工具导入并通过 API 调用,即可对 ONNX 模型完成量化和编译,分别只需要1个 API 和5行代码。详细的 API 说明请参考用户手册。

1. 导入量化工具

from nquantizer import run_quantizer

2. 调用量化工具

quant_model = run_quantizer( 
    onnx_model,
    dataloader=val_loader,
    num_batches=200,
    output_dir=work_dir + "/quantizer_output",
    input_vars=input_vars,
) 

3. 导入编译工具

from ncompiler import run_compiler

4. 调用编译工具

run_compiler(
    input_dir=work_dir + "/quantizer_output",
    output_dir=work_dir + "/compiler_output",
    enable_simulator=True,
    enable_profiler=True,
)

编译后 compiler_output 目录中的 npu.param(模型结构描述文件)和 npu.bin(模型权重文件)是 NE100 部署时所需要的文件。

75dc86de-5d14-11ee-939d-92fbcf53809c.png

#2模型部署

接口简洁,功能丰富,快速调用NPU

为了实现 惊蛰R1 芯片多核 NPU 的简单高效推理与应用开发,超星未来基于 NCNN 推理框架增量开发运行时,并提供高性能加速库,满足异构推理的端到端优化需求。

运行时特别设计了 npumat, npunet 和 npuextractor 等组件,功能如下:

npumat:提供NPU使用的数据排布格式HWC,提高数据存储读取性能

npunet:提供模型不变信息的基础数据结构,支持核心绑定、优先级调度、数据导出、性能监测等功能

npuextractor:提供NPU推理所需的set_input, get_output, get_time、extract等基本功能

YOLOv5 推理中前后处理部分与主流平台上的代码一致,应用迁移时仅需更换 NPU 的推理代码,包括:

1. 初始化帧数据结构

75ea151a-5d14-11ee-939d-92fbcf53809c.png

2. 加载网络结构描述文件与网络权重文件,并且配置核心绑定、数据导出及性能监测等功能

7605d4e4-5d14-11ee-939d-92fbcf53809c.png

3. 基于加载的模型文件和前处理后的帧数据进行推理,提取结果用于后处理

762af58a-5d14-11ee-939d-92fbcf53809c.jpg

#3模型推理

架构高效,能耗出色,助力AI应用落地

推理代码经过编译后运行,即可得到如下推理结果:

76374f88-5d14-11ee-939d-92fbcf53809c.jpg

得益于超星未来自研平湖架构的高效设计,YOLOv5 等主流网络的算力利用率均超过 70%,同时芯片整体功耗可控制在 8W 左右,有效支持各类边缘端 AI 应用部署。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4576

    浏览量

    98800
  • 模型
    +关注

    关注

    1

    文章

    2709

    浏览量

    47712
  • 目标检测
    +关注

    关注

    0

    文章

    186

    浏览量

    15460

原文标题:超星未来 NE100 开箱体验,15分钟部署目标检测模型

文章出处:【微信号:NOVAUTO,微信公众号:超星未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【小e物联网试用体验】+ 超清开箱体

    ` 本帖最后由 真喜洋洋 于 2016-5-31 21:12 编辑 【小e物联网试用体验】+ 超清开箱体验很早就收到了小e的开发板,但是早段时间生病,一直来不及开箱体验,今天偶感舒适,上些高清五码图。。`
    发表于 05-17 10:30

    【NanoPi NEO试用体验】开箱体

    `开箱体验这是一篇延时了很久的报告,为什么捏,因为我是新手~原来报告在手机上发不了`
    发表于 10-31 02:10

    【VEML6040环境颜色检测试用体验】一、开箱体验,惊喜有余

    `【VEML6040环境颜色检测试用体验】一、开箱体验,惊喜有余正常收到VEML6040环境颜色检测开发板,立即开箱体验。预先看资料开发板应该不大,但大包装盒着实实在。拆开后可见企业对
    发表于 03-27 15:11

    15分钟充满快充移动电源---未来的潜力有多大?

    `深圳市思齐新能源有限公司目前已经成功开发两款快充移动电源6000毫安时 10000毫安时充电15分钟充满使用循环寿命是普通锂电池5倍以上支持TYPC接口 想了解未来市场潜力?谢谢`
    发表于 06-16 12:16

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera的夜间目标检测项目

    不良数据,经过gpu训练后将训练后的模型部署在Horizon x3开发板上(Sunrise3芯片),实现全国产边缘目标检测的demo,同时可以通过b站或51cto网站上韦东山老师的教学
    发表于 11-19 20:49

    HiSpark AI Camera 开发套件开箱体

    分享一下我的开箱体验,实物开箱展示包装盒:WIFI天线与电源连接串口与扬声器链接:上电启动串口打印:启动后效果:相机效果,需要调节焦距:
    发表于 01-15 16:33

    目标检测模型和Objectness的基础知识

    在本文中,我们将讨论目标检测模型和Objectness的基础知识。
    发表于 02-04 07:05

    怎样去验证可部署目标硬件与软件算法模型之间的算法性能一致性?

    如何去设计一款合理的电子硬件解决方案,从而实现经济有效的大规模生产与部署?怎样去验证可部署目标硬件与软件算法模型之间的算法性能一致性?System Generator是什么?有什么功能
    发表于 04-08 06:25

    在Arm虚拟硬件上部署PP-PicoDet模型

    1、在Arm虚拟硬件上部署PP-PicoDet模型  经典的深度学习工程是从确认任务目标开始的,我们首先来简单地介绍一下目标检测任务以及本期
    发表于 09-16 14:42

    在Arm虚拟硬件上部署PP-PicoDet模型的设计方案

    1、在Arm虚拟硬件上部署PP-PicoDet模型  经典的深度学习工程是从确认任务目标开始的,我们首先来简单地介绍一下目标检测任务以及本期
    发表于 09-23 15:02

    基于深度学习模型的点云目标检测及ROS实现

    近年来,随着深度学习在图像视觉领域的发展,一类基于单纯的深度学习模型的点云目标检测方法被提出和应用,本文将详细介绍其中一种模型——SqueezeSeg,并且使用ROS实现该
    的头像 发表于 11-05 16:47 1.7w次阅读

    目标检测模型和Objectness的知识

    在本文中,我们将讨论目标检测模型和Objectness的基础知识。
    的头像 发表于 02-12 17:00 915次阅读

    一种脱离预训练的多尺度目标检测网络模型

    为提高卷积神经网络目标检测模型精度并增强检测器对小目标检测能力,提出一种脱离预训练的多尺度
    发表于 04-02 11:35 26次下载
    一种脱离预训练的多尺度<b class='flag-5'>目标</b><b class='flag-5'>检测</b>网络<b class='flag-5'>模型</b>

    如何在移动设备上训练和部署自定义目标检测模型

    上,目标检测模型的训练和部署的过程: 设备端 ML 学习路径:关于如何在移动设备上,训练和部署自定义目标
    的头像 发表于 08-16 17:09 2937次阅读

    YOLOX目标检测模型的推理部署

    旷视科技开源了内部目标检测模型-YOLOX,性能与速度全面超越YOLOv5早期版本!
    的头像 发表于 04-16 23:00 2627次阅读