0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

手机识别模型案例

柴火创客空间 来源:柴火创客空间 2024-11-18 11:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

2023年以ChatGPT为代表的大语言模型横空出世,它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力,为人工智能技术的发展开辟了新的可能性。同时,人工智能技术正在进入各种应用领域,在智慧城市、智能制造、智慧医疗、智慧农业等领域发挥着重要作用。

本期介绍:模型案例:|手机识别模型!

RT-DETR

RT-DETR是基于DETR架构的端到端对象检测器,完全消除了对NMS的需求。通过这样做,RT-DETR显着减少了之前基于卷积神经网络(CNN)的对象检测器(如YOLO系列)的延迟。它结合了强大的主干、混合编码器和独特的查询选择器,可以快速准确地处理特征。

c0fa46fa-9cc0-11ef-a511-92fbcf53809c.png

RT-DETR架构的关键组件

Backbone网络:通常采用高效的卷积神经网络(CNN)作为特征提取的基础,例如ResNet或EfficientNet,以获取图像的多尺度特征。从主干,RT-DETR提取三个级别的特征- S3,S4和S5,这些多尺度特征有助于模型理解图像的高级和细粒度细节。

c1010922-9cc0-11ef-a511-92fbcf53809c.png

Transformer编码器-解码器:RT-DETR中使用了Transformer的编码器-解码器结构,该混合编码器包括两个主要部分:基于注意力的尺度内特征交互(AIFI)和跨尺度特征融合(CCFF)。

基于注意力的尺度内特征交互(AIFI)

这个组件的核心思想是利用自注意力机制在同一尺度内进行特征交互。AIFI能够让模型有效地捕捉同一尺度特征图中各个位置之间的关系。

具体而言,AIFI通过计算特征的注意力权重,使得模型能够关注到重要的区域,并抑制冗余信息,从而增强对目标的定位和表征能力。

这种尺度内的交互有助于在相似尺寸的物体之间建立联系,提高对密集目标的检测能力。

c11d7b70-9cc0-11ef-a511-92fbcf53809c.png

跨尺度特征融合(CCFF)

CCFF负责整合来自不同尺度的特征,以便于模型能够从多层次的信息中获得更全面的上下文。这一过程通常涉及将来自不同尺度的特征图进行融合,通过卷积操作、上采样或下采样等方式,将这些特征进行对齐并结合在一起。

CCFF不仅允许模型综合不同尺度特征的优势,还能提高对各种大小目标的检测能力。

c13bcf26-9cc0-11ef-a511-92fbcf53809c.png

多尺度特征金字塔:RT-DETR通常会借助特征金字塔网络(FPN)来融合来自不同层次的特征,以加强对不同大小目标的检测能力。

目标查询(Object Queries):解码器使用的目标查询是关键组件,它们用于引导模型对目标的检测,允许模型在生成检测结果时关注不同的潜在目标。

类别和边界框回归:在解码器中,RT-DETR通过类别预测和边界框回归来输出目标的类别和位置。

c14cadd2-9cc0-11ef-a511-92fbcf53809c.png

高效的训练策略:RT-DETR往往结合了一些改进的训练策略,如动态图损失(Dynamic Loss)和图像增强技术,以提高模型的收敛速度和检测精度。

后处理:如NMS(非极大值抑制)处理步骤,以去除冗余的检测框和优化最终的检测结果。

手机识别模型

该 AI 模型由 Swift yolo 算法生成,专为 Seeed Studio Grove Vision AI (V2) 设备设计,能够高效识别和检测到手机。

应用场景

该模型适用于多种应用场景,包括零售、安全、公共空间监控和个人监督。

在零售业,该模型可以实时监控手机库存,帮助员工及时补货;

在安全方面,它可以帮助识别和跟踪丢失或被盗的手机;

在个人监督,很多学生上课玩手机,可以通过此模型进行监控。

SenseCraft Al平台

SenseCraft Al平台,是柴火母公司矽递科技旗下的AI平台,支持Grove-Vision AI V2、XIAO ESP32S3 Sense和NVIDlA Jetson设备的模型部署、模型训练和数据输出。

SenseCraft Al平台为使用者提供海量模型,简化模型训练过程并提供专业的AI视觉工作空间。

c17ce59c-9cc0-11ef-a511-92fbcf53809c.png

在Grove - Vision AI V2模块上部署模型

1、打开SenseCraft AI平台,如果第一次使用请先注册一个会员账号,还可以设置语言为中文。

平台地址:

https://sensecraft.seeed.cc/ai/#/model

c1971d86-9cc0-11ef-a511-92fbcf53809c.png

2、在顶部单击【预训练模型】菜单,在公共AI模型列表中找到【手机检测】模型,单击此模型图片,如下图所示。

c1b560a2-9cc0-11ef-a511-92fbcf53809c.png

3、进入【手机检测】模型介绍页面,单击右侧的“部署模型”按钮,如下图所示。

c1c91c82-9cc0-11ef-a511-92fbcf53809c.png

4、进入部署手机检测模型页面,按提示步骤先连接摄像头,再连接设备到电脑USB接口上,最后单击【连接设备】按钮,如下图所示。

c1ee4d54-9cc0-11ef-a511-92fbcf53809c.png

5、弹出部署模型窗口,单击“确定”按钮,如下图所示。

c2021654-9cc0-11ef-a511-92fbcf53809c.png

6、弹出连接到串行端口窗口,选择端口号后单击“连接”按钮,如下图所示。

c20d4362-9cc0-11ef-a511-92fbcf53809c.png

7、开始进行模型部署、固件下载、设备重启等过程,完成后在预览中即可看到当前摄像头视频内容,将摄像头对准手机图片查看预测效果,如下图所示。

c210dedc-9cc0-11ef-a511-92fbcf53809c.png

原型设计

利用此手机识别模型,设计一个桌面手机监控装置,此装置在检测到有人用手机时会点亮led模块,也可改为蜂鸣器模块进行报警,这样就有了一个防沉迷手机检测装置。

c22c8466-9cc0-11ef-a511-92fbcf53809c.png

模型推理演示,请看如下视频

Grove Al视觉模块 V2套装介绍

c2454d66-9cc0-11ef-a511-92fbcf53809c.png

Grove Al视觉模块 V2

c249730a-9cc0-11ef-a511-92fbcf53809c.png

OV5647-62摄像头

Grove - Vision Al Module V2是一款拇指大小的人工智能视觉模块, 配备Himax WiseEye2 HX6538处理器Arm Ethos-U55嵌入式神经网络加速单元(NPU), 该处理器采用 ArmCortex-M55双核架构。

Arm Ethos-U55 嵌入式神经网络处理器(NPU)

嵌入式神经网络处理器(NPU)是一种特别设计用于执行神经网络计算的高效率处理器。它主要基于数据驱动并行计算架构,特别擅长处理视频、图像等大量的多媒体数据。NPU模仿了生物神经网络的架构,与CPUGPU相比,它能够通过更少的指令(一条或几条)完成神经元的处理,因此在深度学习的处理效率方面具有明显优势。

它具有标准的CSI接口, 并与树莓派相机兼容。它有一个内置的数字麦克风和SD卡插槽。它非常适用于各种嵌入式视觉项目。

有了SenseCraft Al算法平台, 经过训练的ML模型可以部署到传感器, 而不需要编码。它兼容XIAO系列和Arduino生态系统, 是各种物体检测应用的理想选择。

主要硬件配置

- 板卡基于WiseEye2 HX6538处理器, 采用双核ARM Cortex-M55架构

- 配备集成Arm Ethos-U55嵌入式神经网络处理器(NPU), 兼容的树莓派相机

- 板载PDM麦克风, SD卡插槽, Type-C, Grove接口, 丰富的外设支持样机开发

- Seeed Studio XIAO的可扩展性, SenseCraft Al的现成AI模型用于无代码部署。

- 支持各种有效的模型, 包括MobilenetV1、MobilenetV2、 Eficientnet-Lite、Yolov5和Yolov8.

写在最后

SenseCraft-AI平台的模型仓数量还很少,但是好消息是它支持自定义模型上传并输出推理结果,平台会逐渐增加模型仓的数量和分享有爱好者设计的模型仓原型,敬请关注!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 手机
    +关注

    关注

    36

    文章

    6980

    浏览量

    160655
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51714

原文标题:模型案例:| 手机识别模型!

文章出处:【微信号:ChaiHuoMakerSpace,微信公众号:柴火创客空间】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    低成本AI边缘计算盒子DIY:基于迅为RK3568和开源模型,轻松玩转智能识别

    低成本AI边缘计算盒子DIY:基于迅为RK3568和开源模型,轻松玩转智能识别
    的头像 发表于 11-12 13:42 1298次阅读
    低成本AI边缘计算盒子DIY:基于迅为RK3568和开源<b class='flag-5'>模型</b>,轻松玩转智能<b class='flag-5'>识别</b>

    如何精准驱动菜品识别模型--基于米尔瑞芯微RK3576边缘计算盒

    ❝ 在人工智能与边缘计算深度融合的今天,将AI模型高效部署于终端设备已成为产业智能化的关键。本文将分享基于米尔MYD-LR3576边缘计算盒子部署菜品识别安卓Demo的实战经验。该设备凭借其内
    发表于 10-31 21:19

    米尔RK3576边缘计算盒精准驱动菜品识别模型性能强悍

    ❝在人工智能与边缘计算深度融合的今天,将AI模型高效部署于终端设备已成为产业智能化的关键。本文将分享基于米尔MYD-LR3576边缘计算盒子部署菜品识别安卓Demo的实战经验。该设备凭借其内置的强劲
    的头像 发表于 10-30 08:05 4582次阅读
    米尔RK3576边缘计算盒精准驱动菜品<b class='flag-5'>识别</b><b class='flag-5'>模型</b>性能强悍

    迅为RK3568开发板模型推理测试实战LPRNet 车牌识别

    迅为RK3568开发板模型推理测试实战LPRNet 车牌识别
    的头像 发表于 08-25 14:55 1072次阅读
    迅为RK3568开发板<b class='flag-5'>模型</b>推理测试实战LPRNet 车牌<b class='flag-5'>识别</b>

    广和通发布自研端侧语音识别模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟语音交互、实时语音转录
    的头像 发表于 08-04 11:43 1376次阅读

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用 LZ-Picodet 模型训练的人脸检测模型 LZ-Face,以及ArcFace人脸识别
    发表于 07-01 12:01

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用LZ-Picodet模型训练的人脸检测模型LZ-Face,以及ArcFace人脸识别模型
    的头像 发表于 07-01 10:09 513次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:C++人脸<b class='flag-5'>识别</b>

    【正点原子STM32MP257开发板试用】基于 YOLO 模型的物体识别

    【正点原子STM32MP257开发板试用】基于 YOLO 模型的物体识别 本文介绍了正点原子 STM32MP257 开发板基于 YOLO-v5 模型实现物体识别的项目设计。 项目介绍
    发表于 06-21 16:32

    训练完模型后用cls_video.py在canmvIDE上运行,按着步骤操作但是摄像头没有识别到是什么情况?

    训练完模型后用cls_video.py在canmvIDE上运行,按着步骤操作但是摄像头没有识别到是什么情况啊,没有框出现
    发表于 06-10 06:57

    某些安卓手机无法识别FX2LP设备,怎么解决?

    ()” 找到设备。 阅读尚未测试。 Phome #2 (小米):给设备加电,但屏幕上什么也没发生,“getDeviceList ()” 返回空白。 手机可以识别我尝试过的所有其他 USB 设备,包括在
    发表于 05-27 06:21

    【幸狐Omni3576边缘计算套件试用体验】人脸识别

    RetinaFace 模型实现单张和多张人脸识别的效果展示。 单张人脸识别 这里选取了一些影视作品的人物图片作为识别样本,识别效果如下
    发表于 04-01 21:46

    联想moto手机集成DeepSeek-R1大模型

    联想moto官方近日正式宣布,其最新款AI手机已成功集成了DeepSeek-R1满血版大模型。这款大模型拥有高达671B的满血参数,为用户带来了前所未有的智能化体验。 通过联想moto手机
    的头像 发表于 02-14 14:36 796次阅读

    【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读

    今天学习<基于大模型的RAG应用开发与优化>这本书。大模型微调是深度学习领域中的一项关键技术,它指的是在已经预训练好的大型深度学习模型基础上,使用新的、特定任务相关的数据
    发表于 01-14 16:51

    【「大模型启示录」阅读体验】营销领域大模型的应用

    今天跟随「大模型启示录」这本书,学习在营销领域应用大模型。 大模型通过分析大量的消费者数据,包括购买历史、浏览记录、社交媒体互动等,能够识别消费者的偏好和行为模式。这种分析能力有助于企
    发表于 12-24 12:48

    垃圾短信?手机自动识别垃圾短信逻辑的分析

    作者:京东科技 贾玉龙 1 背景 随着智能手机的普及和移动互联网的发展,短信作为一种传统的通讯方式,仍然保持着其独特的地位。然而,随着垃圾短信的泛滥,手机自动识别垃圾短信的技术也在不断进步。对于提供
    的头像 发表于 12-16 10:19 1471次阅读