0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发布MediaPipe Holistic,实现移动端进行人体关键点检测跟踪

RTThread物联网操作系统 来源:RTThread物联网操作系统 作者:RTThread物联网操作 2020-12-29 09:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读:本期为 AI 简报 20201225 期,将为您带来 6 条相关新闻,有趣有料无水文~

1. 170 FPS!YolactEdge:边缘设备上的实时实例分割,已开源!

Paper: https://arxiv.org/abs/2012.12259
Github: https://github.com/haotian-liu/yolact_edge

本文提出了YolactEdge实时实例分割方法,可以在小型边缘设备上以实时速度运行。具体来说,在550x550分辨率的图像上,带有ResNet-101主干的YolactEdge在Jetson AGX Xavier上的运行速度高达30.8FPS(在RTX 2080Ti上的运行速度为172.7FPS)。为了实现这一目标,我们对基于图像的最新实时方法YOLACT进行了两项改进: 1)优化TensorRT,同时谨慎权衡速度和准确性; 2)利用视频中时间冗余的新型特征扭曲模块。 在YouTube VIS和MS COCO数据集上进行的实验表明,与现有的实时方法相比,YolactEdge的速度提高了3-5倍,同时具有极好的mask和box检测精度。

2. 谷歌发布 MediaPipe Holistic,实现移动端同时进行人脸、手部和人体关键点检测跟踪

Github:https://github.com/google/mediapipe

原文链接:

https://ai.googleblog.com/2020/12/mediapipe-holistic-simultaneous-face.html

谷歌MediaPipe Holistic为突破性的 540 多个关键点(33 个姿势、21 个手和468 个人脸关键点)提供了统一的拓扑结构,并在移动设备上实现了近乎实时的性能。 谷歌之前发布的MediaPipe就是一个专门为GPUCPU而设计的开源框架,已经为这些单个任务提供了快速、准确而又独立的解决方案。 但将它们实时组合成一个语义一致的端到端解决方案,仍是一个难题,需要多个依赖性神经网络的同步推理。 不久前,谷歌发布了 MediaPipe Holistic,就是针对上述挑战而提出一个解决方案,提出一个最新最先进的人体姿势拓扑结构,可以解锁新的应用。

3. 树莓派深度学习:目标检测

原文地址:https://zhuanlan.zhihu.com/p/110290326

作者之前已经是实现了树莓派4B上的深度学习环境搭建和测试,

https://zhuanlan.zhihu.com/p/110013867

这一篇是在树莓派上运行深度学习目标检测模型进行推理的效果,

主要是基于TensorFlow目标检测API,

并从该项目的一个子页面下载训练好的模型和权重,

直接进行目标检测的推理过程。

步骤如下:

下载安装TensorFlow目标检测API

配置环境

下载模型

运行

4. Docker 从入门到干活,看这一篇足矣

本文来自:cnblogs.com/clsn/p/8410309.html

Docker作为一个非常好的环境隔离神器,在机器学习圈也越来越火了。那么,Docker是什么,怎么用,相信大家看完本文,会对它有一个比较全面的认识

分别从以下几个方面来介绍:

容器简介

什么是 Docker

安装 Docker

Docker镜像相关操作

容器的日常管理

5. 亚马逊李沐团队提出:(开源) 行为识别的全面调研 2014-2020

737beeb8-48cf-11eb-8b86-12bb97331649.png

30页行为识别综述,共计283篇参考文献!Amusi 认为这是目前2020年看到的关于行为识别(视频理解)最好且最全面的综述。 本文对基于深度学习的视频行为识别(Video Action Recognition)论文进行了全面调研,按时间顺序详细介绍并盘点出重要工作,还统计出了17个视频行为识别数据集,最后还复现了大量优秀工作的代码,现已开源!

6. AWS与NVIDIA合作伙伴通过嵌入式AI简化构建应用程序

最近,NVIDIA与亚马逊网络服务(AWS)通过在AWS Marketplace中提供NVIDIA店面,宣布了一项合作伙伴关系,旨在简化将AI功能嵌入应用程序的过程。总计,NVIDIA将免费提供21种软件工具,以帮助使用AWS的开发人员构建GPU加速的AI应用程序。这将在医疗保健,金融,零售,智慧城市等多个领域引起广泛关注。 自2017年以来,NVIDIA一直通过其NVIDIA GPU优化云(NGC)目录以及AWS Marketplace上的一些单独组件提供了GPU加速软件。

但是,这是Nvidia的整个产品组合首次进入AWS Marketplace。NGC目录将NVIDIA的GPU加速软件工具集中在一起。它包含数百个机器学习(ML)框架和行业特定的软件开发套件,数据科学家和开发人员可以使用它们来构建AI解决方案。 NVIDIA声称250,000名用户已经从NGC目录中下载了超过100万个AI容器,预训练的模型,应用程序框架,Helm图表和其他ML资源。 你可以添加微信17775982065为好友,注明:公司+姓名,拉进RT-Thread 官方微信交流群!

责任编辑:xj

原文标题:【20201225期AI简报】YolactEdge:边缘设备上的实时实例分割,已开源!

文章出处:【微信公众号:RTThread物联网操作系统】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6245

    浏览量

    110270
  • 开源
    +关注

    关注

    3

    文章

    4037

    浏览量

    45578
  • 树莓派
    +关注

    关注

    122

    文章

    2069

    浏览量

    109737

原文标题:【20201225期AI简报】YolactEdge:边缘设备上的实时实例分割,已开源!

文章出处:【微信号:RTThread,微信公众号:RTThread物联网操作系统】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【EASY EAI Nano-TB(RV1126B)开发板试用】AI手部21关键点识别

    ubuntu22,因此我们可以直接什么pip3 install mediapipe 直接就顺利的安装好这个库。 2、编写手部21个关键点的检测代码。 当我们读取到一幅图像时首先要加载Media
    发表于 11-21 11:31

    广和通发布侧目标检测模型FiboDet

    为提升侧设备视觉感知与决策能力,广和通全自研侧目标检测模型FiboDet应运而生。该模型基于广和通在边缘计算与人工智能领域的深度积累,面向工业、交通、零售等多个行业提供高性能、低功耗、高性价比的视觉
    的头像 发表于 09-26 13:39 1414次阅读

    单板挑战4路YOLOv8!米尔瑞芯微RK3576开发板性能实测

    道路和车辆形状。 -posePose关键点检测边界框+人体关键点(17个点)检测人体
    发表于 09-12 17:52

    瑞芯微RK3576人体关键点识别算法(骨骼点)

    人体关键点识别是一种基于深度学习的对人进行检测定位与姿势估计的模型,广泛应用于体育分析、动物行为监测和机器人等领域,帮助机器实时解读物理动作。本算法具有运行效率高、实时性强的特点。
    的头像 发表于 08-27 10:07 852次阅读
    瑞芯微RK3576<b class='flag-5'>人体</b><b class='flag-5'>关键</b>点识别算法(骨骼点)

    【开发实例】基于BPI-CanMV-K230D-Zero开发板实现人体关键点的实时动态识别

    项目介绍人体关键点检测应用使用YOLOv8n-pose模型对人体姿态进行检测检测结果得到17个
    的头像 发表于 07-08 08:04 1026次阅读
    【开发实例】基于BPI-CanMV-K230D-Zero开发板<b class='flag-5'>实现</b><b class='flag-5'>人体</b><b class='flag-5'>关键</b>点的实时动态识别

    【BPI-CanMV-K230D-Zero开发板体验】人体关键点检测

    【BPI-CanMV-K230D-Zero开发板体验】人体关键点检测 本文介绍了香蕉派 CanMV K230D Zero 开发板通过摄像头实现人体
    发表于 06-28 13:18

    物流仓储头部企业应用AR+作业流,规范日常安全点检,保障消防安全

    物流仓储行业安全管理重要,安全点检项目多。国际物流某头部企业存在日常点检效率低、记录回溯难、管理效率低等痛点。与安宝特合作,基于AR、AI和无代码编程技术,实现安全点检全数字化升级。可
    的头像 发表于 04-29 13:53 631次阅读
    物流仓储头部企业应用AR+作业流,规范日常安全<b class='flag-5'>点检</b>,保障消防安全

    快速部署!米尔全志T527开发板的OpenCV行人检测方案指南

    行人检测概论使用HOG和SVM基于全志T527开发板构建行人检测器的关键步骤包括: 准备训练数据集:训练数据集应包含大量正样本(
    发表于 04-11 18:14

    OpenCV行人检测应用方案--基于米尔全志T527开发板

    本文将介绍基于米尔电子MYD-LT527开发板(米尔基于全志T527开发板)的OpenCV行人检测方案测试。摘自优秀创作者-小火苗一、软件环境安装1.安装
    的头像 发表于 04-10 08:03 1103次阅读
    OpenCV<b class='flag-5'>行人</b><b class='flag-5'>检测</b>应用方案--基于米尔全志T527开发板

    使用OpenVINO™模型的OpenCV进行人检测检测到多张人脸时,伺服电机和步入器电机都发生移动是为什么?

    使用OpenVINO™模型的 OpenCV* 进行人检测。 使用 cv2.矩形 函数,能够获取检测到的面部的坐标。 检测到多张人脸时,多个坐标被捕获到,伺服电机和步入器电机都发生
    发表于 03-07 06:35

    请问是否可以使用单个输入图像运行人检测MTCNN Python演示?

    是否可以使用单个输入图像运行人检测 MTCNN Python* 演示?
    发表于 03-06 08:15

    运行ASL识别演示时无法检测到手标是怎么回事?

    ASL Recognition 演示可以跟踪人员,但不会检测 ASL 手标。该计划仅能在方形边框和数字“0”的方形行走时进行人跟踪。 使用命令: python
    发表于 03-06 07:49

    使用OpenVINO™ 2021.4在CPU和MYRIAD上进行自定义对象检测,为什么结果差异巨大?

    使用自定义训练的模型执行推理,以便在 2021.4 OpenVINO™中进行人检测。 与 MYRIAD 相比,CPU 的输出结果取得了巨大的差异
    发表于 03-06 07:45

    AMD与谷歌披露关键微码漏洞

    为CVE-2024-56161,其潜在风险引起了业界的广泛关注。为了更深入地了解该漏洞,谷歌安全研究团队在GitHub上发布了相关帖子,对漏洞的详细信息、影响范围以及可能的攻击方式进行了全面剖析。同时,AMD也针对这一漏洞
    的头像 发表于 02-08 14:28 812次阅读

    ADS1294R电极脱落检测呼吸测量异常的原因?怎么处理?

    上下电路进行电极脱落检测时,漏电流达到0.2uA,不符合标准要求。可否有更加可靠的方式?以前的设计采用上拉40M的电阻实现。 不知道ADS1294的电极脱落检测功能是否能够满足标准和可
    发表于 01-02 07:31