0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于深度图像的人体关节定位算法

新机器视觉 来源:上海交大类脑智能应用技 作者:上海交大类脑智能 2022-07-15 10:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人体姿态估计是当前计算机视觉领域的热点研究问题。对人体骨架关节点进行准确提取并构建人体骨架模型,为进一步的人体姿态识别、实时交互游戏等应用提供了基础。但是传统的基于RGB图像的方法容易受到光照、阴影、复杂背景的影响,准确度不高并且算法复杂。利用深度图像技术可以有效地解决上述问题,利用深度信息可以快速地进行背景分割,抗干扰性能好,算法效率高。

本文主要研究基于深度图像的人体关节定位算法。算法对深度图像素点周围区域的深度进行格点化采样以提取其深度特征,再使用随机森林分类器进行像素点分类,对同一类别的点使用Mean Shift算法聚类出中心点,以该中心点作为关节点位置。该算法可对人体全身关节点进行定位。

局域深度特征提取

本文中采用如图1所示的局域深度采样特征。其中蓝色点表示图像I中给定的像素x,以该像素为中心生成一个5*5的格点矩阵,红色的格点表示要进行深度采样的点。

734edd8c-037d-11ed-ba43-dac502259ad0.png

图1 局域深度采样示意图

随机森林分类器

分类器是对样本进行分类的算法的统称,在机器学习中有许多种分类器可供我们选择使用,包括逻辑回归、朴素贝叶斯、支持向量机(SVM)、决策树、随机森林、神经网络等算法。综合考虑分类的精度与效率,本课题中采用的是随机森林分类器。

随机森林分类器是由多棵决策树组合而成的分类器,如图2所示。决策树的结构类似二叉树,由分裂结点和叶结点构成。每一个分裂结点包含一个特征与阈值,像素x从根部开始,根据特征与阈值划分进入左子树还是右子树,这样不断地分裂直到叶结点。在每棵树的叶结点能够得到该像素对于各个身体部件的概率分布,将各棵树得到的结果相加,得到最终的概率分布,拥有最高概率的一类作为最终的分类结果。

随机森林将多棵决策树合并在一起,准确度相较于单棵决策树有较大提升,并且多棵决策树可以并行训练,提高了训练效率。

735cdb58-037d-11ed-ba43-dac502259ad0.png

图2随机森林分类器

训练完随机森林分类器后,我们利用其对像素点进行分类,判断其属于身体的哪个部位。对于图像中的每个像素,使用分类器对其分类后得到分类的结果,以及预测结果的概率。我们只选取图像中预测概率高于80%的点,这样就能得到密度不同的分类点。越靠近关节点位置,预测概率越高,点的密度越大,远离关节点位置的密度则小。

关节点位置估计

在得到像素点分类后,我们使用Mean Shift聚类算法得到属于同一部位像素点的中心,作为关节位置。

Mean Shift算法一般为一个迭代过程,先计算感兴趣区域内的偏移均值,移动区域中心到计算出的质心处,然后以此处作为新的起点,继续移动。在迭代过程中,不断向密度更大的地方偏移,直到移动到这类像素点密度最高的中心位置而停止。此时这个位置最能代表这一类点,我们将其作为该部位的关节点位置。分别对所有类别的点都运行一遍此算法后,我们就能得到全身关节点的位置。

但是由于分类结果并不一定准确,聚类出的结果可能与真实关节点的位置有所偏移,这时我们可以采用人体骨架长度比例约束条件,来矫正一部分偏移较大的关节点,对预测结果进行优化。

流程介绍

训练流程:对一幅深度图,取关节附近的点作为训练集,对这些点提取深度特征,再训练随机森林分类器

736b3266-037d-11ed-ba43-dac502259ad0.png

图3训练流程示意图

测试流程:深度图背景分割得到人体区域图像,使用随机森林分类器对人体的像素点进行分类,选取预测概率大于设定阈值的点,则得到疏密不同的各关节部位像素点,越接近关节点位置,像素点越密,再使用Mean shift算法进行聚类,得到关节点位置

739e8a26-037d-11ed-ba43-dac502259ad0.png

测试流程示意图

运行效果

图4为关节定位算法的运行效果,(a)为NTU数据集中关节点的标准位置;(b)是算法对同一张深度图中关节点的定位结果;(c)为自制的Kinect测试集上的运行效果;(d)为采用公司研制的TOF相机模块拍摄的深度图的运行效果。可以直观地看出定位效果较为良好。TOF相机的分辨率为320*240,因此相同距离下人体在画面中所占比例更大。

73aacc8c-037d-11ed-ba43-dac502259ad0.png

(a) (b)

73c01f6a-037d-11ed-ba43-dac502259ad0.png

(c) (d)

图4 算法运行效果示例

注:

(a)NTU测试集真值,25关节

(b)NTU测试集

(c)自制测试集

(d)TOF相机拍摄图像

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4816

    浏览量

    98811
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137425
  • 深度图像
    +关注

    关注

    0

    文章

    19

    浏览量

    3741

原文标题:3D视觉在人体姿态估计算法的应用

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人形机器人关节扭矩传感器的详细应用场景及解决方案

    )。 碰撞检测与安全保护(所有关节) 场景描述 :人机协作或机器人在家庭、工厂中意外碰撞人体或障碍物。 传感器作用 :检测扭矩突变超过安全阈值,触发紧急停止或阻抗控制回退。 典型需求 :低延迟报警
    发表于 05-20 17:40

    资产定位总飘移?BLE 6.0 CS + 共线算法,专治狭长场景“定位发散”!

    工业走廊、医院通道,机房锚点共线部署导致传统定位误差超2米?致远电子推出ZM24系列BLE6.0模组,自研自适应共线定位算法,无需增加硬件,近共线场景精度优于0.5m,资产盘点效率提升96%!一个让
    的头像 发表于 05-18 11:36 115次阅读
    资产<b class='flag-5'>定位</b>总飘移?BLE 6.0 CS + 共线<b class='flag-5'>算法</b>,专治狭长场景“<b class='flag-5'>定位</b>发散”!

    基于米尔安路飞龙派 MYD-YM90X开发板多功能智能车系统开发

    ; vsync_right; endmoduleFPGA 深度图生成(SGM 立体匹配,硬件加速),实现图像采集、畸变校正、立体匹配、深度图生成的全链路硬件化,端到端延迟 < 50ns
    发表于 04-25 16:23

    机器人主控核心板米尔RK3576 + ROS2,NPU加速实现目标跟随与机械臂抓取

    下通过标准驱动节点发布话题数据。本文使用的RGB-D相机输出三路信息: RGB图像 :用于目标跟踪的视觉输入 IR图像 :辅助深度计算(夜间或弱光可用) 深度图像 :每个像素的毫米级距
    发表于 04-10 21:23

    【智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    ;结合Fly-on-the-fly飞拍技术,在高速运动中完成图像采集与测量,大幅提升效率;依托全景导航与图像匹配技术,实现工件任意摆放下的自动定位与坐标系建立;配合脱机编程与CNC全自动批量测量,支持
    发表于 03-31 17:11

    探索ADSD3500:飞行时间深度图像信号处理器的卓越性能

    探索ADSD3500:飞行时间深度图像信号处理器的卓越性能 在当今科技飞速发展的时代,飞行时间(ToF)技术在众多领域展现出了巨大的应用潜力。而ADSD3500作为一款专业的ToF深度图像信号处理器
    的头像 发表于 03-23 16:15 160次阅读

    微视图灵高精度人体关键点算法成功“落户”算能AI微服务器,公检法、校园与养老场景全面赋能

    在人工智能技术加速落地民生关键领域的今天,微视图灵AI团队研发的新一代高精度人体关键点检测算法,已成功完成在国产信创核心硬件——算能(SOPHGO)AI 微服务器上的深度适配与规模化部署。 此次适配
    的头像 发表于 03-17 10:59 630次阅读
    微视图灵高精度<b class='flag-5'>人体</b>关键点<b class='flag-5'>算法</b>成功“落户”算能AI微服务器,公检法、校园与养老场景全面赋能

    瑞芯微(EASY EAI)RV1126B 人体关键点识别

    1.人体关键点识别简介人体关键点识别是一种基于深度学习的对人进行检测定位与姿势估计的模型,广泛应用于体育分析、动物行为监测和机器人等领域,帮助机器实时解读物理动作。本
    的头像 发表于 01-23 10:13 4206次阅读
    瑞芯微(EASY EAI)RV1126B <b class='flag-5'>人体</b>关键点识别

    华中科技大学:研究面向水陆两栖人体运动识别的柔性多维肌肉形变磁传感阵列

    准确的人体运动识别对于控制可穿戴机器人及虚拟/增强现实等人机交互系统至关重要,而捕获人体运动特征的可穿戴传感设备是实现运动识别的基础(作为运动识别算法的输入)。目前,基于骨骼特征(如关节
    的头像 发表于 11-24 11:39 1110次阅读
    华中科技大学:研究面向水陆两栖<b class='flag-5'>人体</b>运动识别的柔性多维肌肉形变磁传感阵列

    基于级联分类器的人脸检测基本原理

    本次分享的内容是基于级联分类器的人脸检测基本原理 1) 人脸检测概述 关于人脸检测算法,目前主流方法分为两类,一类是基于知识,主要方法包括模板匹配,人脸特征,形状和边缘,纹理特征,颜色特征
    发表于 10-30 06:14

    使用Otsu阈值算法将灰度图像二值化

    Otsu 算法是由日本学者OTSU于1979年提出的一种对图像进行二值化的高效算法,又称“最大类间方差法”。当我们对一个图象进行二值化操作的时候,需要根据一项灰度阈值来判决每个像素点应该被视作纯黑
    发表于 10-28 06:49

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 900次阅读
    基于FPGA的CLAHE<b class='flag-5'>图像</b>增强<b class='flag-5'>算法</b>设计

    ANSA人体模型姿态调整工具介绍

    ANSA的人体模型姿态调整工具(HBM Articulation Tool)通过网格变形技术实现基于人体不同部位进行调节,定位人体模型最终的姿态。
    的头像 发表于 09-28 15:40 2033次阅读
    ANSA<b class='flag-5'>人体</b>模型姿态调整工具介绍

    9米远距离高精准度24G人体存在感知雷达模块

    处理、精确人体感应算法,实现高灵敏度的人体存在状态感应,可识别运动和静止状态下的人体,并可计算出目标的距离等辅助信息。02模块优势人体存在感
    的头像 发表于 09-22 12:04 1472次阅读
    9米远距离高精准度24G<b class='flag-5'>人体</b>存在感知雷达模块

    瑞芯微RK3576人体关键点识别算法(骨骼点)

    人体关键点识别是一种基于深度学习的对人进行检测定位与姿势估计的模型,广泛应用于体育分析、动物行为监测和机器人等领域,帮助机器实时解读物理动作。本算法具有运行效率高、实时性强的特点。
    的头像 发表于 08-27 10:07 1220次阅读
    瑞芯微RK3576<b class='flag-5'>人体</b>关键点识别<b class='flag-5'>算法</b>(骨骼点)