利用卷积神经网络识别对象，估算骨骼模型-电子发烧友网

我们已经介绍过很多单目的动作捕捉方案，最近的单目动捕方案可以说大同小异，在原理上基本没有什么区别，都是利用卷积神经网络识别对象，估算骨骼模型，再在此基础上进行渲染。这些解决方案的困难也都类似，例如老大难的遮挡问题，脚踝处的识别和骨骼模型往往估计不准等等。

最近，清华、北航、南加州大学、马克思普朗克研究所等的研究人员合作了一篇论文DoubleFusion: Real-time Capture of Human Perf ormances with Inner Body Shapes from a Single Depth Sensor，提出了一种叫做DoubleFusion、基于单个深度摄像头的解决方案，对人体动作捕捉识别有更好的效果。

简单地讲，DoubleFusion的原理是这样的，一般深度摄像头的动作捕捉来源于深度数据，因此可以构建人身体的表面形状（即包含衣服在内的外形数据），但这种方案难以在有遮挡的情况下实现捕捉，为了补足深度捕捉的缺憾，DoubleFusion将它和估算骨架模型的方案融合了起来，因此形成了一个“双层表面表示”，外层是深度数据得到的表面重建的数据，内层则是骨架模型数据，最终计算得到最合理的动作数据。我们看到的完整的身体模型，实际上是内外两层数据相互制约、相互融合的结果。

具体来说，DoubleFusion的输入只有捕获的深度数据，而输出是捕捉目标的双层表面。在骨架估计方面，它采用最近出现的基于Mask-RCNN的模型SMPL，可以非常迅速的得到比较完美的骨架模型，在外表数据方面，采用同样是近年来提出的捕获方法DynamicFusion。外表数据生成一个节点图，主要用于判断姿势变化方式，骨架数据同样形成节点图，主要用作判据，尽量避免姿势变化中违法骨骼连接的情况。

那么，这个方案的实际效果如何？

DoubleFusion方案比单方面骨架模型估计的方案效果更好，例如与BodyFusion相比较，后者即使较紧身的衣服也会对结果产生影响，而前者捕捉的结果更为干净、完整；另外DoubleFusion的每帧最大误差更小，而且平均误差也较小，在捕捉快速运动期间表现也要更好，还有，实时重建的身体形状和显示的目标穿着看起来也要更合理一些。

从性能上来说，测试环境中，DoubleFusion每一帧执行6次ICP迭代，进行关节运动跟踪需要21毫秒，9毫秒用于体积形状和身体姿态的优化；另外，输入的深度数据属于异步运行处理，算上运行时间不到1毫秒，综合下来基本是每帧32毫秒。

然而，这种解决方案还是存在限制，例如，当用户穿着较厚的衣服时，这个方案在捕捉过程中会将衣服的厚度都当成人的身体来计算，导致身体建模的误差出现；另外，目前的方案还无法处理人物对象之间的交互，不过按照论文的说法，这将会在未来的研究中得到解决。

最后，必须要说的是，这篇论文提出的解决方案效果可能比较好，但要实现它，深度摄像头至少是必须品，而现在的市场上仍然有很大一部分智能手机没有深度摄像头，否则之前的普通摄像头单目动捕也不至于备受关注。从这个方面来说，论文中解决方案的实用价值可能并没有我们想象中那么大。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

智能手机

智能手机

+关注

关注
66

文章
18041

浏览量
177011
神经网络

神经网络

+关注

关注
42

文章
4562

浏览量
98646
摄像头

摄像头

+关注

关注
59

文章
4599

浏览量
92833

原文标题：DoubleFusion：深度和骨架结合的解决方案

文章出处：【微信号：ARchan_TT，微信公众号：AR酱】欢迎添加关注！文章转载请注明出处。

卷积神经网络如何使用

卷积神经网络(CNN)究竟是什么，鉴于神经网络在工程上经历了曲折的历史，您为什么还会在意它呢? 对于这些非常中肯的问题，我们似乎可以给出相对简明的答案。

发表于 07-17 07:21

可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别

我们可以对神经网络架构进行优化，使之适配微控制器的内存和计算限制范围，并且不会影响精度。我们将在本文中解释和探讨深度可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别的潜力

发表于 07-26 09:46

卷积神经网络模型发展及应用

network，DBN）[24]，从此拉开了深度学习大幕。随着深度学习理论的研究和发展，研究人员提出了一系列卷积神经网络模型。为了比较不同模型的质量，收集并整理了文献中

发表于 08-02 10:39

卷积神经网络简介：什么是机器学习？

列文章将只关注卷积神经网络 （CNN）。CNN的主要应用领域是输入数据中包含的对象的模式识别和分类。CNN是一种用于深度学习的人工神经网络。

发表于 02-23 20:11

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

发表于 08-17 16:30 •889次阅读

卷积神经网络的应用卷积神经网络通常用来处理什么

的前馈神经网络，卷积神经网络广泛用于图像识别、自然语言处理、视频处理等方面。本文将对卷积神经网络

发表于 08-21 16:41 •3895次阅读

卷积神经网络模型原理卷积神经网络模型结构

卷积神经网络模型原理卷积神经网络模型结构卷积

发表于 08-21 16:41 •650次阅读

卷积神经网络如何识别图像

为多层卷积层、池化层和全连接层。CNN模型通过训练识别并学习高度复杂的图像模式，对于识别物体和进行图像分类等任务有着非常优越的表现。本文将会详细介绍

发表于 08-21 16:49 •1397次阅读

卷积神经网络的介绍什么是卷积神经网络算法

卷积神经网络的介绍什么是卷积神经网络算法卷积神经网络涉及的关键技术

发表于 08-21 16:49 •1406次阅读

卷积神经网络算法流程卷积神经网络模型工作流程

卷积神经网络算法流程卷积神经网络模型工作流程卷积神经网

发表于 08-21 16:50 •1495次阅读

常见的卷积神经网络模型典型的卷积神经网络模型

LeNet是卷积神经网络的开山祖师，是由Yan LeCunn在1998年提出的经典卷积神经网络模型。它最初是为手写体数字

发表于 08-21 17:11 •1912次阅读

图像识别卷积神经网络模型

图像识别卷积神经网络模型随着计算机技术的快速发展和深度学习的迅速普及，图像识别卷积

发表于 08-21 17:11 •527次阅读

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型

cnn卷积神经网络模型卷积神经网络预测模型生成卷积

发表于 08-21 17:11 •794次阅读

卷积神经网络模型搭建

卷积神经网络模型搭建卷积神经网络模型是一种深度学习算法。它已经成为了计算机视觉和自然语言处理等

发表于 08-21 17:11 •603次阅读

卷积神经网络模型的优缺点

卷积神经网络模型的优缺点卷积神经网络（Convolutional Neural Network，CNN）是一种从图像、视频、声音和一系列

发表于 08-21 17:15 •2206次阅读

搜索历史

利用卷积神经网络识别对象，估算骨骼模型

评论

卷积神经网络如何使用

可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别

卷积神经网络模型发展及应用

卷积神经网络简介：什么是机器学习？

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

卷积神经网络的应用卷积神经网络通常用来处理什么

卷积神经网络模型原理卷积神经网络模型结构

卷积神经网络如何识别图像

卷积神经网络的介绍什么是卷积神经网络算法

卷积神经网络算法流程卷积神经网络模型工作流程

常见的卷积神经网络模型典型的卷积神经网络模型

图像识别卷积神经网络模型

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型

卷积神经网络模型搭建

卷积神经网络模型的优缺点