一项将2D RGB图像的所有人类像素实时映射至3D模型的技术—

我们已经介绍过很多仅用RGB相机进行动作捕捉的研究了，其中大多数是模拟出骨骼进行追踪，少数则是通过模拟出的骨骼套上一个粗糙的模型，便可称为3D模型了。

近日，Facebook AI Reaserch（FAIR）开源了一项将2D RGB图像的所有人类像素实时映射至3D模型的技术——DensePose，而且采用的也不是我们经常介绍的骨骼追踪，而是一种十分密集的方案追踪来构建3D模型。

在户外和穿着宽松衣服的也表现良好。

还支持多人同时追踪。

那这个密集如何来理解呢？

对于一般的骨骼追踪，追踪的点大多在十到二十个之间，再多也没有多少实际的效果。而DensePose所追踪的点一共有336个，密密麻麻全身都是点。（密集恐惧症退避）

之所以要追踪这么多的点，是构建一个平滑流畅的3D模型所必须的数据。

辛苦的付出也是值得的，DensePose无论是在户外还是多人下都表现良好，还能实时更换场景中人的衣服。

那就来看看他们是怎么做到的吧。

为了让机器可以学习，研究人员手动标记了5万张照片中的336个点，光这个步骤就是一个巨大的工程了，如果按部就班的标记注释，不知道要到什么时候完成了。

研究人员将一个人拆分成了24个部分，分别为头、躯干上部、躯干下部、大臂、小臂、大腿、小腿、手、脚。每个部分标记14的点。

对于头部、手部、脚部都由人手动标记。同时还要求注释者在标记的时候标出被衣物掩盖住的部位，比如宽松的裙子。

这些工作做完后进入第二阶段，研究人员对每一个展开部位区域进行采样，会获得6个不同的标记图，提供二维坐标地图使标记者更直观的判断哪个标记是正确的。

最后再将平面重新组合成3D模型，进行最后一步校准。

这样两步下来，研究人员得以高效准确的获得了准确的标记。不过在躯干、背部还有臀部有较大的误差。

接下来就是深度学习的阶段了，这时一个好的方案就好比性能优越的催化剂。

研究人员采用与Mask-RCNN架构的DenseReg类似的方法，构成了'DensePose-RCNN'系统，还进一步开发使得训练的准确度提高。首先由外观粗略的估算像素所在的位置，然后将其与准确的坐标对齐。

DenseReg MaskRCNN的关键点分支中使用相同的体系结构，由8个交替的3×3完全卷积和512个通道的ReLU层组成。得益于Caffe2，所产生的架构实际上与Mask-RCNN一样快。

为了降低错误率，还训练了一个“教师”网络来重建地面，部署它完整的图像域，产生一个密集的监督信号。研究人员将人类监督者半自动监督和“教师网络”进行对比，结果是“教师”完胜。

研究人员还将其方法与SMPLify进行了对比，在模型的模拟方面，研究人员的自下而上的前馈方法在很大程度上胜过了迭代的模型拟合结果。

同时在多人处理时，FCN明显差于'DensePose-RCNN，再与其他方案比较时优势也十分突出。

最后，整体呈现的效果如开头所讲，能够处理大量遮挡物，成功的模拟出了衣服后面的人，但有一点需要注意，那就是所有人都是通过固定的曲率拟合的。而且在多人状况下表现十分良好。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Facebook

Facebook

+关注

关注
3

文章
1428

浏览量
54040
3D模型

3D模型

+关注

关注
1

文章
67

浏览量
15586
深度学习

深度学习

+关注

关注
73

文章
5240

浏览量
119936

原文标题：Facebook最新开源，普通RGB相机即可实时映射3D模型

文章出处：【微信号：ARchan_TT，微信公众号：AR酱】欢迎添加关注！文章转载请注明出处。

包含具有多种类型信息的3D模型

项目阶段集成在一起。同时，还提供易于使用的数据交换，可在2D和3D工作方法之间快速切换，以提供具有程序精度的高质量信息。其他常用于支持建筑信息建模的相关平台 Autodesk

发表于 03-28 17:18

[原创]“立体视”与新概念3D电视机制造（摘要）

人群中。它特指当人眼以适当方式捕获通常的2D图像时可以实时动态解析其中所包含的空间信息并产生正确的立体觉。据此，我们可以制造一种全新概念的3D

发表于 01-27 21:56

3D LED液晶电视设计方案

2D信号等功能。图4 ECT223H信号处理框图　　信号模块的功能：　　60Hz的信号先经过2D检测分析将不同运动速度的信号进行特定的同静态算法分析处理；2D转换3D模块

发表于 07-11 18:05

Labview 3D模型

新手求助……有没有哪位大神会利用labview显示3D模型（含装配体，需要转动不同的部位）吗？是用3D传感器映射啊？

发表于 08-26 01:20

针对显示屏的2D/3D触摸与手势开发工具包DV102014

GestIC传感技术，将2D多点触摸和3D手势识别功能轻松集成至其显示应用中。由于采用了基于电场的技术

发表于 11-07 10:45

如何同时获取2d图像序列和相应的3d点云？

如何同时获取2d图像序列和相应的3d点云？以上来自于谷歌翻译以下为原文How to obtain the sequence of 2d image and corresponding

发表于 11-13 11:25

为什么3D与2D模型不能相互转换？

AD17.1.5软件，3D与2D模型不能相互转换，按3可以进入3D模型，按

发表于 09-20 05:35

PYNQ框架下如何快速完成3D数据重建

的瓶颈。为这两个OpenCV函数创建一个覆盖层也是这个项目未来工作的一部分。　　4.3D到2D投影　　生成投影2D

发表于 01-07 17:25

AD的3D模型绘制功能介绍

完成后，2D图如下：　　　　2D图　　我们按下键盘上的数字3，即可查看绘制的3D模型了，如图（4）。　　　　图（4）0805电阻

发表于 01-14 16:48

如何促使2D和3D视觉检测的性能成倍提升？

本文介绍的三个应用案例展示了业界上先进的机器视觉软件和及其图像预处理技术如何促使2D和3D视觉检测的性能成倍提升。

发表于 02-22 06:56

3D制图软件如何进行多CAD混合设计？

一体化。2D到3D数据的高效转化浩辰3D可以直接打开DWG和DXF图纸来进行编辑绘图，并且可以通过快速建模设计环境将DWG图纸直接转化为

发表于 02-24 17:22

浩辰3D的「3D打印」你会用吗？3D打印教程

设计。由浩辰CAD公司研发的浩辰3D作为从产品设计到制造全流程的高端3D设计软件，不仅能够提供完备的2D+3D一体化解决方案，还能一站式集成

发表于 05-27 19:05

使用DLP技术的3D打印

使用DLP技术的3D打印光固化成形法 (SLA)，一个常见的3D打印工艺，与传统打印很相似。与硒鼓将碳粉沉积在纸张上很类似，

发表于 11-18 07:32

视觉处理，2d照片转3d模型

首先，太阳高度是恒定的。照片每像素的亮度可求。我们只需要求出太阳与眼睛到物体的夹角就能求出3d模型。最多就是各种物质的反射率。英伟达的oir芯片就是做汽车视觉的，大家去取取经。有时，2

发表于 05-21 17:13

实时3D艺术最佳实践-纹理技术解读

纹理贴图获取2D曲面图像并将其映射到3D多边形上。本指南涵盖了几种纹理优化，可以帮助您的游戏运行得更流畅、看起来更好。在本指南的最后，您可以检查您的知识。您将了解有关主题，包括纹理

发表于 08-02 06:12

搜索历史

一项将2D RGB图像的所有人类像素实时映射至3D模型的技术——DensePose

评论

包含具有多种类型信息的3D模型

[原创]“立体视”与新概念3D电视机制造（摘要）

3D LED液晶电视设计方案

Labview 3D模型

针对显示屏的2D/3D触摸与手势开发工具包DV102014

如何同时获取2d图像序列和相应的3d点云？

为什么3D与2D模型不能相互转换？

PYNQ框架下如何快速完成3D数据重建

AD的3D模型绘制功能介绍

如何促使2D和3D视觉检测的性能成倍提升？

3D制图软件如何进行多CAD混合设计？

浩辰3D的「3D打印」你会用吗？3D打印教程

使用DLP技术的3D打印

视觉处理，2d照片转3d模型

实时3D艺术最佳实践-纹理技术解读