0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3D 点云的无监督胶囊网络 多任务上实现SOTA

工程师邓生 来源:机器之心Pro 作者:杜伟、小舟 2021-01-02 09:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这是一种为 3D 点云提出的无监督胶囊架构,并且在 3D 点云重构、配准和无监督分类方面优于 SOTA 方法。

理解对象是计算机视觉的核心问题之一。传统方法而言,理解对象任务可以依赖于大型带注释的数据集,而无监督方法已经消除了对标签的需求。近来,研究人员试图将这些方法扩展到 3D 点云问题上,但无监督 3D 学习领域却进展寥寥。

近日,包括 Weiwei Sun、Andrea Tagliasacchi、Geoffrey Hinton 等来自英属哥伦比亚大学、谷歌研究院、多伦多大学的研究者提出了用于 3D 点云的无监督胶囊网络。Hinton 对此表示:在不受监督的情况下找到一个对象的自然组件以及这些组件的内在参照系是学习将解析图像转换为局部整体层级结构的重要一步。如果以点云开始,则可以做到。

具体而言,研究者通过排列等变(permutation-equivariant)的注意力计算对象的胶囊分解,并通过训练成对的随机旋转对象来自监督该过程。本研究的核心思想是将注意力掩模聚合为语义关键点,并使用它们来监督满足胶囊不变性或等方差的分解。这不仅可以训练语义上一致的分解,还能够学习以对象为中心的推理的规范化操作。在这种情况下,既不需要分类标签,也不需要手动对齐的训练数据集进行训练。

最后,通过以无监督的方式学习以对象为中心的表征,该方法在 3D 点云重构、配准和无监督分类方面优于 SOTA 方法。研究者表示将很快公布源代码和数据集。

4eaf897ed7574ed59f400ace87532372.png

论文链接:https://arxiv.org/abs/2012.04718

项目主页:https://canonical-capsules.github.io/

方法

该网络在未对齐的点云上进行训练,如下图 2 所示:研究者训练了一个将点云分解为多个组件的网络,并通过 Siamese 训练设置实现不变性 / 等方差。

5bebc405bb414dbb9a5dce0bc059afeb.png

然后研究者将点云规范化为学习的参照系,并在该坐标空间中执行自动编码。

损失

正如无监督方法中常见的那样,该研究的框架依赖于大量的损失,这些损失控制着力图在表征中获得的不同特征。请注意所有这些损失是如何不受监督且不需要标签的。研究者根据他们监督的网络部分组织损失,包括分解、规范化和重建。

网络架构

研究者简要介绍了实现细节,包括网络架构。

编码器 E。我们的架构是基于 [42] 提出一种类似于点网的架构,具有残差连接和注意力上下文归一化;

解码器 D。公式 (4) 中的解码器基于每个胶囊运行。本研究采用的解码器架构类似于 AtlasNetV2 [13](带有可训练的网格)。不同之处在于本研究通过相应的胶囊姿态转换每个胶囊的解码点云;

dbd4a1f441fd4c9a89d4d0aa1c45b1c3.png

回归器 K。研究者只需连接描述符,并通过 ReLU 激活函数调用一系列全连接层,以回归 P 胶囊定位。在输出层,研究者使用线性激活函数,并进一步减去输出平均值,以使回归位置在规范化框架中以零为中心(zero-centered);

规范化描述符。由于本研究的描述符只是近似旋转不变(通过扩展),研究者发现在规范化之后重新提取胶囊描述符β_k 很有用。

实验及结果

自动编码

研究者针对两个训练基线(在单类别和多类别变体中经过了训练)评估了用于训练网络任务(重建 / 自动编码)的方法的性能:

AtlasNetV2 [13],一种使用基于补丁(patch-based)多头解码器的 SOTA 自动编码器;

3D-PointCapsNet [58],一种利用胶囊架构的 3D 点云自动编码器。

下表 1 是定量分析的结果,本文方法在对齐和未对齐的设置下均取得了 SOTA 的性能结果。

7d47aedc4e5d4d9f89153a3912802b6d.png

下图 3 是定性分析的结果。研究者给出了基于分解的 3D 点云重建方法以及 3D-PointCapsNet [58]、AtlasNetV2 [13]的重建结果。

f08ee44ceab24b2fb22d4217aee82c19.jpeg

配准

研究者在配准 3D 点云的能力方面评估了该方法的性能,并与以下 3 个基准进行了比较:

Deep Closest Points (DCP) [52]:一种基于深度学习的点云配准方法;

DeepGMR–RRI [56],一种 SOTA 方法,该方法可以将云分解为具有旋转不变特征的高斯混合;

DeepGMR–XYZ [56],其中将原始 XYZ 坐标用作输入,而不使用旋转不变特征;

本研究采用的变体方法 RRI,其中使用 RRI 特征 [6] 作为该架构的唯一输入。本文使用 RRI 特征的方法遵循 DeepGMR 训练协议,并训练 100 个周期,而对于 DCP 和 DeepGMR,本研究使用了原作者的官方实现。定量分析的结果如下表 2 所示:

f7a4ad2beb7e4ee394eb40f5d523d540.png

无监督分类

除了重建和配准(这两者是与训练损失直接相关的任务)之外,本研究还通过分类任务评估了方法的有效性,该分类任务与训练损失没有任何关系。结果如下表 3 所示,本文方法均实现了 SOTA 的 Top-1 准确率。

6ca8fd7c6ef74954b39d2ea9f3b673cd.png

控制变量实验

此外,为了进一步分析规范化胶囊(Canonical Capsules)的不同组件对性能的影响,本研究进行了一系列控制变量实验,结果如下表 4、表 6、表 7 所示:

74e0564e8a694571bda86714282352a4.png

表 4:损失的影响。

9d4ee60782ac40cd8ace2a6e714b3355.png

表 6:规范描述符的有效性。

2f6de421c8d845359ac147b7ebea0952.png

表 7:点的数量对性能的影响。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    3037

    浏览量

    115910
  • 云计算
    +关注

    关注

    39

    文章

    8061

    浏览量

    145055
  • 网络
    +关注

    关注

    14

    文章

    8392

    浏览量

    95752
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    昆泰芯 KTH5701AQ3 三轴霍尔传感器 集成硬件解算 极简实现 3D 姿态与角度检测

    昆泰芯KTH5701AQ3三轴霍尔传感器,搭载硬件 CORDIC 算法,实现 MCU 运算的多平面角度直出,解决传统电位器易磨损、精度漂移的痛,为智能穿戴、非接触电位器、
    的头像 发表于 04-29 15:38 370次阅读
    昆泰芯 KTH5701AQ<b class='flag-5'>3</b> 三轴霍尔传感器 集成硬件解算 极简<b class='flag-5'>实现</b> <b class='flag-5'>3D</b> 姿态与角度检测

    英伦科技光场裸眼3D笔记本重磅新!解锁光场技术“镜”3D新体验!

    期待已久的英伦科技光场裸眼3D笔记本终于新了! 这款集结多项黑科技的硬核产品,直接把3D显示体验拉到了天花板,不管是专业工作还是娱乐放松,都能给你带来前所未有的沉浸感。
    的头像 发表于 04-17 15:48 414次阅读
    英伦科技光场裸眼<b class='flag-5'>3D</b>笔记本重磅<b class='flag-5'>上</b>新!解锁光场技术<b class='flag-5'>无</b>“镜”<b class='flag-5'>3D</b>新体验!

    倍加福基于双目视觉技术的SmartRunner 3D传感器介绍

    当我们迈入自动化的“三维时代”,SmartRunner Explorer 3D不仅能生成清晰的2D图像,还可输出高精度的3D数据。
    的头像 发表于 04-08 10:39 455次阅读
    倍加福基于双目视觉技术的SmartRunner <b class='flag-5'>3D</b>传感器介绍

    一文说透了如何实现单片机的多任务并发!

    在嵌入式系统开发中,多任务并发是非常常见的,对于处理复杂的应用场景、提升系统的并发能力、提高系统的实时性等方面都有很大好处。在单片机中实现多任务并发是非常重要的,本文将为大家介绍如何在单片机中
    发表于 01-06 06:46

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:开启3D磁传感器评估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:开启3D磁传感器评估之旅 在电子工程师的日常工作中,评估和开发磁传感器是一项常见且重要的任务。英飞凌(Infineon
    的头像 发表于 12-18 17:15 1495次阅读

    2025 3D机器视觉的发展趋势

    迭代与应用拓展成为市场的主要推动力:·技术升级:视觉系统从单一任务的2D相机向多功能3D相机进化。过去用2D相机完成单一任务,如今用户更愿意
    的头像 发表于 12-10 17:25 1500次阅读
    2025 <b class='flag-5'>3D</b>机器视觉的发展趋势

    iSUN3D即将推出单组分弹性树脂3D打印解决方案!

    iSUN3D将在Formnext 2025发布单组分弹性树脂3D打印方案,覆盖设计到交付全流程,解决柔弹性制造成本与效率痛,现场可体验高速打印与限量礼品。
    的头像 发表于 11-17 11:45 1004次阅读
    iSUN<b class='flag-5'>3D</b>即将推出单组分弹性树脂<b class='flag-5'>3D</b>打印解决方案!

    【CIE全国RISC-V创新应用大赛】+基于MUSE Pi Pro的3d激光里程计实现

    基于MUSE Pi Pro的3D激光里程计实现技术文档 内容摘要 本文档详细介绍了基于MUSE Pi Pro开发板和速腾聚创Airy 96线激光雷达实现3D激光里程计系统的完整技术方案
    发表于 10-24 17:02

    玩转 KiCad 3D模型的使用

    时间都在与 2D 的焊盘、走线和丝印打交道。但一个完整的产品,终究是要走向物理世界的。元器件的高度、接插件的朝向、与外壳的配合,这些都是 2D 视图难以表达的。 幸运的是,KiCad 提供了强大的 3D 可视化功能。它不仅能让你
    的头像 发表于 09-16 19:21 1.2w次阅读
    玩转 KiCad <b class='flag-5'>3D</b>模型的使用

    AD 3D封装库资料

     AD  PCB 3D封装
    发表于 08-27 16:24 9次下载

    3D激光轮廓仪可实现在线3D测量和检测

    Z-Trak™ Express 1K5 系列专为实现经济高效的在线3D测量和检测而设计,具有高速检测能力和实时处理性能。
    的头像 发表于 08-08 17:17 1223次阅读
    <b class='flag-5'>3D</b>激光轮廓仪可<b class='flag-5'>实现</b>在线<b class='flag-5'>3D</b>测量和检测

    光子精密双目3D线激光轮廓测量仪,摆脱视觉盲区,1台更比2台强!

    光子精密双目3D线激光轮廓测量仪(GL-8160D),在GL-8000系列的基础创新升级。GL-8160D采用全新双目单线设计,突破传统3D
    的头像 发表于 07-16 17:21 1654次阅读
    光子精密双目<b class='flag-5'>3D</b>线激光轮廓测量仪,摆脱视觉盲区,1台更比2台强!

    TechWiz LCD 3D应用:FFS仿真

    建模任务 堆栈结构 建模过程 2.1使用TechWiz Layout绘制各层掩模版平面图 2.2创建堆栈结构,并生成3D结构 2.3 使用TechWiz LCD 3D进行各项参数计算 3
    的头像 发表于 07-14 14:08 1023次阅读
    TechWiz LCD <b class='flag-5'>3D</b>应用:FFS仿真

    TechWiz LCD 3D应用:局部液晶配向

    ,本案例使用TechWiz LCD 3D进行局部摩擦的设置。 1. 建模任务 1.1进行局部摩擦配置 2. 建模过程 以下是建模过程中部分重要步骤的说明 2.1在TechWiz Layout中创建结构
    发表于 06-16 08:46

    TechWiz LCD 3D应用:微液晶分子摩擦排布

    ) 结构创建完成后在TechWiz LCD 3D中加载并进行相关参数设置 2.2在TechWiz LCD 3D软件中设置微扰方式为用户自定义,并设置微扰角度 2.3其它设置 此例仅对比使用微扰方式
    发表于 06-10 08:44