0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

15倍加速!SuperCluster:最强3D点云全景分割!

3D视觉工坊 来源:3D视觉工坊 2024-01-22 14:03 次阅读

1. 写在前面

今天笔者为大家推荐一篇最新的开源工作SuperCluster,实现了大型三维点云的全景分割,可以在一次推理中处理包含数百万个点和数千个对象的场景。在仅有209k个参数的情况下,SuperCluster比SOTA方法小30多倍,训练速度快15倍。

下面一起来阅读一下这项工作

2. 摘要

通过将该任务重新定义为可扩展的图聚类问题,我们介绍了一种高效的方法用于大型三维点云的全景分割。该方法可以仅使用局部辅助任务进行训练,从而省去了训练过程中资源密集型的实例匹配步骤。此外,我们的公式可以很容易地适应超点范式,从而进一步提高其效率。这使得我们的模型可以在一次推理中处理包含数百万个点和数千个对象的场景。我们的方法,称为SuperCluster,在两个室内扫描数据集上取得了最新的全景分割性能:S3DIS Area 5为50.1 PQ ( + 7.8 ),ScanNetV2为58.7 PQ ( + 25.2 )。我们还为两个大规模移动建图基准:KITTI - 360和DALES设置了第一个最先进的基准。在仅有209k个参数的情况下,我们的模型比最好的竞争方法小30多倍,训练速度快15倍。

3. 效果展示

S3DIS Area 5的大规模全景分割结果,共有9.2 M个点( 78M预采样)和1863个真实"物"对象。SuperCluster可以在3.3秒内在单块V100 - 32GB GPU上一次推理处理如此大的扫描,并达到50.1的PQ值。

faa05c00-b8c3-11ee-8b88-92fbcf53809c.jpg

四个数据集的全景预测结果。

faae49be-b8c3-11ee-8b88-92fbcf53809c.jpg

4. 具体原理是什么?

SuperCluster对一个包含两个物体(椅子和沙发)的简化场景的操作顺序:子图( a )展示了第一阶段,其中点云被分割成具有简单几何形状的连通超点。在子图( b )中,预测每个超点的语义类分布。在子图( c )中,预测每一对相邻超点的对象一致性,表明它们属于同一个对象的可能性。子图( d )展示了一个图聚类问题的输出,该问题在对象之间的转换处切割边的同时,合并了具有兼容类分布和对象一致性的超点。由此产生的超点簇定义了全景3D分割的实例。

fab75dec-b8c3-11ee-8b88-92fbcf53809c.jpg

超点对象Agreement:对每一对相邻的超点( s , t)计算一个对象一致性分数。这个值是由s和t以及它们的多数对象obj ( t )和obj ( s )之间的平均重叠率定义。

fac5a8ca-b8c3-11ee-8b88-92fbcf53809c.jpg

5. 和其他SOTA方法的对比

S3DIS Area 5上SOTA语义分割方法的语义( SS )和全景分割结果,提供了两个全景度量,将所有类别视为"事物" ( PS -- no "stuff"),将墙壁、天花板和地板视为"物品" ( PS )。

faccebd0-b8c3-11ee-8b88-92fbcf53809c.jpg

6. 总结

这篇文章引入了SuperCluster,一种用于大规模点云的三维全景分割的新方法。作者将这个任务设计为可扩展的图聚类问题,绕过了当前全景分割方法中的一些计算密集型步骤。SuperCluster在S3DIS,ScanNet,KITTI - 360和DALES在内的多个基准测试集上达到了最先进的性能,同时显著地更小,可扩展,更容易训练。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4424

    浏览量

    126724
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24356

原文标题:15倍加速!SuperCluster:最强3D点云全景分割!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    酷毙了的全景汽车3D视频

    `半年前在新浪科技上看到报道的这款纯电动汽车SIM-CEL,外形和性能一样非常酷,昨天参加富士通半导体的汽车技术研讨会,才知道这家公司率先用了他们的360度全景3D行车视频功能,这个功能真的非常帅
    发表于 12-26 14:31

    【盈鹏飞EVB-T335开发板试用体验】NO.3 舵机3D打印

    最近入手了一台3D打印机正好做的项目又和摄像头相关于是就3D打印了舵机3D文件我放在附件里了最后拼好了大概是这个样子注明一下,上面的图是别人的图,我自己刚刚打印好的
    发表于 10-02 23:20

    3D扫描的结构光

    采集为一个由X,Y和Z坐标(表示物体外部表面)组成的。对于一个3D扫描的分析可以确定被扫描物体的表面积、体积、表面形状、外形和特征尺寸。 一个3D扫描仪需要一个探针来确定到物体表面
    发表于 08-30 14:51

    采用DLP技术的3D机器视觉参考设计包括BOM

    3D 。高度差异化 3D 机器视觉系统利用 DLP®(...)主要特色 集成型 API 和针对 DLP 芯片组的驱动程序支持,可实现快速以及可编程图形针对同步捕捉的集成型摄像机支
    发表于 10-12 15:33

    如何同时获取2d图像序列和相应的3d

    如何同时获取2d图像序列和相应的3d?以上来自于谷歌翻译以下为原文How to obtain the sequence of 2d im
    发表于 11-13 11:25

    PYNQ框架下如何快速完成3D数据重建

    演进行计时。对于作者定制的3D到2D投影算法,又设计了一个覆盖层来加速乘法累加(MAC)操作,然后通过Jupyter笔记本在PYNQ板上进行测试。未来将为视频输入设计自定义覆盖,以加速
    发表于 01-07 17:25

    3D制图软件中多体设计的使用技巧

    、STEPS分割单体在3D设计过程中,我们总会遇到需要对零部件进行局部处理的情况。以往使用传统的3D制图软件进行局部处理时,免不了会影响模型整体的设计,给设计工作带来困扰,而通过浩辰3D
    发表于 02-04 17:18

    倍加福UC2000-L2-I-V15

    福KFD2-STC5-2倍加福KFD2-STC4-1.2O?倍加福隔离栅/KFD2-UFC-Ex1.D倍加福编码器ENI58IL-H12BA5-1024UD1-RC1
    发表于 03-08 10:41

    格式主要有哪几种

    由于数据的量非常大,cesium在显示海量数据的时候就非常的吃力,因此需要用到3dtiles。3D Tiles=lod+gltf,专门为大量数据流式传输和海量渲染而设计的一种格式。
    发表于 07-12 07:48

    倍加福倾角传感器INX360D-F99-U2E2-V15

    INX360D-F99-U2E2-V15电缆连接器 V15-W-2M-PUR (弯头电缆连接器 V15-G-2M-PUR (直头)倍加福ML100-8-1000-RT/95/103
    发表于 07-27 11:02

    倍加福倾角传感器INX360D-F99-U2E2-V15

    INX360D-F99-U2E2-V15电缆连接器 V15-W-2M-PUR (弯头电缆连接器 V15-G-2M-PUR (直头)倍加福ML100-8-1000-RT/95/103
    发表于 08-03 13:50

    倍加福倾角传感器INX360D-F99-U2E2-V15

    INX360D-F99-U2E2-V15电缆连接器 V15-W-2M-PUR (弯头电缆连接器 V15-G-2M-PUR (直头)倍加福ML100-8-1000-RT/95/103
    发表于 08-10 14:22

    倍加福倾角传感器INX360D-F99-I2E2-V15

    福RVI58N-011K1R61N-01024 倍加福PVM58N-011AGR0BN-1213倍加福PVM58N-032AGR0BN-1213倍加福传感器NBN4-F29-E2 倍加
    发表于 09-07 11:14

    面向3D机器视觉应用并采用DLP技术的精确生成参考设计

    3D 。高度差异化 3D 机器视觉系统利用 DLP® LightCrafter™ 4500 估模块 (EVM)(采用 DLP® 0.45 英寸 WXGA 芯片组),能够灵活控制工
    发表于 09-22 10:20

    使用结构光的3D扫描介绍

    控制、医疗、牙科和原型设计。 3D扫描是提取一个物体的表面和物理测量,并用数字的方式将其表示出来。这些数据被采集为一个由X,Y和Z坐标(表示物体外部表面)组成的。对于一个3D扫描的
    发表于 11-16 07:48