0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于深度学习的收集透明物体深度数据的光学传感器算法

电子设计 来源:DeepTech深科技 作者:DeepTech深科技 2020-12-23 11:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器人计算机视觉领域,光学 3D 距离传感器已经得到了广泛应用,比如 RGB-D 摄像头和 LIDAR 传感器,都在 3D 环境绘制和无人驾驶等任务中扮演了重要角色。

尽管它们性能十分强大,兼具高敏感度、高精度和高可靠性等特质,但在识别透明物体上却不尽如人意。想要破坏这些传感器的成像效果,或者让机械手臂无从下手,只需要在它们面前放上玻璃杯一类的透明物体就可以了,因此难以在不使用其他传感器的情况下独立完成特定任务。

这是因为光学传感器算法假设所有表面均是理想散射的 (Lambert),即物体会在各个方向和各个角度均匀地反射光线。在 Lambert 光照模型中,无论观察者的视角如何,其表面亮度都是相同的。

现实中的绝大多数物体符合这一假设,除了透明物体,因为它们的表面既折射又反射光线。这样一来,光线传播的复杂性大幅提升,表面亮度与视角无关的假设被破坏了,基于 Lambert 模型的算法也就失效了,导致传感器收集的透明物体的大多数深度数据都是噪声或者无效的。

图 | 透明物体在传统算法眼中是噪声(来源:谷歌 AI

为了改善这一问题,让机器可以更好地感知透明表面,谷歌 AI,Synthesis AI 和哥伦比亚大学的研究人员合作开发了一种名为 ClearGrasp 的机器学习算法,能够从 RGB-D 图像中估算透明物体的准确 3D 数据。

根据谷歌 AI 介绍,在设计之初,ClearGrasp算法就考虑到了兼容性。它可以与任何标准 RGB-D 相机捕捉的数据配合使用,借助神经网络深度学习来准确地重建透明物体的景深数据。

图 | ClearGrasp 算法的工作原理(来源:谷歌 AI)

与目前所使用的技术不同,ClearGrasp 算法不依赖于对透明物体的先验知识,比如预先对透明物体进行 3D 建模,还要补充观察视角和光线数据。在神经网络的帮助下,它可以很好地泛化到从未见过的全新物体身上。

在测试过程中,研究人员将新算法集成到了一套现有的拾取机器人控制系统中,最终发现它对透明塑料物体的抓取成功率有了非常显著的提升,最多可以提升 6 倍。未来有望在拾取机器人和自动驾驶等领域应用。

透明对象的可视数据集

无论是什么样的深度学习模型,训练时都要依赖于大量数据,比如训练自然语言模型 BERT 需要维基百科,ClearGrasp 也不例外。然而目前广泛使用的 3D 数据集,包括 Matterport3D 和 ScanNet,都会忽略透明表面和物体,因为标记过程过于复杂和耗时。

这让研究人员不得不自己创建训练集和测试集,专门针对透明对象设计。

在训练数据集中,他们创造了 5 万多个符合真实物理原则的渲染图,每张图片最多包含 5 个透明物体,放置于平面上或者开放式容器中,视角、背景和光线各不相同。每个物体还有配套的表面法线(曲率)、分割蒙版、边缘和深度等信息,用于训练各种 2D 和 3D 物体检测任务。

至于测试集,研究团队选择用真实场景创建图片和数据,方便最大程度上测试算法的真实表现。这是一个十分痛苦的过程,因为对于每个场景都要在保证视角、光线和场景布置完全一致的情况下照两遍:第一遍用透明物体,第二遍用一模一样的非透明物体替换它们(必须保证位置完全一样)。

最终他们得到了 286 个真实场景测试图,其中不仅包括透明物体本身,还有各种不同的背景贴图和随机不透明物体。图片中既包含训练集中存在的已知对象,也包括从未出现过的新物体。

在数据集的问题解决之后,下一步是思考如何收集透明物体的深度数据。

虽然在透明物体上,RGB-D 经典的深度估算方法无法给出准确数据,但仍然有一些蛛丝马迹暗示了物体的形状。最重要的一点是,透明表面会出现镜面反射,在光线充足的环境中会显示成亮点,在 RGB 图像中非常明显,而且主要受到物体形状的影响。

因此,卷积神经网络可以利用这些反射数据推断出准确的表面法线,然后将其用于深度估算。

另一方面,大多数机器学习算法都尝试直接从单眼 RGB 图像中估计深度,不过即使对于人类而言,这也是一个困难的任务。尤其在背景表面比较平滑时,现有算法对深度的估计会出现很大的误差。这也会进一步加大透明物体深度的估算误差。

基于此,研究人员认为与其直接估算透明物体深度,不如矫正 RGB-D 相机的初始深度估算数据。这样更容易实现,还可以通过非透明表面的深度来推算透明表面的深度。

ClearGrasp 算法

ClearGrasp 算法使用了三个神经网络:一个用于估计表面法线,一个用于分析受遮挡边界(深度不连续),另一个给透明对象罩上蒙版。蒙版负责删除透明对象的所有像素,以便填充上正确的深度数据。

研究人员使用了一种全局优化模块,可以预测表面法线并利用其来引导形状的重建,实现对已知表面深度的拓展,还可以利用推算出的遮挡边界来保持不同物体之间的分离状态。

由于研究人员创建的数据集存在局限性,比如训练图片只包含放在地平面上的透明物体,因此初期的 ClearGrasp 算法判断墙壁等其他表面法线的表现很差。为了改善这一问题,他们在表面法线估算训练中加入了 Matterport3D 和 ScanNet 数据集中的真实室内场景,虽然没有透明物体,但针对真实场景的训练有效提高了算法估算表面法线的准确率。

图 | 三套神经网络各有不同分工(来源:谷歌 AI)

为了系统分析 ClearGrasp 的性能,研究人员分别利用 RGB-D 数据和 ClearGrasp 数据构造了 3D 点云。点云显示了算法所生成的 3D 表面形状干净且连贯,没有原始单眼深度估算法中常见的锯齿状噪声,而且还可以分辨复杂图案背景下的透明物体,以及区分相互遮挡的透明物体。

最重要的是,ClearGrasp 输出深度数据可以直接控制依赖于 RGB-D 图像的机械臂。

研究人员使用了 UR5 工业机械臂进行测试,将其原始传感器数据替换成 ClearGrasp 输出深度数据后,它的透明物体抓取成功率得到了显著改善:平行夹爪的成功率从 12% 大幅提升到 74%,吸爪的成功率从 64% 提升到 86%。

虽然分辨透明物体的准确率已经有了大幅提升,但新算法仍然有很大的进步空间。

研究人员认为,受到训练数据集和传统路径跟踪及渲染算法的局限性影响,ClearGrasp 仍然不能准确分辨散焦线,经常会把明亮的散焦线和物体阴影混淆为独立的透明物体。这将是未来的重要研究方向之一。

研究人员相信,这项研究成果证明了,基于深度学习的深度数据重建方法足以胜过传统方法,使机器能够更好地感知透明表面,不仅有望提高 LIDAR 无人驾驶等技术的安全性,而且还可以在多变的应用场景中开启新的交互方式,让分类机器人或者室内导航等技术更加高效和可靠。

编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31432

    浏览量

    223609
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47713
  • 距离传感器
    +关注

    关注

    3

    文章

    77

    浏览量

    15941
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124617
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    展会精彩 | 美芯晟携最新光学+磁传感亮相深圳传感器

    2026年4月14日,全球传感器领域的标杆盛会——深圳国际传感器与应用技术展览会(SensorShenzhen2026)在深圳福田会展中心盛大启幕,为期3天的展会深度聚焦技术创新、应用拓展,打造了
    的头像 发表于 04-16 15:33 814次阅读
    展会精彩 | 美芯晟携最新<b class='flag-5'>光学</b>+磁<b class='flag-5'>传感</b>亮相深圳<b class='flag-5'>传感器</b>展

    华睿科技推出DL3000系列3D线激光轮廓传感器

      DL3000系列3D线激光轮廓传感器基于三角测量原理,内置高精度算法,精确捕捉物体表面的三维轮廓信息。一体化紧凑型结构设计,无需控制便可实时获取亚微米级的
    的头像 发表于 04-08 16:57 308次阅读
    华睿科技推出DL3000系列3D线激光轮廓<b class='flag-5'>传感器</b>

    【智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    ; ②实现高节拍、大批量工件的全自动无人化测量; ③推动企业从人工复检向智能工厂数据闭环转型;④提升检测重复性、稳定性与整体OEE。; 阅读建议:本资料强调AI算法、硬件控制与软件逻辑的深度融合,建议结合实际应用场景理解技术
    发表于 03-31 17:11

    昉·星光开发板方案:昉·星光开发板光敏传感器之光强度数据读取

    包裹光线传感器的感光部分: 使用手电筒照射光线传感器的感光部分: 五、总结 在本次课程中,我们学习了光敏传感器的模拟输出信号的读取。 通过光敏
    发表于 03-18 06:19

    深度剖析TMP113:超小尺寸高精度数字温度传感器的卓越之选

    深度剖析TMP113:超小尺寸高精度数字温度传感器的卓越之选 在电子设备的设计中,温度监测是一个至关重要的环节,它关乎着设备的性能、稳定性和寿命。TMP113作为一款超小尺寸、高精度的数字温度
    的头像 发表于 02-11 09:50 255次阅读

    无线倾角传感器在房屋监测中的应用:以高精度数据支撑既有建筑安全评估

    无线倾角传感器在房屋监测中的应用:以高精度数据支撑既有建筑安全评估
    的头像 发表于 01-26 10:34 885次阅读
    无线倾角<b class='flag-5'>传感器</b>在房屋监测中的应用:以高精<b class='flag-5'>度数据</b>支撑既有建筑安全评估

    穿孔机顶头检测仪 机器视觉深度学习

    顶头状态。 检测顶头算法 引入人工智深度学习技术,通过Keras实现卷积神经网络(CNN),用Numpy实现采集数据的训练,得到符合现场需求的模型,进一步提升检测的准确性和现场的适应性
    发表于 12-22 14:33

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    高清录屏演示 进度梯度设计:前3章(视觉篇)聚焦传统算法,第6章起逐步引入深度学习,避免知识断层 2)实战项目拆解教学 以\"双CCD光学分选案例\"为例,采用\"硬件连接
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    高清录屏演示 进度梯度设计:前3章(视觉篇)聚焦传统算法,第6章起逐步引入深度学习,避免知识断层 2)实战项目拆解教学 以\"双CCD光学分选案例\"为例,采用\"硬件连接
    发表于 12-03 13:50

    打破汽车动态测量困局, 虹科OMS光学传感器重塑汽车测试精度标杆

    科技应用对数据精度、可靠性与便捷性的严苛要求。虹科OMS 7光学传感器将先进光学感知系统与高精度惯性测量单元深度融合,带来从底层原理到应用体
    的头像 发表于 10-30 11:38 472次阅读
    打破汽车动态测量困局, 虹科OMS<b class='flag-5'>光学</b><b class='flag-5'>传感器</b>重塑汽车测试精度标杆

    【新启航】深度学习在玻璃晶圆 TTV 厚度数据智能分析中的应用

    。随着深度学习数据处理领域展现出强大能力,将其应用于玻璃晶圆 TTV 厚度数据智能分析,有助于实现高精度、高效率的质量检测与工艺优化,为行业发展提供新动能。
    的头像 发表于 10-11 13:32 783次阅读
    【新启航】<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在玻璃晶圆 TTV 厚<b class='flag-5'>度数据</b>智能分析中的应用

    基于多传感器融合的切割深度动态补偿与晶圆 TTV 协同控制

    影响,单一传感器获取的信息存在局限性,难以实现切割深度的精确动态补偿与 TTV 的有效控制 。多传感器融合技术通过整合多源信息,为实现切割深度动态补偿与晶圆 TTV 的
    的头像 发表于 07-21 09:46 815次阅读
    基于多<b class='flag-5'>传感器</b>融合的切割<b class='flag-5'>深度</b>动态补偿与晶圆 TTV 协同控制

    常见的温湿度传感器类型?

    测量湿度。其优点是响应速度快、精度高,但缺点是价格高。 光学式湿度传感器 光学式湿度传感器基于湿度对透明材料的折射率的影响来测量湿度。其优点
    发表于 06-24 09:24

    技术指南丨深视智能点光谱共焦位移传感器测量透明物体厚度操作指南

    深视智能光谱共焦位移传感器SCI系列透明物体厚度测量操作指南旨在协助用户更加全面地了解我们的传感器设备。为方便后续
    的头像 发表于 06-16 08:19 1232次阅读
    技术指南丨深视智能点光谱共焦位移<b class='flag-5'>传感器</b>测量<b class='flag-5'>透明</b><b class='flag-5'>物体</b>厚度操作指南

    MAX32674C超低功耗生物识别算法/传感器中枢技术手册

    MAX32674C是一款算法/传感器中枢,提供嵌入式软件和先进的算法,适用于健身和医疗可穿戴设备市场,可直接与ADI的光学传感器进行接口。配
    的头像 发表于 05-08 09:11 1139次阅读
    MAX32674C超低功耗生物识别<b class='flag-5'>算法</b>/<b class='flag-5'>传感器</b>中枢技术手册