0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维实体检测解决方案

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-01-19 14:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

仅仅通过在照片上训练模型,机器学习(ML)的最新技术就已经在许多计算机视觉任务中取得了卓越的准确性。在这些成功的基础上,进一步提高对3D对象的理解,这将极大地促进更广泛的应用,例如增强现实,机器人技术,自主性和图像检索。

今年早些时候,我们发布了MediaPipe Objectron,这是一套针对移动设备设计的实时3D对象检测模型,这些模型在经过完全注释(annotated)的真实3D数据集上进行了训练,可以预测对象的3D边界框。

然而,由于与2D任务(例如ImageNet,COCO和Open Images)相比,因为缺少大型真实数据集,所以了解3D对象仍然是一项具有挑战性的任务。为了使研究社区能够不断提高三维实体的理解,迫切需要发布以对象为中心的视频数据集,该数据集可以捕获对象的更多3D结构,同时匹配用于许多视觉任务的数据格式(例如视频或摄像机流),以帮助训练和确定机器学习模型的基准。

今天,我们很高兴发布Objectron数据集,这是一个短的,以对象为中心的视频剪辑的集合,可以从不同的角度捕获更大的一组公共对象。每个视频剪辑都随附有AR会话元数据,其中包括相机姿势和稀疏点云。除此之外,数据还包含每个对象手工标注的3D边框,用来描述对象的位置,方向和尺寸。数据集包括15K带注释的视频剪辑,并补充了从不同地理区域的样本中收集的超过4M带注释的图像(覆盖五大洲的10个国家/地区)。

三维实体检测解决方案

除了和数据集一起之外,我们还将共享一个针对四类对象的三维实体检测解决方案-鞋子,椅子,杯子和照相机。这些模型在MediaPipe中发布,MediaPipe是Google的跨平台可定制ML解决方案的开源框架,适用于实时和流媒体,该解决方案还支持设备上的实时手部,虹膜和身体姿势跟踪等ML解决方案。

在移动设备上运行的3D对象检测解决方案的示例结果

与以前发布的单阶段Objectron模型相反,这些最新版本使用两级架构。第一阶段采用TensorFlow对象检测模型来查找实体的2D裁剪。然后,第二阶段使用图像裁剪来估计3D边框,同时为下一帧计算实体的2D裁剪,因此实体检测器不需要运行每个帧。第二阶段3D边框预测器在Adreno 650移动GPU上以83 FPS运行。

a52aa03c-4ec2-11eb-8b86-12bb97331649.png

参考3D对象检测解决方案图

3D对象检测的评估指标

借助ground truth annotations,我们使用3Dintersection over union(IoU)相似度统计信息(一种用于计算机视觉任务的常用度量标准)来评估三维实体检测模型的性能,该度量标准衡量边框与地面真相的接近程度。

我们提出了一种算法,可为通用三维面向盒计算准确的3D IoU值。首先,我们使用Sutherland-Hodgman多边形裁剪算法计算两个盒子的面之间的交点。这类似于用于计算机图形学的视锥剔除技术。相交的体积由所有修剪的多边形的凸包计算。最后,根据两个框的交点的体积和并集的体积计算IoU。我们将在发表数据集的同时发布评估指标的源代码。

使用多边形裁剪算法计算并集的三维交点(左):通过对方框裁剪多边形计算每个面的交点。右:通过计算所有交点的凸包计算交点的体积(绿色)。

数据集格式

数据集的技术细节,包括用法和教程,可在数据集网站上找到。数据集包括自行车,书籍,瓶子,照相机,谷物盒,椅子,杯子,笔记本电脑和鞋子,并存储在Google Cloud存储上的objectron存储桶中,具有以下资源:

视频片段

注释标签(实体的3D边框)

AR元数据(例如照相机姿势,点云和平面)

已处理的数据集:带注释帧的改编版本,图像的格式为tf.example,视频的格式为SequenceExample。

支持脚本以基于上述指标运行评估

支持脚本以将数据加载到Tensorflow,PyTorch和Jax中并可视化数据集,包括“ Hello World”示例

有了数据集,我们还将开放数据管道,以在流行的Tensorflow,PyTorch和Jax框架中解析数据集。还提供了示例colab笔记本。

通过发布此Objectron数据集,我们希望使研究界能够突破三维实体几何理解的极限。我们还希望促进新的研究和应用。例如视图合成,改进的三维表达和无监督学习。加入我们的邮件列表并访问我们的github页面,请随时关注未来的活动和发展。

致谢

这篇文章中描述的研究是由Adel Ahmadyan, Liangkai Zhang, JianingWei, Artsiom Ablavatski, Mogan Shieh, Ryan Hickman, Buck Bourdon, Alexander Kanaukou, Chuo-Ling Chang, Matthias Grundmann, ‎and Tom Funkhouser完成的。我们感谢Aliaksandr Shyrokau,Sviatlana Mialik,Anna Eliseeva和注释团队的高质量注释。我们还要感谢Jonathan Huang和Vivek Rathod对TensorFlow对象检测API的指导。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测器
    +关注

    关注

    1

    文章

    926

    浏览量

    49690
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60287
  • 数据集
    +关注

    关注

    4

    文章

    1232

    浏览量

    26066

原文标题:Google发布Objectron数据集

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三维焊膏检测(SPI)技术与V310i Optimus系统的应用解析

    在现代电子制造领域,表面帖子技术(SMT)的精细化发展使得锡膏印刷质量监控变得尤为关键。 三维焊膏检测(SPI)系统作为SMT生产线上的关键质量监控设备,通过对印刷后焊膏的高度、面积、体积等三维参数
    的头像 发表于 11-12 11:16 159次阅读
    <b class='flag-5'>三维</b>焊膏<b class='flag-5'>检测</b>(SPI)技术与V310i Optimus系统的应用解析

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度应用于高精度工业3D扫描(
    的头像 发表于 11-11 14:55 355次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    研华三维曲面AI检测方案有什么亮点

    2025工博会正如火如荼进行中,各家展台争奇斗艳,工业自动化百花齐放。研华三维曲面控制AI检测方案在其中悄然盛开。
    的头像 发表于 09-30 10:36 534次阅读

    软通动力与华为推出智能矿山三维地质分析解决方案

    在华为全联接大会2025中,软通动力联合华为发布智能矿山三维地质分析解决方案。作为双方在矿山智能化领域的创新突破,该方案已成功应用于某大型煤矿项目,落地成效显著,为行业智能化升级提供了可复用的标杆实践。
    的头像 发表于 09-22 09:47 545次阅读

    蔡司三维扫描仪第方代抄数检测机构

    的手持式T-SCANhawk2三维激光扫描仪及GOMATOS系列光学三维扫描仪,正为全球制造业提供高效、精准的测试服务解决方案。技术核心优势:精准与效率的完美融合蔡司
    的头像 发表于 08-02 11:57 762次阅读
    蔡司<b class='flag-5'>三维</b>扫描仪第<b class='flag-5'>三</b>方代抄数<b class='flag-5'>检测</b>机构

    VirtualLab:光学系统的三维可视化

    另一个菜单与各种选项来自定义三维视图,如配色方案、视图工具或光线的描绘风格等。 配色方案-背景颜色 可用的配色方案是亮、中和暗。此外,用户可以决定是否包括背景颜色渐变。 色彩
    发表于 05-30 08:45

    CASAIM与荣耀达成三维数字化检测技术合作

    近期,CASAIM与荣耀终端股份有限公司就终端消费电子产品的三维数字化检测展开深度合作,双方合作的首个项目将聚焦手机中框制造环节,借助三维数字化检测技术提升手机中框质量
    的头像 发表于 05-16 18:06 814次阅读

    南方测绘推出实景三维中国整体解决方案

    新型基础测绘与实景三维中国建设持续推进,南方测绘深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景三维系列产品,提供全流程、按需定制的实景
    的头像 发表于 03-26 16:44 1076次阅读

    casaim自动化三维激光扫描

    CASAIM自动化三维激光扫描技术通过非接触式高精度数据采集与智能分析系统,为工业检测提供全流程数字化解决方案
    的头像 发表于 02-27 10:32 673次阅读

    TSV三维堆叠芯片的可靠性问题

    孔质量和 信赖性保证难度大 ;(2) 多层芯片堆叠结构的机械稳 定性控制难度大 ;(3) 芯片间热管理和散热解决方案 复杂 ;(4) 芯片测试和故障隔离、定位困难。 2.1 TSV 孔的质量和可靠性问题 作为三维集成电路中的垂直互连通道,TSV 孔 的质量和可靠性对系
    的头像 发表于 12-30 17:37 2452次阅读

    三维测量在医疗领域的应用

    三维测量在医疗领域的应用十分广泛,为医疗诊断、治疗及手术规划等提供了重要的技术支持。以下是对三维测量在医疗领域应用的分析: 一、医学影像的三维重建与分析 CT、MRI等影像的三维重建
    的头像 发表于 12-30 15:21 1112次阅读

    三维测量软件的使用技巧

    在现代工业和科研领域,三维测量技术已经成为不可或缺的一部分。它能够提供精确的空间数据,帮助工程师和研究人员更好地理解和设计复杂的三维结构。 选择合适的三维测量软件 功能需求分析 :根据项目需求,确定
    的头像 发表于 12-30 15:05 1381次阅读

    南方智能SmartGIS Inspec实景三维质检软件介绍

    新型基础测绘与实景三维中国建设持续推进,南方测绘集团旗下南方智能深度聚焦,基于自主研发的SmartGIS平台,打造以地理实体数据为核心的“生产、处理、质检、管理、可视化分析”实景三维系列软件,提供全流程、按需定制的服务
    的头像 发表于 12-27 11:20 1986次阅读

    三维扫描在医疗领域的应用

    形态等。 这些数据有助于医生制定更精确的手术方案,预测手术风险,从而提高手术成功率。 手术模拟 : 利用三维扫描技术,医生可以在计算机上进行手术模拟,提前规划手术步骤。 这有助于医生更好地了解手术过程,预测可能出现的问
    的头像 发表于 12-19 14:58 2122次阅读

    三维扫描与建模的区别 三维扫描在工业中的应用

    数据。这一过程是自动化的,能够快速捕捉物体的三维信息。 三维建模 :则需要专业建模师使用三维建模软件,从无到有地创建三维模型。建模师可以根据不同的需求调整建模
    的头像 发表于 12-19 14:55 1599次阅读