0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌Objectron数据集:3D目标检测数据集及检测方案

新机器视觉 来源:新机器视觉 作者:新智元 2020-11-27 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌人工智能实验室近日发布 Objectron 数据集,这是一个以3D目标为中心的视频剪辑的集合,这些视频剪辑从不同角度捕获了较大的一组公共对象。数据集包括 15K 带注释的视频剪辑,并补充了从地理多样的样本中收集的超过 4M 带注释的图像(覆盖五大洲的 10 个国家)。

机器学习(ML)的最新技术已经在许多计算机视觉任务上取得了SOTA的结果,但仅仅是通过在2D照片上训练模型而已。 在这些成功的基础上,提高模型对 3D 物体的理解力有很大的潜力来支持更广泛的应用场景,如增强现实、机器人、自动化和图像检索。 今年早些时候,谷歌发布了 MediaPipe Objectron,一套为移动设备设计的实时 3D 目标检测模型,这个模型是基于一个已标注的、真实世界的 3D 数据集,可以预测物体的 3D 边界。

然而,理解3D 中的对象仍然是一项具有挑战性的任务,因为与2D 任务(例如,ImageNet、 COCO 和 Open Images)相比,缺乏大型的真实世界数据集。 为了使研究团体能够继续推进3D 对象理解,迫切需要发布以对象为中心的视频数据集,这些数据集能够捕获更多的对象的3D 结构,同时匹配用于许多视觉任务(例如,视频或摄像机流)的数据格式,以帮助机器学习模型的训练和基准测试。 近期谷歌发布了 Objectron 数据集,这是一个以对象为中心的短视频剪辑数据集,从不同的角度捕捉了一组更大的普通对象。

每个视频剪辑都伴随着 AR 会话元数据,其中包括摄像机姿态和稀疏点云。数据还包含为每个对象手动注释的3D 边界,这些 bounding box 描述了对象的位置、方向和尺寸。 每个视频剪辑都随附有 AR 的元数据,其中包括相机姿势和稀疏点云。数据还包含每个对象的手动注释的 3D 边界框,用于描述对象的位置,方向和尺寸。 该数据集包括15K 注释视频剪辑与超过4M 注释图像收集的地理多样性样本(涵盖10个国家横跨五大洲)。

3D 目标检测解决方案

除了这个数据集,谷歌还分享了一个 3D 目标检测解决方案,可以用于4类物体:鞋子、椅子、杯子和相机。 这些模型是在 MediaPipe 中发布的,MediaPipe 是谷歌的开源框架,用于跨平台可定制的流媒体机器学习解决方案,它同时也支持机器学习解决方案,比如设备上的实时手势、虹膜和身体姿态跟踪。

与之前发布的 single-stage Objectron 模型相比,这些最新版本采用了两级架构。 第一级使用 TensorFlow 目标检测模型来寻找物体的 2D 裁剪,第二级使用图像裁剪来估计三维bounding box,同时计算下一帧对象的二维裁剪,使得目标检测器不需要运行每一帧。第二阶段的三维 bounding box 预测器是以83 FPS在 Adreno 650 GPU 上运行。

3D 目标检测的评估指标

有了真实的注释,我们就可以使用 3D IoU(intersection over union)相似性统计来评估 3D 目标检测模型的性能,这是计算机视觉任务常用的指标,衡量bounding box与ground truth的接近程度。 谷歌提出了一种计算一般的面向三维空间的精确 3D IoU 的算法。 首先使用 Sutherland-Hodgman Polygon clipping 算法计算两个盒子面之间的交点,这类似于计算机图形学的剔除技术(frustum culling),利用所有截断多边形的凸包计算相交的体积。最后,通过交集的体积和两个盒子的并集的体积计算 IoU。 谷歌表示将随数据集一起发布评估的源代码。

数据格式

Objectron 数据集的技术细节,包括使用和教程,均可在数据集网站上获得。这些数据集中的物体包括自行车、书籍、瓶子、相机、麦片盒、椅子、杯子、笔记本电脑和鞋子等,和数据集一起发布的具有以下内容: 1.视频序列 2.带注释的标签(目标的3D 边界框) 3.AR 元数据 (如照相机姿态、点云和平面表面) 4.处理过的数据集: 混合版本的带注释的帧、tf.example 格式的图像和 SequenceExample 格式的视频 5.支持基于上面描述的度量评估的脚本 6.支持脚本将数据加载到 Tensorflow、Pytorch、Jax并且可视化数据集 除了数据集,谷歌还开放了数据管道来解析 Tensorflow、 PyTorch 和 Jax 框架中的数据集。

还提供了 colab notebook 的实例 。 通过发布这个 Objectron 数据集,谷歌希望能够使研究团体推进三维物体几何理解的极限。同时也希望促进新的研究和应用,如视图合成,改进的 3D 表示和非监督式学习等。 参考链接: https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+blogspot%2FgJZg+%28Google+AI+Blog%29

责任编辑:xj

原文标题:重磅!谷歌发布3D目标检测数据集及检测方案

文章出处:【微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2990

    浏览量

    113809
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110250
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261477

原文标题:重磅!谷歌发布3D目标检测数据集及检测方案

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vitrox的v510i系列的3D AOI光学检测设备

    V510i部署在SMT生产线的 贴片机之后、回流焊炉之前或之后 ,主要用于检测贴装好的电子元件是否存在缺陷。其核心任务是: 3D与2D复合检测 :同时利用
    的头像 发表于 12-04 09:27 108次阅读

    SimData:基于aiSim的高保真虚拟数据生成方案

    01前言在自动驾驶感知系统的研发过程中,模型的性能高度依赖于大规模、高质量的感知数据。目前业界常用的数据包括KITTI、nuScenes、WaymoOpenDataset等,它们为
    的头像 发表于 11-07 17:35 5118次阅读
    SimData:基于aiSim的高保真虚拟<b class='flag-5'>数据</b><b class='flag-5'>集</b>生成<b class='flag-5'>方案</b>

    iTOF技术,多样化的3D视觉应用

    动态模糊,确保高耐光性,同时输出2D(红外)和3D(深度)数据。 ◆ Testing Principles ※ 测量脉冲光的飞行时间,以检测 TOF 相机与被测物体之间的距离。
    发表于 09-05 07:24

    AIcube1.4目标检测模型导入yolotxt格式数据后一直显示数据正在解析,为什么?

    AIcube1.4目标检测模型导入yolotxt格式数据后一直显示数据正在解析 数据有问题,把
    发表于 08-13 07:16

    请问AICube所需的目标检测数据标注可以使用什么工具?

    请问AICube所需的目标检测数据标注可以使用什么工具? 我使用labelimg进行标注,标注后的数据
    发表于 08-11 08:07

    3D激光轮廓仪可实现在线3D测量和检测

    Z-Trak™ Express 1K5 系列专为实现经济高效的在线3D测量和检测而设计,具有高速检测能力和实时处理性能。
    的头像 发表于 08-08 17:17 781次阅读
    <b class='flag-5'>3D</b>激光轮廓仪可实现在线<b class='flag-5'>3D</b>测量和<b class='flag-5'>检测</b>

    云训练平台数据过大无法下载数据至本地怎么解决?

    起因是现在平台限制了图片数量,想要本地训练下载数据时发现只会跳出网络异常的错误,请问这有什么解决办法?
    发表于 07-22 06:03

    使用AICube导入数据点创建后提示数据不合法怎么处理?

    重现步骤 data目录下 labels.txt只有英文 **错误日志** 但是使用示例的数据可以完成训练并部署
    发表于 06-24 06:07

    海伯森3D闪测传感器,工业检测领域的高精度利器

    随着信息技术的飞速进步,第四次视觉革命深度融合“人”“机”“物”,基于光学原理的3D视觉检测技术迎来爆发式发展,成为工业生产中更高效的检测利器。3D视觉技术通过非接触性、高速性、
    的头像 发表于 06-20 17:46 1292次阅读
    海伯森<b class='flag-5'>3D</b>闪测传感器,工业<b class='flag-5'>检测</b>领域的高精度利器

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据量有多少?
    发表于 06-18 07:04

    请问NanoEdge AI数据该如何构建?

    我想用NanoEdge来识别异常的声音,但我目前没有办法生成模型,我感觉可能是数据的问题,请问我该怎么构建数据?或者生成模型失败还会有哪些原因?
    发表于 03-10 08:20

    超景深3D检测显微镜技术解析

    方案的制定提供依据。 在工业检测领域,超景深3D检测显微镜的高精度成像能力使其成为质量控制的利器。无论是电子元器件的检测,还是精密机械零件的
    发表于 02-25 10:51

    AI Cube进行yolov8n模型训练,创建项目目标检测时显示数据目录下存在除标注和图片外的其他目录如何处理?

    AI Cube进行yolov8n模型训练 创建项目目标检测时显示数据目录下存在除标注和图片外的其他目录怎么解决
    发表于 02-08 06:21

    武汉环保节能装备3D数据扫描采集分析检测完成

    2024年3月,公司开展三维扫描数据采集业务,成功在节能减排装备叶片三D数据采集和检测分析方面取得显著成果,提供精确模型和
    的头像 发表于 01-15 14:35 536次阅读
    武汉环保节能装备<b class='flag-5'>3D</b><b class='flag-5'>数据</b>扫描采集分析<b class='flag-5'>检测</b>完成