0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个用于6D姿态估计和跟踪的统一基础模型

3D视觉工坊 来源:3D视觉工坊 2023-12-19 09:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

0. 笔者个人体会

今天笔者将为大家分享NVIDIA的最新开源方案FoundationPose,是一个用于 6D 姿态估计和跟踪的统一基础模型。只要给出CAD模型或少量参考图像,FoundationPose就可以在测试时立即应用于新物体,无需任何微调,关键是各项指标明显优于专为每个任务设计的SOTA方案。

下面一起来阅读一下这项工作,文末附论文和代码链接~

1. 效果展示

FoundationPose实现了新物体的6D姿态估计和跟踪,支持基于模型和无模型设置。在这四个任务中的每一个上,FoundationPose都优于专用任务的SOTA方案。(·表示仅RGB,×表示RGBD)。这里也推荐工坊推出的新课程《单目深度估计方法:算法梳理与代码实现》。

adfd5652-9dfa-11ee-8b88-92fbcf53809c.jpg

2. 具体原理是什么?

为减少大规模训练的人工工作,FoundationPose利用3D模型数据库、大型语言模型和扩散模型等新技术,开发了一种新的合成数据生成Pipeline。为了弥补无模型和基于模型的设置之间的差距,FoundationPose利用以对象为中心的神经场来进行随后的渲染和新视图RGBD渲染。

对于姿态估计,首先在物体周围均匀地初始化全局姿态,然后通过细化网络对其进行细化。最后将改进的位姿转发给姿态选择模块,预测位姿的分数,输出得分最高的位姿。

ae1028e0-9dfa-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法对比如何?

YCB-Video数据集上Model-free方案的位姿估计定量结果对比。

ae219558-9dfa-11ee-8b88-92fbcf53809c.jpg

YCB-Video数据集上位姿跟踪的定量对比。这里也推荐工坊推出的新课程《单目深度估计方法:算法梳理与代码实现》。

ae35a2aa-9dfa-11ee-8b88-92fbcf53809c.jpg

对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~

4. 论文信息

标题:FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者:Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

机构:NVIDIA

原文链接:https://arxiv.org/abs/2312.08344

代码链接:https://github.com/NVlabs/FoundationPose








审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5731

    浏览量

    110324
  • RGB
    RGB
    +关注

    关注

    4

    文章

    840

    浏览量

    62339

原文标题:通用性超强!同时实现6D位姿估计和跟踪!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技发布并开源新代原生理解生成统一模型SenseNova U1系列

    近日,商汤科技发布并开源新代原生理解生成统一模型SenseNova U1系列,随后壁仞科技、寒武纪、昆仑芯、摩尔线程、中科海光等10家国产芯片公司,均已完成对开源的SenseNova U1 Lite系列的Day 0适配。
    的头像 发表于 05-08 16:26 682次阅读

    禾赛发布全球首款6D全彩激光雷达超感光芯片,ETX系列升级下半年量产

    与色彩信息的芯片级像素融合,直接生成彩色点云数据。 芯片革命,从3D6D的跨越 激光雷达技术的核心竞争已经从硬件结构转向芯片层面。禾赛此次发布的“毕加索SPAD-SoC”正是这趋势的最新体现,实现了从单纯测距到全彩感知的跨越
    的头像 发表于 04-29 18:20 1096次阅读

    为什么国产MCU的工程生态很难统一

    背景 国产 MCU 种类多、厂商众多,生态碎片化明显。 主要原因 厂商 SDK 不统一 :API、驱动结构差异大 开发工具闭源 :无法统一配置流程 工程模板缺失 :初始化步骤、外设配置不致 社区
    发表于 01-28 09:25

    在Ubuntu20.04系统中训练神经网络模型些经验

    模型。 我们使用MNIST数据集,训练卷积神经网络(CNN)模型用于手写数字识别。
    发表于 10-22 07:03

    ANSA人体模型姿态调整工具的使用案例

    中国体征人体数字模型(AC-HUMs)是中国汽研主持研发的人体有限元模型。BETA CAE Systems与中国汽研保持紧密合作,前、后处理软件(ANSA/META)会全面支持AC-HUMs系列模型。在软件中提供对应工具
    的头像 发表于 09-28 15:44 1578次阅读
    ANSA人体<b class='flag-5'>模型</b><b class='flag-5'>姿态</b>调整工具的使用案例

    ANSA人体模型姿态调整工具介绍

    ANSA的人体模型姿态调整工具(HBM Articulation Tool)通过网格变形技术实现基于人体不同部位进行调节,定位人体模型最终的姿态
    的头像 发表于 09-28 15:40 2048次阅读
    ANSA人体<b class='flag-5'>模型</b><b class='flag-5'>姿态</b>调整工具介绍

    【2025嵌赛等奖】|基于三维姿态估计与边缘智能的独居老人监护系统

    在2025年嵌入式大赛全国总决赛中,山西大学“慧眸无忧帮”团队凭借参赛项目“瞳芯颐护——基于三维姿态估计与边缘智能的独居老人监护系统”,举斩获全国等奖。该团队由计算机与信息技术学院
    的头像 发表于 09-17 09:19 7081次阅读
    【2025嵌赛<b class='flag-5'>一</b>等奖】|基于三维<b class='flag-5'>姿态</b><b class='flag-5'>估计</b>与边缘智能的独居老人监护系统

    玩转 KiCad 3D模型的使用

    时间都在与 2D 的焊盘、走线和丝印打交道。但完整的产品,终究是要走向物理世界的。元器件的高度、接插件的朝向、与外壳的配合,这些都是 2D 视图难以表达的。 幸运的是,KiCad
    的头像 发表于 09-16 19:21 1.2w次阅读
    玩转 KiCad 3<b class='flag-5'>D</b><b class='flag-5'>模型</b>的使用

    SCH1633 6DoF传感器三大姿态功能

    村田推出高精度汽车用6轴惯性传感器~颗传感器可同时用于车辆自身位置推算、车辆姿态测量和前照灯调平~村田已开发出高性能的汽车用6轴惯性力传感
    的头像 发表于 09-15 12:12 1198次阅读
    SCH1633 <b class='flag-5'>6</b>DoF传感器三大<b class='flag-5'>姿态</b>功能

    如何使用树莓派+OpenCV实现姿态估计和面部特征点追踪?

    大家好,这是树莓派和OpenCV的连载专题。使用树莓派与OpenCV实现姿态估计和面部特征点追踪使用树莓派与OpenCV实现面部和运动追踪的云台系统使用树莓派和OpenCV实现手部
    的头像 发表于 08-13 17:44 1582次阅读
    如何使用树莓派+OpenCV实现<b class='flag-5'>姿态</b><b class='flag-5'>估计</b>和面部特征点追踪?

    如何在树莓派 AI HAT+上进行YOLO姿态估计

    大家好,接下来会为大家开树莓派5和YOLO的连载专题。内容包括四部分:在树莓派5上使用YOLO进行物体和动物识别-入门指南在树莓派5上开启YOLO姿态
    的头像 发表于 07-20 20:34 1341次阅读
    如何在树莓派 AI HAT+上进行YOLO<b class='flag-5'>姿态</b><b class='flag-5'>估计</b>?

    在树莓派5上开启YOLO姿态估计识别之旅!

    大家好,接下来会为大家开树莓派5和YOLO的连载文章。内容包括四部分:在树莓派5上使用YOLO进行物体和动物识别-入门指南在树莓派5上开启YOLO人体姿态
    的头像 发表于 07-18 15:31 2887次阅读
    在树莓派5上开启YOLO<b class='flag-5'>姿态</b><b class='flag-5'>估计</b>识别之旅!

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型的推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这问题,本文将探讨大模型推理显存和
    发表于 07-03 19:43

    如何将FA模型开发的声明式范式应用切换到Stage模型

    模型切换概述 本文介绍如何将FA模型开发的声明式范式应用切换到Stage模型,您需要完成如下动作: 工程切换:新建
    发表于 06-04 06:22

    商汤科技日日新V6模型斩获“双料第项国内榜首,全球第

    卫冕“双冠”! 通用语言能力并列国内榜首、多模态能力全球最强,商汤「日日新V6」近期斩获“双料第”。 5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5
    的头像 发表于 05-30 11:13 1802次阅读
    商汤科技日日新V<b class='flag-5'>6</b>大<b class='flag-5'>模型</b>斩获“双料第<b class='flag-5'>一</b>” <b class='flag-5'>一</b>项国内榜首,<b class='flag-5'>一</b><b class='flag-5'>个</b>全球第<b class='flag-5'>一</b>