0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

北京大学等提出HandTrackNet:点云序列中手物交互的位姿追踪与重建

CVer 来源:北京大学前沿计算研究中 2023-03-02 13:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导 读

本文是 AAAI 2023 Oral 入选论文 Tracking and Reconstructing Hand Object Interactions from Point Cloud Sequences in the Wild 的解读。本论文由北京大学王鹤研究团队与北京通用人工智能研究院、弗吉尼亚理工大学、斯坦福大学、清华大学、哥伦比亚大学合作,针对追踪并重建一段输入点云序列中的手和物体这一任务进行了研究。

我们首次提出了一个基于点云的手部关节追踪网络 HandTrackNet,并设计了一套完整的算法来完成手和物体追踪与重建这一具有挑战性的任务。此外,为了获得更多样且精准的数据,我们在仿真器中生成了大量手物交互的数据,并模拟了深度相机的拍摄原理,以获得接近真实世界噪声分布的深度数据。仅用仿真数据进行训练,我们的方法可以很好地泛化到未见过的真实场景测试数据上,以较快的速度(9FPS)取得远超前人工作的精度。

57f4146a-b077-11ed-bfe3-dac502259ad0.png

论文链接:

http://arxiv.org/abs/2209.12009

项目主页:

https://pku-epic.github.io/HOtrack

代码地址:

https://github.com/PKU-EPIC/HOTrack

5820cfa0-b077-11ed-bfe3-dac502259ad0.gif

58e29432-b077-11ed-bfe3-dac502259ad0.gif

59a4dad8-b077-11ed-bfe3-dac502259ad0.gif

图1. HO3D 数据集上的效果展示图。左起依次为输入点云,输出重建结果,另一个视角的输出,以及输出与 RGB 叠置的效果。可以看到,我们的算法对手物交互中的遮挡问题有很好的鲁棒性。

5ae60ad4-b077-11ed-bfe3-dac502259ad0.gif

5b7c27c6-b077-11ed-bfe3-dac502259ad0.gif

5bbe4a7a-b077-11ed-bfe3-dac502259ad0.gif

图2. DexYCB 数据集上的效果展示图。

01

引 言

手和物体的交互作为人类与复杂现实场景交互的主要途径,在现实生活中无处不在。作为感知人类与物体交互的主要方法,位姿追踪和重建人手与物体是两个至关重要的研究课题,可以实现广泛的应用,包括人机交互[1],增强现实[2],以及让机器人从人类的演示中学习相应技能(如抓取和操纵等[3])。

近年来,随着深度学习的发展,越来越多基于深度学习的工作涌现出来,研究如何从单帧信息(RGB 图片[4]或点云[5])中去感知手和物体,重建他们的几何形状或是估计他们的位姿,但是这类方法往往无法利用上视频相邻帧之间的连续性。另一方面,深度学习非常依赖数据,而对真实场景视频中的手和物体去准确标注三维几何形状及位姿是一件非常困难且成本极大的事情,现有的数据集如 DexYCB[6]和 HO3D[7]都规模不大且包含的物体数量少(不超过20个不同物体),用这样的数据难以训练出能够泛化到未见过的手和物体的模型。

因此,在这个工作中,我们关注于这样一个非常有挑战的任务——在不用任何真实数据作训练的前提下,对自然条件下的点云序列,联合追踪并重建人手和物体。我们的任务设定如下所述:给定一个包含已分割的手和物体的深度点云序列,还有初始的手部位姿和物体位姿,我们的算法需要去重建手和物体的几何形状,并以一个在线的方式(即对于第帧的预测只能利用当前帧和过去帧的信息,不能利用未来帧的信息)对他们的位姿进行追踪。我们选择点云这一模态作为输入而非图片是因为他们具有更加准确的三维结构,便于我们感知手和物体的位姿,并且具有更小的歧义性。

为了实现这一目标,首先,为了缓解数据问题,我们提出了一套流程来合成手和物体交互的仿真数据集。该数据集拥有非常高的多样性,无论是手的形状、物体的形状,还是两者的交互姿势;此外,得益于仿真环境的优势,这些数据带有免费的位姿和形状标注。为了最小化仿真和现实的领域差异,我们利用 DDS[8]提出的基于结构光的深度传感器模拟器,生成带有真实传感器噪声的仿真点云。

除此之外,我们首次提出了一个基于点云的手部姿势跟踪网络,HandTrackNet,以追踪帧间手部关节的运动。HandTrackNet 建立在 PointNet++[9]的基础上,基于上一帧的预测来估计当前帧手部关节位置的变化。相较于单帧回归的算法,这样做压缩了输出数据的分布空间,简化了回归任务,增强了时序上的连续性。此外,HandTrackNet 会从上一帧的预测中计算手的全局位姿,并利用手的全局位姿来将当前帧的输入点云变换到一个规范化的坐标系内,这极大地压缩了输入数据的分布空间,进一步简化了回归任务。在训练过程中,HandTrackNet 会学习修正随机的手部关节扰动,因此不会过拟合到任何时序轨迹上。

最后,为了更好的解决手和物体遮挡带来的歧义性,我们进一步利用基于优化的方法来推理手和物体之间的空间关系,获取物理上更加真实的预测。我们先将追踪到的手部关节位置转化为 MANO[10]这一参数化模型的表示,得到手部几何的重建,然后根据手和物体交互的先验构建几个能量函数,用于进一步调整手的位姿,从而产生更加符合物理规律、更加真实的手部位姿。

通过充分的实验,我们证明了我们的方法在从未见过的真实世界手和物体交互数据集 HO3D[7]和 DexYCB[6]中的有效性。我们的方法在手和物体的位姿追踪精度上明显优于之前的方法,并显示出良好的追踪鲁棒性和极强的泛化性。整个算法能够以交互式帧率(约9FPS)进行在线跟踪和重建。

02

方法简介

5bfe106a-b077-11ed-bfe3-dac502259ad0.png

图3. 我们生成的 SimGrasp 数据集。

首先,为了应对数据不足的问题,我们在仿真环境中造了一个手和物体交互的数据集 SimGrasp,包含超过450个不同的物体和100个不同大小的手,一共生成了1810段视频,每段视频有100帧。我们首先使用 GraspIt[11]来生成了一些手和物体呈持握状态的数据,然后将手往手背方向挪一定距离,并通过对位姿插值的方式获取动态抓取的视频。为了减少 Sim2real 的巨大差异,我们重新实现了 DDS 算法[8],基于结构光深度相机的原理,在仿真环境中模拟了真实相机点云会产生的噪声。

5c4eace6-b077-11ed-bfe3-dac502259ad0.png

图4. HandTrackNet 结构示意图。

在方法上,我们首次提出了一个基于点云的手部关节追踪网络 HandTrackNet,该网络接收当前第帧的手部点云和上一帧预测的手部关节位置作为输入,并对二者进行全局姿势规范化处理。然后,它利用 PointNet++[9]从规范化的手部点云中提取特征,并使用每个关节进行近邻查询和特征传递,最后用一个多层线性感知机来回归并更新关节位置。

其中,主要的创新部分在于利用上一帧预测的关节位置来进行全局姿势规范化上。前人的工作[5]发现手的全局位姿的多样性会给网络预测关节位置带来很大的困难,而如果能够设计比较好的全局位姿规范化方法,使得所有的输入点云都能被变换到同一个规范位姿下(例如手心朝向轴,指尖指向轴),就能大大降低学习难度,提升泛化能力。注意到,按照之前定义的手部规范位姿,规范化的手部点云的第一特征向量应该平行轴,第二特征向量应该平行轴,因此前人工作[5]中大多使用 PCA 来获取手部点云的外包围盒,并利用上述特性进行手的全局姿势规范化。然而,这样的做法存在的缺陷是当手被严重遮挡时,获取的外包围盒无法很好地反应真实手部全局位姿,因此不适用于手和物体交互的场景。

而我们则是注意到,手部指根处的关节点相对位置无论手指怎么动都是基本不变的,因此我们可以用 SVD 求解上一帧指根关节位置相对于预定义的规范位姿下的指根位置的平移和旋转,结合视频的连续性,利用这一平移和旋转去规范化当前帧的手部点云输入。

5c729552-b077-11ed-bfe3-dac502259ad0.png

图5. 完整流程图。第0帧,我们会重建手和物体的几何(如虚线所示);后续每一帧,我们会分别预测物体的位姿和手的位姿,并通过优化来进一步修复手的位姿。我们还可以每10帧更新一次手和物体的几何。

利用 HandTrackNet 获取手部关节位置后,我们利用一个简单的多层感知机网络 IKNet 将手部关节位置转化成了手部各关节角度,将作为 MANO 这一常用的手部参数化模型的输入,结合第0帧通过优化获得的手部形状参数,就可以得到手的完整三维重建了。而物体这一支,我们在第0帧利用 DeepSDF[12]的技术来根据观察到的点云去重建类别级未知物体的几何形状,并在之后每一帧通过优化的办法来解算物体位姿。最后,我们还使用了一个联合优化的模块,使用手与物体不会互相穿透、手指会贴近物体表面等条件作为能量函数来优化手的位姿,获取更符合物理规律、更真实的手物交互。我们还可以每隔10帧更新一次手和物体的几何,降低初始化时的几何误差对后续追踪的影响。

03

实验结果

我们仅仅使用我们合成的仿真数据集 SimGrasp 进行训练,在不使用任何真实数据进一步训练的情况下,直接在 HO3D[7]和 DexYCB[6]这两个具有挑战性的真实数据集上进行测试。相较于之前基于单帧预测的工作HandFoldingNet[13],A2J[14]和 VirtualView[15]以及基于追踪的工作 Forth[16],我们的方法在平均关节位置误差这项指标上在两个数据集中分别能显著提升6mm 和3mm 以上。

5c91e894-b077-11ed-bfe3-dac502259ad0.png

图6. 手部关节追踪实验结果。MPJPE 指平均关节位置误差,PD 指手和物体最大穿透深度,DD 指手和物体在接触时手指到物体上最近点的平均距离。

物体追踪方面,虽然之前的工作 CAPTRA[17]在验证集上能获得更好的表现,但是在真实数据的测试集上,我们基于优化的方法能够一致地超过它,证明了我们方法具有更强的泛化能力。

5cb6a63e-b077-11ed-bfe3-dac502259ad0.png

图7. 物体追踪实验结果。5度5cm 指旋转误差小于5度且平移误差小于5cm 的百分比,10度10cm 同理,CD 指带位姿的重建物体和标注物体的倒角距离(Chamfer distance)。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97158
  • 仿真器
    +关注

    关注

    14

    文章

    1048

    浏览量

    86778
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261622
  • 点云
    +关注

    关注

    0

    文章

    59

    浏览量

    4047

原文标题:AAAI 2023 Oral | 北京大学等提出HandTrackNet:点云序列中手物交互的位姿追踪与重建

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    曙光立体密算体系重磅发布

    11月26日,曙光“立体密算体系”正式发布。此次发布由数据安全关键技术与产业应用评价工业和信息化部重点实验室、曙光、中国科学院计算技术研究所、北京大学大数据分析与应用技术国家工程实验室与行业伙伴
    的头像 发表于 11-28 16:45 603次阅读
    曙光<b class='flag-5'>云</b>立体密算体系重磅发布

    北京大学在光生微波领域取得重要进展

    图1. 双波长激光器 高稳定低噪声微波信号在时频计量、射电天文、雷达导航领域发挥着不可替代的作用。传统的电学微波合成方式在稳定性和噪声控制方面已逼近技术瓶颈,而基于光电子技术的微波合成方案为突破
    的头像 发表于 11-13 07:50 105次阅读
    <b class='flag-5'>北京大学</b>在光生微波领域取得重要进展

    北京光庭出席汽车产业协同创新峰会

    9月25日,“智驱未来・走进北大——汽车产业协同创新峰会”在北京大学全球大学生创新创业中心成功举办。本次峰会由北大科技园、北京大学创新创业学院、中国汽车工程学会科技成果评价及转化工作委员会联合主办
    的头像 发表于 09-28 18:06 878次阅读

    北京大学彭练矛院士团队在高性能压力传感领域取得重要进展!突破性能瓶颈!

    的设计思路,这极大制约了其在需要精确力反馈与动态控制的复杂场景的应用。   针对这一挑战,北京大学电子学院胡又凡-彭练矛团队提出了一种全新的“接触主导的局域电位移场增强”设计策略。该策略通过巧妙地设计传感器
    的头像 发表于 09-28 10:52 1072次阅读
    <b class='flag-5'>北京大学</b>彭练矛院士团队在高性能压力传感领域取得重要进展!突破性能瓶颈!

    光电融合!中国团队突破6G全频段通信瓶颈

    电子发烧友网综合报道,近日,由北京大学、香港城市大学组成的联合研究团队成功研制出超宽带光电融合集成系统,首次实现全频段、灵活可调谐的高速无线通信,有望为未来更畅通可靠的6G无线通信提供保障。该成果8
    的头像 发表于 09-05 09:27 3659次阅读
    光电融合!中国团队突破6G全频段通信瓶颈

    知存科技助力北京大学校友论坛圆满落幕

    近日,由知存科技倾情支持的北京大学校友论坛在热烈的氛围圆满落幕。作为第九届集微半导体大会的特色环节,今年的北大校友论坛吸引了数十来自半导体产业不同领域的校友齐聚上海张江科学会堂,共叙母校情谊
    的头像 发表于 07-17 10:18 688次阅读

    国际首创新突破!中国团队以存算一体排序架构攻克智能硬件加速难题

    2025 年 6 月 25 日,北京大学团队在智能计算硬件方面取得领先突破,国际上首次实现了基于存算一体技术的高效排序硬件架构 (A fast and reconfigurable
    的头像 发表于 07-02 16:50 553次阅读
    国际首创新突破!中国团队以存算一体排序架构攻克智能硬件加速难题

    一种基于分布式光交换的高带宽域架构InfiniteHBD

    曦智科技联合北京大学、阶跃星辰为下一代万亿参数大模型训练的基础设施建设提出全新解决方案。
    的头像 发表于 06-09 10:38 1301次阅读
    一种基于分布式光交换的高带宽域架构InfiniteHBD

    香橙派AIpro(20T)走进北京大学、上海交通大学等高校鲲鹏昇腾科教创新卓越中心特训营

    近日,北京大学、上海交通大学等高校鲲鹏昇腾科教创新卓越中心特训营-DeepSeek专场成功举办。活动旨在基于昇腾技术的DeepSeek本地化部署实践分享,培养学员自主创新开发能力。华为技术专家
    的头像 发表于 04-18 11:51 979次阅读
    香橙派AIpro(20T)走进<b class='flag-5'>北京大学</b>、上海交通<b class='flag-5'>大学</b>等高校鲲鹏昇腾科教创新卓越中心特训营

    软国际助力北京理工大学珠海校区展开科研创新

    近日,软国际助力北京理工大学(珠海)基于华为昇腾AI服务DeepSeek满血版大模型展开科研及教学创新。北京理工大学(珠海)经济监督大
    的头像 发表于 03-10 18:13 1093次阅读

    香港科技大学(HKUST):用小数据集实现大尺度触觉传感,有望应用于以为中心的健康、运动、机器人和虚

    近日,由 香港科技大学(HKUST)电子与计算机工程学系申亚京教授领导的研究团队 , 提出了一种基于数字通道的触觉交互系统,可以实时测量来自不同部位的分布力,有望在医学评估、体育训练
    的头像 发表于 03-03 18:22 1294次阅读
    香港科技<b class='flag-5'>大学</b>(HKUST):用小数据集实现大尺度触觉传感,有望应用于以<b class='flag-5'>手</b>为中心的健康、运动、机器人和虚

    北京大学两部 DeepSeek 秘籍新出炉!(附全集下载)

    的结果。 这份文档还给出了市场营销、公文写作、编程开发、数据分析、会议纪要、学术研究多领域的的用法示例,等待大家去发现。
    发表于 02-27 17:57

    北大携智元机器⼈团队提出OmniManip架构

    近日,北京大学与智元机器人的联合实验室有了重大成果,北⼤携⼿智元机器⼈团队提出 OmniManip 架构。 在具身智能领域,将视觉语言基础模型(VLMs)应用于机器人实现通用操作一直是核心问题。目前
    的头像 发表于 01-24 09:57 837次阅读

    蒋学刚主任与北京大学深圳研究系统芯片设计重点实验室主任何进教授共赴学府一小 探索科创教育“芯”路径

    1月7日上午,RISC—V国际人才培训认证中心蒋学刚主任与北京大学深圳研究院系统芯片设计重点实验室主任何进教授一行人来到学府一小,受到了张永才书记、黄大耀校长、彭苏丹副校长、信息科创处主任周大勇
    的头像 发表于 01-10 17:52 1731次阅读
    蒋学刚主任与<b class='flag-5'>北京大学</b>深圳研究系统芯片设计重点实验室主任何进教授共赴学府一小 探索科创教育“芯”路径

    凝“芯”聚“心”共赴芯征程丨深圳市学府一小与北京大学深圳芯片重点实验室开展重要互访交流

    两弹一星梦少年中国芯01聚焦新时代“芯”科学教育少年中国芯发之于心,而不止于芯1月7日,深圳市南山区第二外国语学校(集团)学府一小张永才书记,北京大学深圳芯片重点实验室主任何进教授带队先后在双方单位
    的头像 发表于 01-09 18:03 1270次阅读
    凝“芯”聚“心”共赴芯征程丨深圳市学府一小与<b class='flag-5'>北京大学</b>深圳芯片重点实验室开展重要互访交流