0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

动画制作效率提升80%!这个AI软件一键实现高精度视频动捕

OpenCV学堂 来源:机器之心 2023-04-14 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1 分钟的舞蹈动画,美术手工制作或需 20 多天,用 AIxPose 辅助制作仅需 3 天,整个流程缩短了 80% 以上。

AIGC 又出新魔法了! 不用动画师手 K、惯捕或光捕,只需提供一段视频,这个 AI 动捕软件就能自动输出动作。仅需短短几分钟,虚拟人的动画制作就搞定了。

abbab19a-d894-11ed-bfe3-dac502259ad0.gif

‍ 不仅是四肢大框架动作,连手部的细节都能精准捕捉。

acb6a446-d894-11ed-bfe3-dac502259ad0.gif

除了单视角视频,还能支持多个视角的视频,相比其他只支持单目识别的动捕软件,该软件能提供更高的动捕质量。

ad1ca05c-d894-11ed-bfe3-dac502259ad0.gif

同时,该软件还支持对识别的人体关键点、平滑度、脚步细节等进行编辑修改。从普通玩家的兴趣体验,到硬核玩家的专业需求,它都可满足。

ad437f06-d894-11ed-bfe3-dac502259ad0.png

这就是网易互娱 AI Lab 深根多年、结合专业美术反馈不断迭代优化、低调开发的 AIxPose 视频动捕软件。据悉,该软件已经处理了超过数十个小时的视频资源,并应用于游戏剧情动画、热门舞蹈动画等资源的制作流程。经实际项目验证,1 分钟的舞蹈动画,美术手工制作或需 20 多天,用 AIxPose 辅助制作仅需 3 天,整个流程缩短了 80% 以上。 近日,网易互娱 AI Lab 基于开发该软件的经验,并结合在动捕领域的相关研究工作进行了整理,其所撰写的论文《Learning Analytical Posterior Probability for Human Mesh Recovery》被计算机视觉顶会 CVPR 2023 接收。

ad4d9a22-d894-11ed-bfe3-dac502259ad0.png

主页地址:https://netease-gameai.github.io/ProPose/

论文地址:https://netease-gameai.github.io/ProPose/static/assets/CVPR2023_ProPose.pdf

该论文创新性地提出了一种基于后验概率的视频动捕技术 ProPose,能够在单张图像、多传感器融合等不同设定下实现准确的三维人体姿态估计。技术精度比使用先验的基准概率方法高了 19%,且在公开数据集 3DPW、Human3.6M 和 AGORA 上均超越了过去的方法。此外,对于多传感器融合任务,该技术也能达到比基准模型更高的精度,且无需因为引入新传感器而修改神经网络的骨干部分。 技术背景 本研究的任务是从 RGB 图像中预测人体姿态和外形(human mesh recovery, hmr),现有的方法可以归纳为两类:直接法和间接法。直接法采用神经网络端到端地回归人体关节的旋转表示(如轴角、旋转矩阵、6D 向量等),而间接法先预测一些中间表示(如三维关键点、分割等),然后通过这些中间表示得到关节旋转。 然而,这两类方法都存在着一些问题。对于直接法而言,由于这类方法需要网络直接学习旋转这类抽象表示,与学习关键点、分割相比,学习旋转相对困难,因此网络输出的结果有时候很难和图像对齐,且无法完成一些大幅度的动作,如下图 (a) 第一行的右脚无法完全向后伸展。与之相比,间接法一般能产生更高的精度,但是这类方法的表现很大程度上依赖于中间表示的准确性,当中间表示由于噪声产生误差时,容易让最终的旋转出现相当明显的错误,如下图 (b) 第二行的左手所示。

ad57d3d4-d894-11ed-bfe3-dac502259ad0.png

除了前述这些确定性的方法,还有一些方法通过学习某些概率分布来建模人体姿态的不确定性,从而将噪声纳入考虑,提高系统鲁棒性。目前主要的概率建模方式包括多元高斯分布、标准化流、神经网络隐式建模等,但是这些非 SO (3) 上的概率分布无法真实地反映关节旋转的不确定性。比如在不确定性较大时,高斯分布在 SO (3) 上的局部线性假设不成立。近期的一篇工作直接用网络学习了 matrix Fisher 分布的参数,虽然这是一种 SO (3) 上的分布,但该方法的学习方式和直接法类似,收敛表现无法和现有的间接法相比。 为了同时兼顾高准确性和鲁棒性,提升概率方法的性能,ProPose 推导了关节旋转的解析后验概率,不仅能够受益于不同观测变量带来的高精度,也能衡量不确定性,尽可能减弱噪声对算法的影响。如下图所示,对于输入的图片,ProPose 可以通过输出的概率分布一定程度上度量该关节旋转在各个方向的不确定性,如右手沿着手臂轴的旋转、左手臂上下摆动的朝向、左小腿远近的程度等。

ad63bf00-d894-11ed-bfe3-dac502259ad0.png

技术实现 人体建模 本研究对人体姿态进行概率建模,目标是求关节旋转 R 在一些观测变量条件下(如骨骼朝向 d 等)的后验概率 p (R|d,⋯)。 具体而言,由于人体的关节旋转位于 SO (3) 上,而子关节相对于父关节的单位骨骼朝向位于 S^2 上,因此可基于这两种流形上的概率分布进行分析。 首先,SO (3) 上的 matrix Fisher 分布 MF (⋅) 可作为关节旋转 R 的先验分布,如下式所示,F∈R^(3×3) 是该分布的参数,c (F) 是一个归一化常量,tr 表示矩阵的迹。

ad73f92e-d894-11ed-bfe3-dac502259ad0.png

如下式所示,F 可以通过 SVD 分解直接求解均值 M 和一个表征分布聚集程度的聚集项 K。其中,Δ=diag (1,1,|UV|) 是一个对角正交矩阵,用于保证 M 的行列式为 1,从而能落在特殊正交群中。

ad7dfafa-d894-11ed-bfe3-dac502259ad0.png

其次,考虑到骨骼的朝向能通过关节旋转计算得到,因此可将关节旋转 R 看作隐变量,骨骼朝向 d 作为观测变量,给定 R 的条件下,S^2 上的单位朝向 d 服从 von Mises-Fisher 分布:

ad87792c-d894-11ed-bfe3-dac502259ad0.png

其中,κ∈R 和 d∈S^2 分别是该分布的聚集项和均值,l 是参考姿态下(如 T-pose)的单位骨骼朝向,理论上满足 Rl=d,即通过关节旋转将参考骨骼朝向转到当前骨骼朝向。 利用贝叶斯理论,给定先验分布 p (R) 和似然函数 p (d|R),可以计算以骨骼朝向为条件的关节旋转的后验概率 p (R|d) 的解析形式:

ad8ca578-d894-11ed-bfe3-dac502259ad0.png

由此可得到结论:后验概率 p (R|d) 同样服从 matrix Fisher 分布,且其参数从 F 更新为 F^'=F+κdl^T。 上述后验概率只考虑了人体骨骼朝向作为观测量,类似地,还可以推广到其它的方向观测量 d_i 或旋转观测量 D_j(可由别的传感器产生,如 IMUs 等),得到如下一般形式的解析后验概率:

ad9943f0-d894-11ed-bfe3-dac502259ad0.png

其中 κ_i 和 K_j 是聚集项。g (⋅) 是一个 IK 形式的映射,能够将方向观测量转换到旋转估计,可以采用最简单的形式如 g (d_i )=dl^T。Z_1 和 Z_3 分别表示方向观测量和旋转观测量的集合。 特性 该部分进一步阐述后验概率分布相较于先验概率分布有更高的聚集程度。 前述部分介绍了人体关节旋转后验概率的解析形式,该概率由一个新的参数 F' 表征。可以从另一个角度理解后验参数 F^',即 F^' 是与 F 相同的均值项 M 和一个新的聚集项 K^' 的乘积:

ada168d2-d894-11ed-bfe3-dac502259ad0.png

其中 M^T dl^T=ll^T 是一个秩 1 实对称矩阵,而 K 也是一个实对称矩阵,即后验的聚集项 K' 同样是实对称矩阵。根据矩阵分析中关于实对称矩阵的交错定理,可以得到 K' 的特征值 λ_i' 和 K 的特征值 λ_i 具有如下不等式关系:

adab27fa-d894-11ed-bfe3-dac502259ad0.png

考虑到聚集项的特征值等价于分布参数的奇异值,而分布参数的奇异值能反映该分布的置信度,因此可以得到结论,当似然项非零时,后验估计比先验估计更集中,可以快速收敛到似然函数偏好的那个 mode 上,从而能更容易地被学习。 除了先验概率方法,另一类主要的基准方法是利用逆运动学(IK)直接通过骨骼朝向计算旋转,下面这张图可以直观地展示后验概率方法和确定性 IK 方法之间的对比。

adb19edc-d894-11ed-bfe3-dac502259ad0.png

上图以人体肘部关节为例。实的三维坐标轴表示真实值,透明三维坐标轴表示估计值。第一行表示确定性 IK 方法,这类方法背后的建模方式是一个表示骨骼朝向的向量,当骨骼朝向估计准确时,剩余的一个自由度(twist)便能缩小到一个圆上(图中球上的虚线圈);当骨骼朝向估计不准确时,则会使得所有可能的估计都与真实值偏离。第二行表示本研究的后验概率模型,由多个不同类型的模型融合而成,球面上的红色区域表示某个旋转的概率,即便骨骼朝向估计有误差,这种方式也有可能恢复到真实值,因为骨骼朝向的噪声能够被先验或其它观测量所尽可能缓解。 网络框架图和损失函数 基于前述理论和推导,可以直接构建出下图所示的框架图。利用多分支网络从单张图片中估计先验分布参数 F、三维关键点 J(从中计算出骨骼朝向 d)、外形参数 β。通过贝叶斯法则计算得到后验概率,最终可从后验分布中得到姿态估计,从而输出人体 mesh。

adbb6782-d894-11ed-bfe3-dac502259ad0.png

损失函数的选择比较直接,为如下四个约束的加权和,其中 L_J 表示关键点约束,L_β 表示外形参数约束,L_θ 表示矩阵形式的姿态参数约束,L_s 表示对分布进行采样后的姿态约束。关于对分布的约束,这里并未直接采用 MAP 是考虑了归一化参数的数值稳定性问题。关于采样策略,类似之前的工作,将 matrix Fisher 分布转为等价的四元数形式的 Bingham 分布,然后通过拒绝采样得到,其中拒绝采样的建议分布采用 angular central Gaussian 分布。

adc98254-d894-11ed-bfe3-dac502259ad0.png

实验结果 实验部分,本研究在公开数据集 Human3.6M、3DPW、AGORA、TotalCapture 上和过去方法进行了定量对比。可以看到,本研究的方法超越了过去的一众方法。其中右下表中最后灰色的两行是同期工作,这里为了榜单完整性也列了出来。

add26bd0-d894-11ed-bfe3-dac502259ad0.png

addd7d5e-d894-11ed-bfe3-dac502259ad0.png

下图展示了和现有 SOTA 方法 HybrIK、PARE、CLIFF 的定性对比,可以看到对一些遮挡的情况,ProPose 可以得到更好的效果。

ade53436-d894-11ed-bfe3-dac502259ad0.png

下表展示了一系列消融实验,主要展示 ProPose 的准确性和鲁棒性。基准方法包括不使用三维关键点、不使用先验、测试时不使用先验、骨干网络不同位置特征的选择等,下面左表充分验证了所提出的后验概率分布有着更高的精度。下面右表则展示了后验方法和确定性 IK 方法对噪声的鲁棒性比较,可以看到后验方法能够更大程度地抵御噪声的干扰。

adf2d97e-d894-11ed-bfe3-dac502259ad0.png

ae06e202-d894-11ed-bfe3-dac502259ad0.png

除了上述 hmr 任务,本研究还在多传感器融合的任务上进行了评估,下面给出了一个单视角和 IMUs 融合的效果。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2573

    文章

    54366

    浏览量

    785984
  • 高精度
    +关注

    关注

    1

    文章

    735

    浏览量

    26920
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47450

原文标题:动画制作效率提升80%!这个AI软件一键实现高精度视频动捕

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    SGTools--动画控件--屏幕实现动画显示 就是这么简单

    详细步骤可以观看视频实现动画很简单,提前准备好gif文件和个张背景图 使用SGTools工具,就可以制作
    发表于 09-16 10:29

    告别多设备!揭秘QM系列闪测仪如何一键搞定多元检测

    QM 系列一键闪测仪作为方案核心,搭载双视野双远心镜头与 2000 万像素 CMOS 传感器,测量精度可达 ±1μm。其内置的 AI 深度学习系统经过海量工业样本训练,能一键识别 50
    的头像 发表于 08-11 13:43 851次阅读
    告别多设备!揭秘QM系列闪测仪如何<b class='flag-5'>一键</b>搞定多元检测

    闪测仪开机放件按一键,尺寸测量报告秒生成

    闪测仪以“开机放件按一键,尺寸报告秒生成”的简易操作模式,解决了传统测量设备操作复杂、效率低下、数据致性差等问题,提高了工业检测的效率精度
    的头像 发表于 06-13 11:43 716次阅读
    闪测仪开机放件按<b class='flag-5'>一键</b>,尺寸测量报告秒生成

    一键尺寸测量仪在医疗领域的应用具体是什么?

    一键尺寸测量仪作为种先进的测量工具,凭借其高精度、快速批量测量以及自动化与智能化的特点,正逐渐成为五金行业不可或缺的精密测量新利器。
    的头像 发表于 05-27 15:12 575次阅读
    <b class='flag-5'>一键</b>尺寸测量仪在医疗领域的应用具体是什么?

    电源一键多用:POWER_ON从开机到场景指挥官!

    按键,即开关机,在结构设计上可以实现 一键多用 ——既可以有效减少结构的按键设计,也可以使整机更加简洁。 本文以Air8000核心板为例,分享POWER_ON按键功能及其硬件设计、软件
    的头像 发表于 05-15 14:10 3566次阅读
    电源<b class='flag-5'>键</b>的<b class='flag-5'>一键</b>多用:POWER_ON从开机到场景指挥官!

    全新上线IPC精彩时刻!配套On-App AI视频剪辑模板+全天候一键抓拍

    次走路、日出日落等),并一键生成带特效的专属Vlog。能够满足婴儿/宠物看护、生活娱乐、风景旅行等全场景需求,帮助用户轻松记录生活中的高光时刻!针对有视频处理需
    的头像 发表于 05-08 19:06 795次阅读
    全新上线IPC精彩时刻!配套On-App <b class='flag-5'>AI</b><b class='flag-5'>视频</b>剪辑模板+全天候<b class='flag-5'>一键</b>抓拍

    开关柜一键顺控在智能配电运管系统扮演什么角色?

    蜀瑞创新为大家科普在智能配电运管系统中,开关柜一键顺控扮演着自动化操作优化、安全效率提升的核心角色
    的头像 发表于 05-08 09:54 590次阅读
    开关柜<b class='flag-5'>一键</b>顺控在智能配电运管系统扮演什么角色?

    一键自动升降,DZ-TGA201开启热重分析智能化

    科研人员的高效探索。南京大展仪器新推出款自动化操作的DZ-TGA201升降热重分析仪,大大提升了测量的效率和准确性。一键自动升降,
    的头像 发表于 05-07 10:34 585次阅读
    <b class='flag-5'>一键</b>自动升降,DZ-TGA201开启热重分析智能化

    U盘一键制作

    在电脑维修中启动盘很重要,靠谱的u盘一键启动制作方法
    发表于 05-06 16:10 44次下载

    开关柜一键顺控在一键停电、一键送电中的作用

    蜀瑞创新为大家科普,开关柜一键顺控技术在一键停电和一键送电中发挥了快速响应、减少人为错误、提高安全性、简化操作流程、降低操作风险、提高送电成功率等综合优势,对于提升电力系统的运行
    的头像 发表于 02-27 09:13 1241次阅读

    一键升降,智控热重!南京大展DZ-TGA201升降热重新品上市

    客户的测试需求,提高实验的准确性和效率,南京大展推出新品DZ-TGA201自动升降热重分析仪,以“一键升降”的智能化设计,大大提升了实验的效率一键
    的头像 发表于 02-25 11:46 686次阅读
    <b class='flag-5'>一键</b>升降,智控热重!南京大展DZ-TGA201升降热重新品上市

    UOS AI:一键解锁未来办公新姿势

    浏览新闻寻找素材,长篇大论眼花缭乱? 选中内容后 「AI随航」 图标自动显现 ,鼠标悬停图标后点击选择相应功能,几秒帮你总结内容,还能选中想要的内容一键续写润色和花式扩写! 老板夸你“效率堪比
    的头像 发表于 02-19 10:54 1141次阅读
    UOS <b class='flag-5'>AI</b>:<b class='flag-5'>一键</b>解锁未来办公新姿势

    设备管理系统如何实现一键智控?

    中设智控的“一键智控”模式不仅解决了传统设备管理中的信息孤岛、效率低下等痛点,更通过数据驱动重构企业生产力。未来,随着工业4.0的深化,设备管理系统将成为企业数字化转型的核心枢纽,而中设智控凭借其技术积累与行业深耕,正引领这场管理革命,助力中国制造向“中国智造”加速迈进。
    的头像 发表于 02-17 10:34 966次阅读
    设备管理系统如何<b class='flag-5'>实现</b><b class='flag-5'>一键</b>智控?

    UWB高精度定位技术在智能仓储中的应用

    UWB高精度定位系统结合RFID和ERP软件,优化仓储管理,实现厘米级定位、抗干扰、低功耗安全,提升仓储效率40%,减少误差,未来应用场景更
    的头像 发表于 01-22 17:30 1021次阅读

    优可测一键尺寸测量仪:实现MLCC尺寸快速精准检测 | 行业应用

    优可测一键式闪测仪FM-9000系列:随意放置即可瞬间精确、快速、批量测量,是解决MLCC几何尺寸测量困扰的优选方案,帮助您提升产品良率与产量!
    的头像 发表于 12-31 17:05 1182次阅读
    优可测<b class='flag-5'>一键</b>尺寸测量仪:<b class='flag-5'>实现</b>MLCC尺寸快速精准检测 | 行业应用