0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SHERF:可泛化可驱动人体神经辐射场的新方法

CVer 来源:CVer 2023-08-15 11:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人体神经辐射场的目标是从 2D 人体图片中恢复高质量的 3D 数字人并加以驱动,从而避免耗费大量人力物力去直接获取 3D 人体几何信息。这个方向的探索对于一系列应用场景,比如虚拟现实和辅助现实场景,有着非常大潜在性的影响。

现有人体神经辐射场生成和驱动技术主要可以分为两类。

第一类技术利用单目或者多目人体视频去重建和驱动 3D 数字人。这类技术主要是针对特定数字人的建模和驱动,优化耗时大,缺乏泛化到大规模数字人重建上的能力。

第二类技术为了提升 3D 数字人重建的效率。提出利用多视角人体图片作为输入去重建人体神经辐射场。

尽管这第二类方法在 3D 人体重建上取得了一定的效果,这类方法往往需要特定相机角度下的多目人体图片作为输入。在现实生活中,我们往往只能获取到任意相机角度下人体的一张图片,给这类技术的应用提出了挑战。

在 ICCV2023 上,南洋理工大学 - 商汤科技联合研究中心 S-Lab 团队提出了基于单张图片的可泛化可驱动人体神经辐射场方法 SHERF

SHERF 可以基于用户输入的一张任意相机角度 3D 人体图片,该角度下相机和人体动作体型(SMPL)参数,以及给定目标输出空间下任意相机参数和人体动作体型(SMPL)参数,重建并驱动该 3D 数字人。本方法旨在利用任意相机角度下人体的一张图片去重建和驱动 3D 人体神经辐射场。

cb20cf1a-3b1d-11ee-9e74-dac502259ad0.png

图 1

基本原理

人体神经辐射场重建和驱动主要分为五个步骤(如图 2 所示)。

cb807654-3b1d-11ee-9e74-dac502259ad0.png

图 2

第一步为目标空间(target space)到标准空间(canonical space)的坐标转换基于用户输入目标输出空间下任意人体动作体型参数和相机外参参数,在目标空间内射出光线,并在光线上采样一系列空间点,利用 SMPL 算法的逆线性蒙皮转换(Inverse Linear Blend Skinning)将目标空间里的空间点转换到标准空间中。

第二步为提取标准空间中 3D 点对应的层级特征(hierarchical feature)。

全局特征(global feature)提取:利用二维编码网络(2D Encoder)从输入图片提取一维特征,并利用映射网络(Mapping Network)和风格编码网络(Style-Based Encoder)进一步将 1D 特征转换为标准空间下的三平面特征(Tri-plane),接下来将标准空间中 3D 点投影到三平面提取相应的全局特征;

点级别特征(Point-Level Feature)提取:首先利用二维编码网络(2D Encoder)从输入图片提取二维特征,并将观测空间(observation space)下 SMPL 的顶点投影到输入图片成像平面上去提取相应特征,紧接着利用 SMPL 算法的逆线性蒙皮转换(Inverse Linear Blend Skinning)将观测空间下 SMPL 的顶点转到标准空间下构建稀疏三维张量,然后利用稀疏卷积得到标准空间中 3D 点的点级别特征;

像素级别特征(Pixel-Aligned Feature)提取:首先利用二维编码网络(2D Encoder)从输入图片提取二维特征,并利用 SMPL 算法的线性蒙皮转换(Linear Blend Skinning)将标准空间中 3D 点转到观测空间下,再投影到输入图片成像平面上去提取相应像素级别特征。

第三步为特征融合(Feature Fusion Transformer),利用 Transformer 模型将三种不同级别的特征进行融合。第四步为人体神经辐射场解码生成相应图片信息,将标准空间中 3D 点坐标,光线方向向量和对应特征输入到人体神经辐射场解码网络中得到 3D 点的体密度和颜色信息,并进一步基于体渲染(Volume Rendering)在目标空间下生成相应像素的颜色值,并得到最终用户输入目标输出空间下任意人体动作体型参数和相机外参参数下的图片。

基于以上步骤,给定目标输出空间下任意人体动作序列(SMPL)参数可以从 2D 图片恢复 3D 数字人并加以驱动。

结果比较

本文在四个人体数据集上人体数据集上进行了实验,分别是 THuman,RenderPeople,ZJU_MoCap,HuMMan。

该研究对比了对比了最先进的可泛化多视角人体图片的人体神经辐射场方法,NHP 和 MPS-NeRF。本文在 peak signal-to-noise ratio (PSNR),structural similarity index (SSIM),以及 Learned Perceptual Image Patch Similarity (LPIPS)进行了比较。如下图所示,本文在所有数据集,所有指标上均大幅超越之前的方案。

cbd5035e-3b1d-11ee-9e74-dac502259ad0.png

SHERF 动态驱动 3D 人体结果如下图所示:

cbed58aa-3b1d-11ee-9e74-dac502259ad0.gifcbf9108c-3b1d-11ee-9e74-dac502259ad0.gifcc0a1490-3b1d-11ee-9e74-dac502259ad0.gif

cec3dc34-3b1d-11ee-9e74-dac502259ad0.gifced5582e-3b1d-11ee-9e74-dac502259ad0.gifcf39d4d4-3b1d-11ee-9e74-dac502259ad0.gif

cf8f8e24-3b1d-11ee-9e74-dac502259ad0.gifcf9d71a6-3b1d-11ee-9e74-dac502259ad0.gifcfb0d688-3b1d-11ee-9e74-dac502259ad0.gif

从左到右分别为input Image、motion seq 1、motion seq 2

本文同样验证了在 in-the-wild DeepFashion 数据上的泛化和驱动效果,如下图 3 所示,给定任意一张输入图片,本文利用单视角估 SMPL 的先进算法估出 SMPL 和相应相机角度,后利用本文提出的算法对 3D 人体进行驱动。实验结果显示 SHERF 具有较强的泛化性。

d02506a2-3b1d-11ee-9e74-dac502259ad0.png

d08b68d4-3b1d-11ee-9e74-dac502259ad0.gifd0b45a14-3b1d-11ee-9e74-dac502259ad0.gif

从左到右分别为input Image、motion seq 1、motion seq 2

应用前景

在游戏电影制作,虚拟现实增强现实或者其他需要数字人建模的场景,用户可以无需专业技能,专业软件,即可通过输入的一张任意相机角度 3D 人体图片,该角度下相机的参数和相应的人体动作体形参数(SMPL),就可以达到重建并驱动该 3D 数字人的目的。

结语

本文提出一种基于单张输入图片可泛化可驱动的人体神经辐射场方法 SHERF。可以承认的是,本文依然存在一定的缺陷。

首先,对于输入图片观测不到一部分人体表面, 渲染出来的结果可以观察到一定的瑕疵,一个解决的办法是建立一种遮挡可知(occlusion-aware)的人体表征。

其次,关于如何补齐输入图片观测不到人体部分依旧是一个很难得问题。本文从重建角度提出 SHERF,只能对观测不到的人体部分给出一个确定性的补齐,对观测不到部分的重建缺乏多样性。一个可行的方案是利用生成模型在观测不到的人体部分生成多样性高质量的 3D 人体效果。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    54

    文章

    9027

    浏览量

    153549
  • 编码器
    +关注

    关注

    45

    文章

    3906

    浏览量

    141549

原文标题:ICCV 2023 | SHERF:可泛化可驱动人体神经辐射场的新方法

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奥松电子荣获2025年中国创新方法大赛全国总决赛二等奖

    2025年11月18日-21日,2025年中国创新方法大赛总决赛在山东省泰安市成功举办。国内MEMS智能传感器与半导体关键零部件领域的国家级专精特新“小巨人”企业——广州奥松电子股份有限公司,凭借
    的头像 发表于 12-05 15:17 356次阅读

    海康威视荣获2025年中国创新方法大赛总决赛金奖

    近日,2025年中国创新方法大赛圆满落幕。海康威视凭借《工业听诊师——超长距离皮带运输机托辊声纹监测系统》项目脱颖而出,斩获全国总决赛唯一金奖。
    的头像 发表于 12-04 10:55 261次阅读

    奥松半导体荣获2025中国创新方法大赛重庆赛区二等奖

    近日,2025年中国创新方法大赛(重庆赛区)暨第八届重庆市创新方法大赛圆满落幕。本届大赛以“培育创新人才,服务产业发展”为主题,旨在激发企业创新活力,推动科技创新与产业创新深度融合。大赛由重庆市科协
    的头像 发表于 11-19 11:34 631次阅读
    奥松半导体荣获2025中国创<b class='flag-5'>新方法</b>大赛重庆赛区二等奖

    雷达模组 Rd-03_V2 人体状态监测

    。 Rd-03_V2模组对运动人体的最远感应距离为7m,感知区域内人体状态,实现实时检测。提供可视的配置工具,轻松配置感应距离范围、
    的头像 发表于 10-23 10:37 350次阅读
    雷达模组 Rd-03_V2 <b class='flag-5'>人体</b>状态监测

    人体静电释放器降低静电事故风险

    在化工、油田、电子制造等高危行业,人体静电积累可能引发火灾爆炸等重大事故。蒙冬智能工业立式人体静电消除器作为专业安全设备,通过科学设计有效阻断静电危害,已成为现代工业不可或缺的防护屏障。核心
    的头像 发表于 10-17 19:30 294次阅读
    <b class='flag-5'>人体</b>静电释放器<b class='flag-5'>可</b>降低静电事故风险

    【产品介绍】Altair SimLab连接CAD的多物理工作流

    AltairSimLab连接CAD的多物理工作流SimLab是一种以流程为导向的多学科仿真环境,能够准确分析复杂装配件的性能。包括结构、热和流体动力学在内的多物理可以通过高度自动
    的头像 发表于 09-19 17:02 574次阅读
    【产品介绍】Altair SimLab<b class='flag-5'>可</b>连接CAD的多物理<b class='flag-5'>场</b>工作流

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    、Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块的指令集架构(ISA)。优势如下: ①模块特性②标准接口③开源
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    、集成芯片、分子器件与分子忆阻器,以及打印类脑芯片等。 第五章至第八章分别探讨用化学或生物方法实现AI、AI在科学发现中创新应用、实现神经形态计算与类脑芯片的创新方法,以及具身智能芯片。 第九章
    发表于 09-05 15:10

    芯片制造中高精度膜厚测量与校准:基于红外干涉技术的新方法

    、环境光干扰及薄膜倾斜等因素限制,测量精度难以满足高精度工业需求。为此,本研究提出一种融合红外干涉与激光校准的薄膜厚度测量新方法,旨在突破传统技术瓶颈,实现更精准、
    的头像 发表于 07-21 18:17 2595次阅读
    芯片制造中高精度膜厚测量与校准:基于红外干涉技术的<b class='flag-5'>新方法</b>

    Simcenter STAR-CCM+电磁学:多物理环境下快速、扩展的电磁分析工具

    优势先进的电磁求解器可对低频应用进行精确分析单一集成多物理环境提高物理逼真度,扩大应用范围在同一仿真中,计算电磁学与计算流体力学(CFD)/热物理学耦合低频电磁学的有限体积和有限元离散可用
    的头像 发表于 07-16 10:51 549次阅读
    Simcenter STAR-CCM+电磁学:多物理<b class='flag-5'>场</b>环境下快速、<b class='flag-5'>可</b>扩展的电磁分析工具

    无刷直流电机反电势过零检测新方法

    新方法。在三相采样等效电路上分别并联一组三极管控制的电阻分压开关电路,参考电机转速线性调节控制信号占空比,以此控制三极管通断,从而调节电阻分乐开关电路阻值,可以避免高速时反电势幅值高于检测电路供电电压
    发表于 06-26 13:50

    BP神经网络的优缺点分析

    自学习能力 : BP神经网络能够通过训练数据自动调整网络参数,实现对输入数据的分类、回归等任务,无需人工进行复杂的特征工程。 能力强 : BP神经网络通过训练数据学习到的特征表示
    的头像 发表于 02-12 15:36 1629次阅读

    判断膨胀石墨好坏的方法

    在现代工业中,膨胀石墨作为一种高性能材料,广泛应用于石油化工、纺织、冶金、电力、机械、船舶、消防、航天及核能等领域。其优良的可塑性、柔韧延展性和密封性,以及耐高温、耐高压、耐腐蚀、耐辐射等特性
    的头像 发表于 01-09 15:09 1114次阅读

    大华股份荣获中国创新方法大赛一等奖

    近日,备受瞩目的2024年中国创新方法大赛全国总决赛在重庆圆满落下帷幕。此次大赛由中国科协与重庆市人民政府联合主办,吸引了众多创新企业和团队参与,共同展示创新成果,角逐荣誉奖项。 在这场创新盛宴中
    的头像 发表于 12-27 14:50 898次阅读

    基于遗传算法的QD-SOA设计新方法

    了QD-SOA的设计,提出了一种基于遗传算法的QD-SOA设计新方法。由于具有用于设计的模型是必不可少的,因此在第一步中获得数值模型。然后,利用从数值模型中采样的训练数据建立人工神经网络模型。实验表明,该神经模型具有较高的精度和
    的头像 发表于 12-17 09:58 705次阅读
    基于遗传算法的QD-SOA设计<b class='flag-5'>新方法</b>