0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

4DGen:基于动态3D高斯的可控4D生成新工作

CVer 来源:CVer 2024-01-04 15:57 次阅读

一、研究背景

尽管3D和视频生成取得了飞速的发展,由于缺少高质量的4D数据集,4D生成始终面临着巨大的挑战。过去几篇工作尝试了Text-To-4D的任务,但依然存在两个主要问题:

1.由于输入依赖于单视角的图片或者简单的文本描述,并不能保证得到精准的4D结果,需要花费大量的时间进行反复调整。

2.尽管采用了Hexplane作为4D的表征,基于NeRF的方法在高分辨率和长视频上的渲染所需要的计算时间和显存占用是难以接受的。即使采用了一个超分辨的后处理网络,依然会有模糊和闪烁的结果。

为了解决上述问题,4DGen定义了“Grounded 4D Generation“新型任务形式,并且设计了新的算法框架实现高质量的4D内容生成。

二、任务定义

过往的4D生成工作是“one click“的方式,并不能对生成的结果进行有效的控制。4DGen提出了“Grounded 4D Generation“的形式,通过利用视频序列和可选的3D模型作为4D生成的控制信息,可以实现更为精准的4D内容生成。用户可通过输入视频序列或3D模型来约束4D结果的运动和外观;当用户仅提供单张图片作为输入时,可借助预训练好的视频生成模型来得到视频序列;当用户未提供3D模型时,可通过单张图片重建3D模型来作为起始点。

4b408368-a72d-11ee-8b88-92fbcf53809c.png

三、方法介绍

4DGen框架的输入起始点为用户给定或者模型生成的视频序列,对于任意的单张图片,借助多视角生成模型(multi-view diffusion model),可以得到不同视角的图片。4DGen通过对第一帧多视图进行三维重建,得到初始的静态3D Gaussians作为4D生成的起始点。

由于4D数据的匮乏,需要尽可能的从先验模型中蒸馏信息。4DGen将每一帧生成的多视图作为2D伪标签,并且采用多视图生成的点云作为3D点的伪标签来监督训练过程。

因为多视图生成具有ill-posed的特点,得到的伪标签在不同视角之间,不同时序之间存在不连续性,需要引入时间和空间上的一致性损失函数进行约束。相较于拟合多视图DDIM采样得到的图片,score distillation sampling(SDS)是根据先验的扩散模型对场景表达进行似然估计。

4DGen依据正面视角计算任意视角图片在Zero123模型上的SDS损失,用于提升空间上的连续性。为了缓解闪烁问题,4DGen引入了无监督的时间平滑约束。通过计算平面的平滑损失和Gaussians不同时刻的平滑损失,有效提升了时间上的一致性。

4b490ca4-a72d-11ee-8b88-92fbcf53809c.png

四、实施细节

4DGen的 4D表达采用了4D Gaussian Spaltting的方式,通过一个多分辨率Hexplane对每个Gaussian进行编码。将6个时空平面的特征进行相加,并经过一个额外的MLP解码得到对应Gaussian在不同时刻的位置偏移量。

训练上采用三阶段方式,第一阶段对场景进行静态建模,第二阶段利用2D和3D的伪标签进行动态场景的初步建模,第三建模利用平滑损失增强模型的细节和连续性。

所有实验可以在一张RTX3090上完成,对于2.5万个Gaussians只需45分钟的训练,对于9万个Gaussians训练2小时可以得到更加好的细节效果。

五、实验结果

4DGen可以实现不同视角、不同时间的高质量图片渲染。相较于对比方法在细节表达、噪声去除、颜色还原、时空连续性等方面有显著提升。更多视觉效果可以参考项目主页。

4b62246e-a72d-11ee-8b88-92fbcf53809c.png

量化对比上,4DGen采用了不同时序图片和参考图片的CLIP距离来衡量生成质量,采用CLIP-T衡量不同时间下的图像连续性。4DGen在多项指标上明显优于过往方法。

4b7e341a-a72d-11ee-8b88-92fbcf53809c.png

六、总结

4DGen定义了” Grounded 4D Generation“的任务形式,通过视频序列和可选3D模型的引入提升了4D生成的可控性。通过高效的4D Gaussian Splatting的表达,2D和3D伪标签的监督和时空的连续性约束,使得4DGen可以实现高分辨率、长时序的高质量的4D内容生成。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编解码
    +关注

    关注

    1

    文章

    138

    浏览量

    19336
  • SDS
    SDS
    +关注

    关注

    0

    文章

    45

    浏览量

    15127
  • 3D模型
    +关注

    关注

    1

    文章

    67

    浏览量

    15586
  • MLP
    MLP
    +关注

    关注

    0

    文章

    56

    浏览量

    4073

原文标题:3DGS杀疯了!4DGen:基于动态3D高斯的可控4D生成新工作

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    颠覆传统!4D主动学习法,电子技术难学吗?

    电子技术4D
    李皆宁讲电子
    发布于 :2023年09月04日 11:18:33

    丰田 4D芯片区分方法

    本帖最后由 ⊙菰輈億葉⊙ 于 2014-3-2 22:57 编辑 丰田 4D芯片区分方法
    发表于 03-02 22:55

    谁有滑动变阻器的3D模型VR4的?

    谁有VR4封装的滑动变阻器的3D模型?请帮我一把,急需!!!谢谢了!!!
    发表于 05-27 22:19

    生成显示4D数据——LabVIEW中3D Mesh的研究,附赠256色色谱生成

    各种设置,再也不用在程序框图编写烦人的属性节点了。而且还有右键另存为的功能导出图片!!见3D Scatter.vi控件:框图:4 附赠256色色谱生成器(\Color Spectrum\Color
    发表于 07-11 13:34

    客厅新用法:4D VR馆

    `有了虚拟实境VR头戴式显示器,和4D影院的区别可能主要就是遇到座椅了。这个多自由度运动座椅放在家里不太划算,但是把家里的一般沙发直接改造成运动沙发感觉好多了。Kickstarter 上正在众筹
    发表于 02-24 11:18

    AD+Solidworks配合=3D模型相关问题

    ),丝印丢失。元器件的3D效果完美重建模。③使用AD-SW插件直接转换(器件生成还是选用由3D封装STEP生成选项)理论效果完美,丝印、走线、器件、焊盘均完美,且各层
    发表于 07-12 11:33

    Elements 4D一款先进的增强现实学习应用

    苹果在6月发布的一段宣传视频《The App Effect》,其中在03:46的时候,Elements 4D的Gaia Dempsey介绍了一款神奇的“Elements 4D by DAQRI
    发表于 09-20 10:16

    用于BBB的4D系统Gen4 LCD触摸屏如何校准

    我在使用电阻式触摸屏的4D Systems Gen4 7“LCD显示器上校准触摸屏时遇到问题。在显示器中心附近,校准非常接近但边缘附近的距离超过0.25英寸。在左下方LCD的一角指针出现在触摸点
    发表于 10-22 14:21

    Litestar 4D照明工程设计软件

    4D是一套功能强大,灵活性高且能自由配置的照明设计软件:确保了每个环节都能高效完成。它正在帮助数以百计的客户,使得他们每日的工作效率大大提高。了解详情可加QQ:2987619807
    发表于 03-26 10:53

    浩辰3D软件入门教程:如何比较3D模型

    差异。步骤一:点选「比较模型」功能在浩辰3D软件的开始菜单中,选择「工具」选项卡,并且点选「比较模型」功能。输入参考模型和工作模型的文件信息。如果参考模型存在修改后,未保存的情况,则按照提示进行保存
    发表于 12-15 13:45

    AD的3D模型绘制功能介绍

    一共提供了4种类型,类型1常规型,类型2时圆柱体模型,类型3是外部模型,类型4是球体模型。我们根据器件实际形状来选择类型。    图(2)3D模型类型选择  比如我们要画0805电阻的
    发表于 01-14 16:48

    3D软件中如何应用文本特征?3D文本特征应用技巧

    轮廓的方向;(3)其他情况若是放置于圆弧或曲线时,同样可以通过绘制样条曲线+旋转的方式,对文本轮廓进行重新定位。3、文本特征生成创建文本轮廓后,可使用「拉伸」命令生成
    发表于 04-22 17:28

    浩辰3D的「3D打印」你会用吗?3D打印教程

    、空隙填充若3D模型存在空隙,浩辰3D能自动识别3D模型上的空隙,并以红X的形式标出,点击确认后,即可直接填满这个空隙,完成填补,从而便于打印设备的工作机制。
    发表于 05-27 19:05

    3D图像生成算法的原理是什么?

    什么是3D图形芯片?3D图像生成算法的原理是什么?
    发表于 06-04 06:29

    3D NAND与4D NAND之间的差别在哪儿?

    什么是3D NAND?什么是4D NAND?3D NAND与4D NAND之间的差别在哪儿?
    发表于 06-18 06:06