Single-View View Synthesis with Multiplane Images

最近在视图合成方面的一系列工作使用深度学习来生成多平面图像——一种以相机为中心的分层 3D 表示——给定两个或多个已知视点的输入图像。我们将此表示应用于单视图视图合成,这是一个更具挑战性但可能具有更广泛应用的问题。我们的方法直接从单个图像输入中学习预测多平面图像,并且我们引入了用于监督的尺度不变视图合成,使我们能够在在线视频上进行训练。我们展示了这种方法适用于几个不同的数据集,它还生成了合理的深度图,并且它学会了在背景层中填充前景对象边缘后面的内容。
ASSET: Autoregressive Semantic Scene Editing with Transformers atHigh Resolutions

我们提出了资产,一种神经架构,用于根据用户对其语义分割图的编辑自动修改输入的高分辨率图像。我们的架构基于具有新颖注意力机制的转换器。我们的关键思想是在高分辨率下稀疏变换器的注意力矩阵,由在较低图像分辨率下提取的密集注意力引导。虽然以前的注意力机制在处理高分辨率图像时计算成本太高,或者在阻碍远程交互的特定图像区域内受到过度限制,但我们新的注意力机制在计算上既高效又有效。我们的稀疏注意力机制能够捕捉远程交互和上下文,从而合成场景中有趣的现象,例如景观到水面上的反射或与景观的其余部分一致的论坛,这些是以前的卷积网络无法可靠生成的和变压器方法。我们提供定性和定量结果,以及用户研究,证明我们方法的有效性。
我们的代码和数据集可在我们的项目页面上找到:https://github.com/DifanLiu/ASSET
审核编辑 :李倩
-
图像
+关注
关注
2文章
1096浏览量
42438 -
深度学习
+关注
关注
73文章
5608浏览量
124635
原文标题:2022 siggrqph:图像和视频生成(2)
文章出处:【微信号:计算机视觉芯片设计,微信公众号:计算机视觉芯片设计】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
单轴/多轴 Trinamic 电机驱动模块怎么选?
多通道兼容图像采集卡:一机搞定多路图像信号处理
MAX20361:小型单/多电池太阳能收集器的卓越之选
超景深显微镜在材料学中的应用
应用多光谱数字图像区分苗期作物与杂草的研究进展
台阶仪在多镀层膜厚中的应用:基于单基体多膜标准实现0.5%高精度测量
电线是多芯的好还是单芯的好
平面以太网配线架的优点有哪些
电压放大器驱动合成射流的涡结构演化与掺混增强机制研究
TechWiz LCD 3D应用:FFS仿真
图像采集卡与视频采集卡的主要区别对比
多平面图像的单视图合成
评论