0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GANcraft可解决图像到图像转换问题

星星科技指导员 来源:NVIDIA 作者:Nathan Horrocks 2022-04-06 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 和康奈尔大学的科学家们引入了一种混合的无监督神经渲染管道,以有效地表示体素世界中的大型复杂场景。从本质上讲, 3D 艺术家只需要构建最小值,剩下的部分将由算法来构建照片级真实感世界。研究人员将这种混合神经渲染管道应用于 Minecraft 区块世界,以生成更逼真的 Minecraft 场景。

NVIDIA 和更广泛的研究团体( pix2pix 、 pix2pixHD 、 MUNIT 、 SPADE )以前的工作已经解决了图像到图像转换( im2im )的问题——将图像从一个域转换到另一个域。乍一看,这些方法似乎为将一个世界转换为另一个世界的任务提供了一个简单的解决方案—一次翻译一幅图像。但是, im2im 方法不保持视点一致性,因为它们不了解 3D 几何体,并且每个 2D 帧都是独立生成的。从下面的图像中可以看出,这些方法的结果会产生抖动和突然的颜色和纹理变化。

输入 GANcraft ,这是一种直接在 3D 输入世界上操作的新方法。

研究人员在 study 中解释说:“由于用户创建的块世界根本不存在地面真实照片级真实感渲染,我们必须通过间接监督来训练模型。”。

该方法的工作原理是在输入块世界中随机采样摄影机视图,然后想象该视图的真实照片版本是什么样子。这是在 SPADE 的帮助下完成的,这是 NVIDIA 先前在图像到图像转换方面的工作,也是流行的 GauGAN 演示中的关键组件。 GANcraft 通过使用样式调节网络克服了这些生成的“伪真实”的视图不一致性,该网络可以消除世界结构与渲染样式之间的歧义。这使 GANcraft 能够生成与视图一致的输出视频,并且具有不同的风格。

虽然研究结果在 Minecraft 中得到了验证,但该方法适用于其他 3D 块体世界,如体素。缩短构建高清世界所需的时间和专业知识的潜力增加了这项研究的价值。它可以帮助游戏开发者、 CGI 艺术家和动画产业缩短构建这些巨大而令人印象深刻的世界所需的时间。

GANcraft 是在 Imaginaire 库中实现的。该库针对生成模型和生成对抗网络的训练进行了优化,支持多 GPU 、多节点和自动混合精度训练。 NVIDIA 制作的 10 多种不同研究成果以及预训练模型已经发布。随着时间的推移,此库将继续使用更新的作品进行更新。

关于作者

Nathan Horrocks 是 NVIDIA Research 的内容营销经理。他重点强调了 NVIDIA 实验室在世界各地进行的惊人研究。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5731

    浏览量

    110321
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5335

    浏览量

    136239
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    多通道兼容图像采集卡:一机搞定多路图像信号处理

    在工业自动化、安防监控、智能检测、医疗影像等领域,随着应用场景的不断升级,单路图像采集已无法满足多路信号同步接入、实时处理的重要需求。多通道兼容图像采集卡应运而生,以“一机集成、多路协同”为重要优势
    的头像 发表于 03-19 14:17 285次阅读
    多通道兼容<b class='flag-5'>图像</b>采集卡:一机搞定多路<b class='flag-5'>图像</b>信号处理

    使用JPU对jpg图像进行转换,使用的工具为ffmpeg,转换出来的图像颜色失调严重,请问这是什么情况?

    我正在使用JPU对jpg图像进行转换,使用的工具为ffmpeg,转换出来的图像颜色失调严重,请问这是什么情况?
    发表于 02-05 07:19

    基于降压转换器的工业图像传感器供电方案教程

    电源、低压差稳压器(LDO)、Hyperlux CMOS图像传感器等展开讲解。作为系列教程的第一部分,本文将介绍稳压型降压电源的关键组成部分、降压转换器的工作原理、连续导通与断续导通等。
    的头像 发表于 01-27 07:38 9639次阅读
    基于降压<b class='flag-5'>转换</b>器的工业<b class='flag-5'>图像</b>传感器供电方案教程

    图像采集卡:连接设备与数据的图像枢纽

    在机器视觉与图像传输体系中,图像采集卡是无可替代的重要枢纽——它一端承接相机、内窥镜、摄像机等前端图像设备的信号输出,另一端对接后端数据处理、存储、展示系统,通过信号转换、同步协调、高
    的头像 发表于 01-22 13:51 450次阅读
    <b class='flag-5'>图像</b>采集卡:连接设备与数据的<b class='flag-5'>图像</b>枢纽

    数字图像采集的核心载体——图像采集卡技术白皮书

    在工业自动化、医疗影像、广电直播、科研成像等领域,图像采集卡作为连接前端图像设备与后端计算系统的核心硬件,是实现物理图像向数字信号转化并高效传输的关键枢纽。它解决了原始图像信号与计算机
    的头像 发表于 01-21 16:18 476次阅读
    数字<b class='flag-5'>图像</b>采集的核心载体——<b class='flag-5'>图像</b>采集卡技术白皮书

    EspeedGrab图像采集软件介绍(Cameralink转USB采集)

    /14/16; 黑白、彩色、Bayer;可见、红外、紫外;线阵、面阵; 2 图像存储录制 逐帧、跳帧、定时等多模式存储; BMP、JPEG、RAW、AVI等,视频或者图片皆可以。 3 特殊格式支持
    发表于 12-23 17:26

    从信号数据的“魔法转换”:图像采集卡如何让机器“看懂”世界?

    ?这背后,图像采集卡正扮演着“信号翻译官”与“数据搬运工”的双重角色,用一系列精密的技术操作,完成从信号数据的“魔法转换”,为机器搭建起“看懂”世界的核心桥梁。
    的头像 发表于 12-17 14:58 545次阅读
    从信号<b class='flag-5'>到</b>数据的“魔法<b class='flag-5'>转换</b>”:<b class='flag-5'>图像</b>采集卡如何让机器“看懂”世界?

    从模拟AI集成:图像采集卡的技术演进与未来三大趋势

    作为机器视觉系统连接物理视界与数字大脑的核心枢纽,图像采集卡始终以“信号翻译官”的身份,推动着视觉信息处理技术的迭代升级。从早期简单的模拟信号转换如今支持超高清采集与AI预处理的智能设备,其发展
    的头像 发表于 12-15 16:30 1220次阅读
    从模拟<b class='flag-5'>到</b>AI集成:<b class='flag-5'>图像</b>采集卡的技术演进与未来三大趋势

    图像采集卡:机器视觉时代的图像数据核心枢纽

    一、图像采集卡的技术本质:从信号数据的“转换器”与“传输通道”图像采集卡(ImageCaptureCard)是机器视觉系统的核心硬件组件,本质是通过专用芯片(如FPGA、ASIC)实
    的头像 发表于 11-12 15:15 973次阅读
    <b class='flag-5'>图像</b>采集卡:机器视觉时代的<b class='flag-5'>图像</b>数据核心枢纽

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 902次阅读
    基于FPGA的CLAHE<b class='flag-5'>图像</b>增强算法设计

    如何将图像文件转换为二进制文件?

    如何将图像文件转换为二进制文件
    发表于 09-05 08:28

    无法使用OpenVINO™在 GPU 设备上运行稳定扩散文本图像的原因?

    在OpenVINO™ GPU 设备上使用图像大小 (1024X576) 运行稳定扩散文本图像,并收到错误消息: RuntimeError: Exception from
    发表于 06-25 06:36

    图像采集卡:机器视觉与专业成像的关键桥梁

    在当今数字化时代,从工业自动化检测到医疗影像诊断,从科学研究高清视频制作,图像信息的实时获取和处理变得至关重要。而将现实世界的光信号(通过摄像头或相机)高效、准确地转换为计算机能够处理的数字
    的头像 发表于 06-19 12:25 1378次阅读
    <b class='flag-5'>图像</b>采集卡:机器视觉与专业成像的关键桥梁

    在线图像测量仪测量案例展示

    在线图像测量仪能够应用在各个领域,实时测量精度高1μm
    的头像 发表于 06-18 17:04 935次阅读
    在线<b class='flag-5'>图像</b>测量仪测量案例展示

    HarmonyOS应用图像stride处理方案

    图像存储在内存中时,内存缓冲区可能在每行像素之后包含额外的填充字节。填充字节会影响图像在内存中的存储方式,但不会影响图像的显示方式。stride是内存中一行像素内存中下一行像素的字
    的头像 发表于 06-10 14:17 1424次阅读
    HarmonyOS应用<b class='flag-5'>图像</b>stride处理方案