0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia Research开发的深度学习模型,轻松地将粗糙的涂鸦变成照片级的写实杰作

jmiy_worldofai 来源:lp 2019-03-22 14:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一个新手画家可能会用画笔在画布上画画,目的是创作一幅壮美的日落景观图——崎岖的、白雪覆盖的山峰倒映在清澈的湖泊中——但最终画出来的只不过是一些看起来更像多色墨水点的东西。

但是,由 Nvidia Research 开发的深度学习模型却恰恰相反:它可以轻松地将粗糙的涂鸦变成照片级的写实杰作。该工具利用生成的对抗网络(GANs)将语意分割图转换为逼真的图像。

这款使用该模型的交互式应用程序,轻轻松松地就达到了后印象派画家的水平,它被命名为 GauGAN。

后印象派画家 Paul Gauguin 画了几幅自画像,包括这幅自 1885 年起就收藏在 Kimbell 艺术博物馆的作品(照片来自 Wikimedia Commons)。

GauGAN 可以为从建筑师、城市规划者到景观设计师和游戏开发商的每个人提供一个强大的工具来创建虚拟世界。有了一个能够理解现实世界的人工智能,这些专业人员可以更好地设计出想要的原型,并快速改变它们。

NVIDIA 应用深度学习研究院副总裁 Bryan Catanzaro 说:「用简单的草图进行头脑风暴设计要容易得多,而且这项技术能够将草图转换成高度逼真的图像。」

Catanzaro 将 GauGAN 背后的技术比作「智能画笔」,它可以在粗略的语意分割图(即显示场景中对象位置的高级轮廓)中填充细节。

GauGAN 使用户可以画出语意分割图,并合成自己需要的场景,其中,这些分割图都需要相应的标签,如天空、大海或者雪。

经过 100 万张图片的训练,深度学习模型通过结果来填充景观:在池塘中画画,附近的元素如树木和岩石将在水中映射。将一个段标签从「草地」换成「雪」,整个图像将变为冬季场景,原来枝繁叶茂的树木则变成了不毛之地。

Catanzaro 说:「这就像一幅彩色的图画,描绘了一棵树在哪里,太阳在哪里,天空在哪里。」然后,神经网络能够根据对真实图像的了解,填充所有细节和纹理,以及反射、阴影和颜色。

由于 GANs 是由一对网络——生成器和对抗器组成的,因此,尽管缺乏对真实世界的了解,但它仍然可以生成让人满意的图像。生成器创建图像并呈现给对抗器。对抗器在真实图像上训练后,反馈给生成器如何逐素提高合成图像的真实性。

经过对真实图像的训练后,对抗器知道真实的池塘和湖泊是包含反射的——因此生成器学会了创造令人惊叹的逼真图像。

该工具还允许用户添加样式过滤器,更改生成的图像以适应特定画家的风格,或将日间场景更改为日落场景。

Catanzaro 说:「这项技术不仅仅是将其他图像拼接在一起或者剪切和粘贴纹理,它实际上是合成新的图像,这和艺术家创造新东西的方法非常相似。」

虽然 GauGAN 应用程序专注于陆地、海洋和天空等自然元素,但底层的神经网络也有能力填充其他景观特征,包括建筑物、道路和人等。

关于 GauGAN 的研究论文已被 6 月的 CVPR 会议评为 Oral 论文——而获得这一殊荣的论文不到提交论文总数的 5%。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5509

    浏览量

    109145
  • 人工智能
    +关注

    关注

    1813

    文章

    49776

    浏览量

    261847
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123955

原文标题:涂鸦秒变真实风景,NVIDIA GauGAN让你也可以拥有天才之笔!

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算力限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    领域主流开发环境,LabVIEW与深度学习的集成一直是行业痛点。课程提供独家开发的labview调用框架,实现从模型训练(Python)到部
    发表于 12-03 13:50

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 573次阅读

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

      由 NVIDIA、Google DeepMind 以及 Disney Research 联合开发的开源物理引擎 Newton,现可在 NVIDIA Isaac Lab 中使用。这一
    的头像 发表于 09-30 09:52 2794次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新开源<b class='flag-5'>模型</b>与仿真库加速机器人研发进程

    电动机噪声、振动和声振粗糙开发:使用低计算成本的系统模型预测早期噪声、振动和声振粗糙

    优势使用计算成本低的系统模型在动态运行条件下对电驱动装置执行早期噪声、振动和声振粗糙度评估优化电机控制策略并做出更好的设计选择,以提高电动汽车的噪声、振动和声振粗糙度使用Simcen
    的头像 发表于 08-13 11:46 554次阅读
    电动机噪声、振动和声振<b class='flag-5'>粗糙</b>度<b class='flag-5'>开发</b>:使用低计算成本的系统<b class='flag-5'>级</b><b class='flag-5'>模型</b>预测早期噪声、振动和声振<b class='flag-5'>粗糙</b>度

    自动驾驶中Transformer大模型会取代深度学习吗?

    持续讨论。特别是在自动驾驶领域,部分厂商开始尝试多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算力成本、安全需求与
    的头像 发表于 08-13 09:15 3945次阅读
    自动驾驶中Transformer大<b class='flag-5'>模型</b>会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    网关智商暴增!涂鸦T5AI网关开发框架让设备秒懂人话,兼容国内外顶尖AI大模型

    2025年2月,涂鸦全新发布WuKongAI硬件开发框架(点击查看WuKongAI硬件开发框架往期介绍),为广大智能设备和AI玩具开发者提供了强有力的技术支撑!在此基础上,我们
    的头像 发表于 05-22 18:30 1102次阅读
    网关智商暴增!<b class='flag-5'>涂鸦</b>T5AI网关<b class='flag-5'>开发</b>框架让设备秒懂人话,兼容国内外顶尖AI大<b class='flag-5'>模型</b>

    2025 TUYA全球开发者大会开幕在即!涂鸦携手五大模型巨头共话AI应用落地之道

    4月23日,2025TUYA全球开发者大会即将在深圳盛大举行。此次大会,涂鸦智能将以“AI+IoT”为主题,旨在模型、智能算法等前沿AI技术与IoT
    的头像 发表于 04-10 19:04 650次阅读
    2025 TUYA全球<b class='flag-5'>开发</b>者大会开幕在即!<b class='flag-5'>涂鸦</b>携手五大<b class='flag-5'>模型</b>巨头共话AI应用落地之道

    NVIDIA Research在多个领域不断取得突破

    近二十年来,NVIDIA Research 的研究成果催生了包括 NVIDIA DLSS、NVLink 和 Cosmos 在内的标志性产品。
    的头像 发表于 03-28 09:52 777次阅读

    用树莓派搞深度学习?TensorFlow启动!

    介绍本页面指导您在搭载64位Bullseye操作系统的RaspberryPi4上安装TensorFlow。TensorFlow是一个专为深度学习开发的大型软件库,它消耗大量资源。您可
    的头像 发表于 03-25 09:33 985次阅读
    用树莓派搞<b class='flag-5'>深度</b><b class='flag-5'>学习</b>?TensorFlow启动!

    在OpenVINO™工具套件的深度学习工作台中无法导出INT8模型怎么解决?

    无法在 OpenVINO™ 工具套件的深度学习 (DL) 工作台中导出 INT8 模型
    发表于 03-06 07:54

    涂鸦智能与火山引擎达成重磅合作,亿元补贴全力构建AIoT开发者生态

      全球化AI云开发者平台涂鸦智能(NYSE: TUYA,HKEX: 2391)宣布与火山引擎达成重磅合作,双方火山引擎旗下豆包大模型接入涂鸦
    的头像 发表于 02-28 09:01 540次阅读
    <b class='flag-5'>涂鸦</b>智能与火山引擎达成重磅合作,亿元补贴全力构建AIoT<b class='flag-5'>开发</b>者生态

    NVIDIA推出多个生成式AI模型和蓝图

    NVIDIA 宣布推出多个生成式 AI 模型和蓝图, NVIDIA Omniverse 一体化进一步扩展至物理 AI 应用,如机器人、自动驾驶汽车和视觉 AI 等。全球软件
    的头像 发表于 01-08 10:48 1052次阅读

    Triton编译器在机器学习中的应用

    1. Triton编译器概述 Triton编译器是NVIDIA Triton推理服务平台的一部分,它负责深度学习模型转换为优化的格式,以便
    的头像 发表于 12-24 18:13 1660次阅读

    LG AI Research使用亚马逊云科技开发AI模型 加快癌症诊断速度

    16日 /美通社/ -- 亚马逊云科技在2024 re:Invent全球大会上宣布,韩国LG集团旗下人工智能研究中心LG AI Research基于全球领先的云计算平台开发了新的病理基础模型(FM
    的头像 发表于 12-16 15:13 636次阅读
    LG AI <b class='flag-5'>Research</b>使用亚马逊云科技<b class='flag-5'>开发</b>AI<b class='flag-5'>模型</b> 加快癌症诊断速度