0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达新开源的工具它利用生成对抗网络,随便几个线条就能生成栩栩如生的图像

电子工程师 来源:lq 2019-04-29 15:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一个新手画家经常会出现自己想画的,和实际画出来的效果大相径庭的情况,但英伟达(NVIDIA)新开源的工具就厉害了,它利用生成对抗网络(GAN),随便几个线条就能生成栩栩如生的图像

使用该模型的互动应用程序被命名为GauGAN,以此来致敬印象派画家梵高。深度学习研究副总裁Bryan Catanzaro说:“通过简单的草图进行头脑风暴设计要容易得多,而且这种技术能够将草图转换成高度逼真的图像。”

Catanzaro将GauGAN背后的技术比作“智能画笔”,可以填充草图中的细节,粗略分割图是显示场景中物体位置的高级轮廓图。下图是一个NVIDIA样本输入和输出

还有这样的:

“这就像一张彩图图片描述了一棵树在哪里,太阳在哪里,天空在哪里,”卡坦扎罗说。“然后神经网络能够根据它对真实图像的了解,填充所有的细节和纹理,折射,以及阴影和颜色。”

GauGAN 背后的技术来自来自英伟达和 MIT 的研究团队。这个团队,包括来自英伟达的 Ting-Chun Wang、刘明宇(Ming-Yu Liu),Taesung Park (当时在英伟达实习),以及来自 MIT 的朱俊彦(Jun-Yan Zhu)。

目前,SPADE已经在GitHub上获得3616个Star,264个Fork。(GitHub地址:https://github.com/NVlabs/SPADE)

安装方法

克隆这个 repo

gitclonehttps://github.com/NVlabs/SPADE.gitcdSPADE/

此代码需要PyTorch 1.0和python 3+。需安装依赖项

pipinstall-rrequirements.txt

此代码还需要Synchronized-BatchNorm-PyTorch同步。

cdmodels/networks/gitclonehttps://github.com/vacancy/Synchronized-BatchNorm-PyTorchcpSynchronized-BatchNorm-PyTorch/sync_batchnorm.-rfcd../../

最后,如果你想要看见文中所展现的效果,你还需要一台有8个 V100 GPU 的 NVIDIA DGX1 机器。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2392

    浏览量

    84947
  • 英伟达
    +关注

    关注

    23

    文章

    4129

    浏览量

    99784
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124759

原文标题:英伟达又现神操作,程序员也能成画家!

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技发布并开源新一代原生理解生成统一模型SenseNova U1系列

    近日,商汤科技发布并开源新一代原生理解生成统一模型SenseNova U1系列,随后壁仞科技、寒武纪、昆仑芯、摩尔线程、中科海光等10家国产芯片公司,均已完成对开源的SenseNova U1 Lite系列的Day 0适配。
    的头像 发表于 05-08 16:26 672次阅读

    大晓机器人开源实时生成世界模型Kairos 3.0-4B

    近日,大晓机器人重磅开源开悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作为业内首个实现 “多模态理解 — 生成 — 预测” 一体化的开源具身原生世界模型,该模型以 “物理
    的头像 发表于 03-14 16:54 2092次阅读
    大晓机器人<b class='flag-5'>开源</b>实时<b class='flag-5'>生成</b>世界模型Kairos 3.0-4B

    企业级AI Agent王炸! 英伟GTC将开源 NemoClaw

    的客户。英伟已向 Salesforce、Cisco、Google、Adobe 和 CrowdStrike 接洽合作,计划在平台中内建安全与隐私工具
    的头像 发表于 03-10 11:35 9522次阅读
    企业级AI Agent王炸! <b class='flag-5'>英伟</b><b class='flag-5'>达</b>GTC将<b class='flag-5'>开源</b> NemoClaw

    使用Firebase AI Logic生成图像模型的两种新功能

    为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文将探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑功能预览版;其二
    的头像 发表于 11-30 09:28 624次阅读

    如何选择适合的智驾仿真工具进行场景生成和测试?

    在自动驾驶技术日益发展的背景下,选择合适的智驾仿真工具进行场景生成和测试显得尤为重要。该工具不仅需要支持高精度的场景重建,还需满足多种环境条件和传感器模型的兼容性。本文将深入探讨如何评估不同智驾仿真
    的头像 发表于 11-25 10:32 541次阅读
    如何选择适合的智驾仿真<b class='flag-5'>工具</b>进行场景<b class='flag-5'>生成</b>和测试?

    openDACS 2025 开源EDA与芯片赛项 赛题七:基于大模型的生成式原理图设计

    (Large Language Models, LLMs)正逐步成为EDA工具变革的核心驱动力之一。近年来,以GPT、DeepSeek、通义千问等为代表的通用大模型在文本生成、语义理解、代码生成
    发表于 11-13 11:49

    真正免费的AI生成PPT工具盘点:告别收费陷阱

    的战斗机",其他9款工具也各有绝活,保证让你告别收费陷阱,轻松做出专业级PPT! 一、AiPPT:一句话生成PPT的"时间管理大师" 一句话生成,一分钟出片 作为北京饼干科技旗下的"AI+PPT"先锋,AiPPT堪称打工人救星。
    的头像 发表于 10-30 15:43 7092次阅读
    真正免费的AI<b class='flag-5'>生成</b>PPT<b class='flag-5'>工具</b>盘点:告别收费陷阱

    STM32cubeMX生成配置rt-thread引用问题求解

    如题,本人小白,刚接触rt-thread,STM32F1/4简便配置起见利用cubeMX自动生成,测试几次后直接蒙了,不知道哪些文件是rt-thread项目必须的,网上说法也五花八门,说代码屏蔽某些
    发表于 09-12 07:21

    如何利用 DDR 参数文件生成 Linux 映像?

    如何利用 DDR 参数文件生成 Linux 映像
    发表于 09-02 06:39

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    1. 项目概述 本项目旨在开发并部署一个高精度的深度学习模型,用于自动鉴别一张图片是由AI生成Stable Diffusion, DALL-E, Midjourney等工具生成)还
    发表于 08-21 13:59

    stm32f407ZGT6生成的bootloader打印的app分区偏移地址正常吗?

    stm32f407ZGT6生成的bootloader打印的app分区偏移地址正常吗?bootloader使用iot平台配置自动生成的,日志信息如下图
    发表于 08-15 08:24

    HarmonyOS AI辅助编程工具(CodeGenie)页面生成

    添加。 针对已有UI布局文件(XML)的应用,当前提供UI Generator能力,可以快速生成对应的HarmonyOS UI代码。 以上材料主要参考引用HarmonyOS官方文档。
    发表于 08-13 10:38

    HarmonyOS AI辅助编程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平台,用于快速生成可编译、可运行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成对
    发表于 07-10 11:51

    利用NVIDIA 3D引导生成式AI Blueprint控制图像生成

    AI 赋能的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在能创造出令人惊叹的逼真视觉效果。即使取得了如此飞跃,仍然存在一个挑战:实现创意掌控。
    的头像 发表于 06-05 09:24 1078次阅读