0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达的StyleGAN仅需小样本就可以做到图像到图像的转换!

DPVg_AI_era 来源:lq 2019-05-11 09:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前一阵子英伟达的StyleGAN可谓是火了一把,近日又出大招了!以往图像到图像转换需要大量的图像做训练样本,但是在英伟达的这项工作中,仅需小样本就可以做到图像到图像的转换(代码已开源)!

小样本,大成就!

当我们看到一只站着的老虎时,我们很容易想象出来它躺着的样子。

这是因为我们根据其它动物平躺的姿势就是可以做联想。

然而,对于机器来说就没有这么简单了。在现存的非监督图像到图像转换模型需要大量的训练图像。

不仅如此,一个模型能够转换图像的另一个前提是图像中的对象必须在训练集中存在。

近期,英伟达、康纳尔大学和阿尔托大学联合发表了一篇文章——小样本(few-shot)非监督图像到图像转换。

论文地址:

https://arxiv.org/pdf/1905.01723.pdf

简单来说,就是输入一只金毛,在训练过程当中,即便第一次看到一种新动物,也能让它像金毛那样吐舌头、闭嘴巴、歪头。

若是输入一张炒面的图,该模型也可以让其它食物变成炒面。

这项工作还提供了在线测试,新智元小编们便拿自家的猫主子“西瓜”和“多比”做了一下测试:

输入“西瓜”得到的结果

输入“多比”得到的结果

在线测试连接如下,读者们快快玩起来吧:

https://nvlabs.github.io/FUNIT/petswap.html

该项目的代码也已开源,地址如下:

https://github.com/NVlabs/FUNIT

FUNIT:2阶段图像转换,非常有趣!

我们提出的FUNIT框架旨在通过利用在测试时可用的几个目标类图像,将源类的图像映射到目标类的类似图像。

为了训练FUNIT,我们使用来自一组对象类(例如各种动物物种的图像)中的图像,称为源类(source classes)。我们不假设任何两个类之间存在配对的图像(即,不同物种的任何两个动物都不会是完全相同的姿势)。

我们使用源类里的图像来训练一个multi-class无监督图像到图像转换模型。

在测试过程中,我们从一个称为目标类(target class)的新对象类中提供少量几张图像。模型必须利用少量的目标图像来将源类里的任何图像转换为目标类里的类似图像。

图1

训练。训练集由各种对象类(源类)的图像组成。我们训练了一个模型在这些源对象类之间转换图像。

部署。我们向训练模型显示极少量目标类里的图像,这就足以将源类的图像转换为目标类的类似图像了,即使模型在训练期间从未见过目标类的任何图像。

需要注意的是,FUNIT生成器有两个输入:1)一个内容图像;2)一组目标类图像。它的目的是生成与目标类图像相似的输入图像的转换。

我们的框架由一个有条件的图像发生器G和一个多任务对抗性鉴别器D组成。

与现有无监督image-to-image translation框架中有条件的图像生成器不同,它们是将一张图像作为输入,而我们的生成器G需要同时将一张内容图像x和一组K类图像{y1, ..., yK}作为输入,生成输出图像x¯,公式如下:

实验结果:姿态和种类一起转换,超越基准模型

主要结果

如表1所示,FUNIT框架在Animal Faces和North American Birds两个数据集的所有性能指标都优于用于小样本无监督图像到图像转换任务的基线模型。

FUNIT在Animal Faces数据集的1-shot和5-shot设置上分别达到82.36和96.05 的Top-5 测试精度,以及在North American Birds数据集上分别达到60.19和75.75的Top-5 测试精度。

这些指标都明显优于相应的基准模型。

表1:FUNIT与基线模型的性能比较。↑表示数值越大越好,↓表示越小越好。

在图2中,我们对FUNIT-5计算的few-shot translation的结果进行了可视化。

图2:无监督图像-图像转换结果的可视化。计算结果采用FUNIT-5模型。

从上到下分别是来自动物面孔、鸟、花和食物数据集的结果。每个示例随机展示了2张目标类中的图像,输入内容图像x,以及转换后的输出图像x¯。

结果表明,模型能够成功地将源类的图像转换为新的类中的相似图像。对象在输入内容图像x和相应输出图像x¯中的姿态基本保持不变。输出图像也非常逼真,类似于目标类中的图像。

图3提供FUNIT与基线模型的结果比较。可以看到,FUNIT生成了高质量的图像转换输出。

图3:小样本图像到图像转换效果的比较。

从左到右的列分别是输入内容图像x,两个输入目标类图像y1,y2,来自不公平的StarGAN基线的转换结果,来自公平的StarGAN基线的转换结果,以及来自FUNIT框架的结果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1096

    浏览量

    42163
  • 代码
    +关注

    关注

    30

    文章

    4941

    浏览量

    73158
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97692

原文标题:一图生万物!英伟达推超强图像转换神器,小样本一秒猫变狗

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    图像采集卡:机器视觉时代的图像数据核心枢纽

    一、图像采集卡的技术本质:从信号数据的“转换器”与“传输通道”图像采集卡(ImageCaptureCard)是机器视觉系统的核心硬件组件,本质是通过专用芯片(如FPGA、ASIC)实
    的头像 发表于 11-12 15:15 302次阅读
    <b class='flag-5'>图像</b>采集卡:机器视觉时代的<b class='flag-5'>图像</b>数据核心枢纽

    模板驱动 无需训练数据 SmartDP解决小样本AI算法模型开发难题

    。但是这个平台不适用于小样本AI模型开发,特别是一些特殊行业,数据本来就不多,但又有着需求,因此陷于两难。面临这种市场困境,慧视光电推出了一个全新的AI平台Sma
    的头像 发表于 09-09 17:57 1169次阅读
    模板驱动  无需训练数据  SmartDP解决<b class='flag-5'>小样本</b>AI算法模型开发难题

    英伟:CUDA 已经开始移植 RISC-V 架构上

    ,着重介绍了将 CUDA 移植 RISC-V 架构的相关工作和计划,展现了对 RISC-V 架构的高度重视与积极布局。   Frans Sijstermanns 首先回顾了英伟与 RISC-V 之间
    发表于 07-17 16:30 3847次阅读

    HarmonyOS应用图像stride处理方案

    图像存储在内存中时,内存缓冲区可能在每行像素之后包含额外的填充字节。填充字节会影响图像在内存中的存储方式,但不会影响图像的显示方式。stride是内存中一行像素内存中下一行像素的字
    的头像 发表于 06-10 14:17 799次阅读
    HarmonyOS应用<b class='flag-5'>图像</b>stride处理方案

    工业相机图像采集卡:机器视觉的核心枢纽

    应用广泛。工业相机图像采集卡的主要功能在机器视觉系统中,工业相机负责捕获目标对象的图像,而图像采集卡则负责将这些图像信息转换为计算机
    的头像 发表于 05-21 12:13 542次阅读
    工业相机<b class='flag-5'>图像</b>采集卡:机器视觉的核心枢纽

    从游戏智能驾驶,英伟有哪些技术升级?

    兼首席执行官黄仁勋在发布会上表示,未来自动驾驶汽车市场的潜力巨大,整体规模有望达到数万亿美元。他预测,2026财年,英伟的汽车业务收入将有望达到50亿美元(约合人民币365亿元),显示出该业务板块日益增长的重要战略地位。 作
    的头像 发表于 05-16 09:02 756次阅读
    从游戏<b class='flag-5'>到</b>智能驾驶,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>有哪些技术升级?

    基于LockAI视觉识别模块:C++使用图像的统计信息

    图像处理中,统计信息可以帮助我们了解图像的特性,例如区域内的像素分布、颜色转换以及特定区域的分析。本文将介绍基于LockAI视觉识别模块如何提取兴趣区域(ROI)、
    发表于 05-08 10:31

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    在美东时间周一,美股三大指数集体收跌,截至收盘,英伟股价下跌超8%,英伟市值一夜蒸发2650亿美元(换算下来约合人民币19345亿元);目前英伟
    的头像 发表于 03-04 10:19 994次阅读

    图像采集卡:现代图像处理技术的关键组件

    在现代科技快速发展的背景下,图像处理技术已成为信息技术领域不可或缺的一部分。图像采集卡,作为连接计算机与各种图像采集设备的重要硬件组件,扮演着至关重要的角色。它不仅涉及图像信号的
    的头像 发表于 02-20 10:42 936次阅读
    <b class='flag-5'>图像</b>采集卡:现代<b class='flag-5'>图像</b>处理技术的关键组件

    图像采集卡的核心组成与功能

    、GigEVision等),根据应用场景选择。例如,CameraLink适合工业高速传输,而GigEVision适用于远距离需求。模数转换(ADC):模拟采集
    的头像 发表于 02-19 11:27 761次阅读
    <b class='flag-5'>图像</b>采集卡的核心组成与功能

    CMOS传感器的图像处理能力

    随着科技的飞速发展,图像处理技术已经成为我们日常生活中不可或缺的一部分。CMOS传感器作为图像捕捉的核心,其图像处理能力直接影响成像质量。 CMOS传感器的基本原理 CMOS传感器由
    的头像 发表于 01-20 15:19 1283次阅读

    AN-1249:使用ADV8003评估板将3D图像转换成2D图像

    电子发烧友网站提供《AN-1249:使用ADV8003评估板将3D图像转换成2D图像.pdf》资料免费下载
    发表于 01-08 14:28 0次下载
    AN-1249:使用ADV8003评估板将3D<b class='flag-5'>图像</b><b class='flag-5'>转换</b>成2D<b class='flag-5'>图像</b>

    如何使用图像采集卡

    在现代数字技术的不断发展中,图像采集卡作为一种重要的硬件设备,越来越普遍地应用于各类领域,包括视频监控、医疗影像、影视制作及游戏直播等。图像采集卡通过将模拟信号转换为数字信号,使得计算机能够对视
    的头像 发表于 12-13 15:03 1745次阅读
    如何使用<b class='flag-5'>图像</b>采集卡

    刚刚!英伟最新回应!

    12月10日消息,据报道,英伟市值一夜蒸发掉了889亿美元(约合人民币6460亿元)。 据此前媒体报道,近日英伟公司因涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制
    的头像 发表于 12-10 18:13 1187次阅读

    英伟被立案调查 英伟回应反垄断调查

    英伟被立案调查! 国家市场监督管理总局在12 月 9 日晚宣布,英伟公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准
    的头像 发表于 12-10 15:03 816次阅读