0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

EditGAN图像编辑框架将影响未来几代GAN的发展

星星科技指导员 来源:NVIDIA 作者:Nathan Horrocks 2022-04-06 16:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

编辑猫、汽车甚至古董画照片的愿望,由于一种称为EditGAN的生成性对抗网络(GAN)模型,从未像现在这样容易实现。来自 NVIDIA,多伦多大学和 MIT 研究人员的工作建立了 DatasetGAN ,这是一种人工智能视觉模型,可以用最少16个人类注释的图像来训练,并像其他需要100X更多图像的方法一样有效地执行。EditGAN 利用了前一个模型的功能,允许用户使用简单的命令(如绘图)编辑或操作所需的图像,而不会影响原始图像质量。

什么是 EditGAN ?

根据 paper :“ EditGAN 是第一个 GAN 驱动的图像编辑框架,它同时提供非常高精度的编辑,只需要很少的带注释的训练数据(并且不依赖外部分类器),可以实时交互运行,允许对多个编辑进行简单的合成,并可处理真正的嵌入式、生成的图像,甚至是域外图像。”

该模型学习特定数量的编辑向量,这些编辑向量可以交互地应用于图像。本质上,它形成了对图像及其内容的直观理解,用户可以利用这些信息进行特定的修改和编辑。该模型从相似的图像中学习,并识别图像中对象的不同组件和特定部分。用户可以利用它对不同子部分进行有针对性的修改,或在特定区域内进行编辑。由于模型的精确性,图像在用户设置的参数之外不会失真。

“该框架允许我们学习任意数量的编辑向量,然后可以以交互速率直接应用于其他图像。”研究人员在他们的研究中解释道。“我们的实验表明, EditGAN 可以以前所未有的细节和自由度处理图像,同时保持完整的图像质量。我们还可以轻松地组合多种编辑,并在 EditGAN 的训练数据之外执行合理的编辑。我们在各种图像类型上演示了 EditGAN ,并在数量上优于几种预处理的图像标准编辑基准任务的编辑方法。”

从增加微笑、改变别人看的方向、创造新的发型,或者给汽车一套更好的轮子,研究人员展示了模型的内在性,只需要很少的数据注释。用户可以根据所需的编辑绘制简单的草图或遮罩,并引导 AI 模型实现修改,例如更大的猫耳或更酷的汽车前灯。人工智能然后渲染图像,同时保持非常高的精度和原始图像的质量。之后,同样的编辑可以实时应用于其他图像。

poYBAGJNT3iAFP43AAFEfxepoiI936.png

poYBAGJNT3iAFP43AAFEfxepoiI936.png

图 2 分配给图像不同部分的像素示例。人工智能可以识别不同的区域,并可以根据人工输入进行编辑。

这是怎么工作的?

Edigan 将图像的每个像素指定给一个类别,例如轮胎、挡风玻璃或车架。这些像素在人工智能潜在空间内控制,并基于用户的输入,用户可以轻松灵活地编辑这些类别。 Edigan 操纵 only 与所需更改相关的像素。人工智能根据训练模型时使用的其他图像知道每个像素代表什么,因此你无法尝试将猫耳朵添加到汽车中以获得准确的结果。但是,当在正确的模型中使用时, EditGAN 是一个非凡的工具,可以提供出色的图像编辑效果。

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

图 3 Edigan 可以训练各种各样的图像,从动物到环境,形成对其内容的详细理解。

EditGAN 的潜能

人工智能驱动的照片和图像编辑有可能简化摄影师和内容创作者的工作流程,并实现创新和数字艺术的新水平。 EditGAN 还使新手摄影师和编辑能够制作高质量的内容,以及偶尔的病毒性模因。

“这个人工智能可能会改变我们编辑照片的方式,也许最终会改变视频。它允许人们通过简单的文本命令拍摄图像并对其进行修改。如果你有一张汽车照片,你想让车轮更大,只需键入“ make wheels bigger ”,然后噗 – 这是一张完全真实的照片,上面是同一辆车轮更大的汽车。”—— Fortune magazine

EditGAN 将来也可能用于其他重要应用。例如, EditGAN 的编辑功能可用于创建具有特定特征的大型图像数据集。当针对不同的计算机视觉任务训练下游机器学习模型时,这种特定的数据集可能很有用。

此外, EditGAN 框架可能会影响未来几代 GAN 的发展。虽然当前版本的 EditGAN 侧重于图像编辑,但类似的方法也可能用于编辑 3D 形状和对象,这在为游戏、电影或 metaverse 创建虚拟 3D 内容时非常有用。

关于作者

Nathan Horrocks 是 NVIDIA Research 的内容营销经理。他重点强调了 NVIDIA 实验室在世界各地进行的惊人研究。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • 人工智能
    +关注

    关注

    1819

    文章

    50290

    浏览量

    266826
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2382

    浏览量

    84330
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2026年GaN行业八大预测:市场规模暴增50%;衬底和封装是投资热点

    转型,推动AI数据中心、人形机器人、电动汽车及可再生能源等领域的高效可持续发展。   当前,GaN市场正迎来爆发式增长:根据Yole Group和TrendForce最新数据,2026年全球GaN功率器件市场规模预计达9.2亿美
    的头像 发表于 03-01 06:48 8477次阅读

    LuatOS框架的使用(上)

    在资源受限的物联网终端设备中,如何实现快速开发与稳定运行是关键挑战。LuatOS框架通过Lua语言与底层硬件抽象层深度融合,提供了一套简洁高效的开发范式。本文围绕LuatOS框架
    的头像 发表于 01-27 19:38 323次阅读
    LuatOS<b class='flag-5'>框架</b>的使用(上)

    【「芯片设计基石——EDA产业全景与未来展望」阅读体验】跟着本书来看EDA的奥秘和EDA发展

    本书是一本介绍EDA产业全景与未来展望的书籍,主要内容分为两部分,一部分是介绍EDA相关基础知识和全球EDA发展概况以及发展趋势 另一部分则是介绍中国EDA事业萌芽,沉寂,转机,加速,以及未来
    发表于 01-21 22:26

    钉钉正式开源HarmonyOS图片编辑组件

    近日,由钉钉团队自主研发的“HarmonyOS图片编辑组件”正式上线OpenHarmony三方库中心仓并开源。作为一款填补鸿蒙社区图像处理领域空白的重量级组件,该方案基于HarmonyOS
    的头像 发表于 01-05 09:58 645次阅读

    Neway第三代GaN系列模块的生产成本

    IGBT良率超95%),低良率导致单片成本上升。Neway通过优化刻蚀、钝化等关键工艺,良率提升至85%以上。测试与筛选:GaN器件需额外测试(如高频特性、可靠性验证),测试成本较硅基器件高30%-50
    发表于 12-25 09:12

    从模拟到AI集成:图像采集卡的技术演进与未来三大趋势

    轨迹不仅折射出工业自动化与智能感知技术的进步,更预示着未来机器“看懂”世界的全新可能。本文梳理图像采集卡从模拟时代到AI集成的技术演进脉络,并深入剖析其未来三大
    的头像 发表于 12-15 16:30 1120次阅读
    从模拟到AI集成:<b class='flag-5'>图像</b>采集卡的技术演进与<b class='flag-5'>未来</b>三大趋势

    安森美垂直GaN技术赋能功率器件应用未来

    在传统横向结构的GaN器件中,电流沿芯片表面流动。而垂直 GaNGaN 层生长在氮化镓衬底上,其独特结构使电流能直接从芯片顶部流到底部,而不是仅在表面流动。这种垂直电流路径让器件能够承受更高的电压和更大的电流,从而实现更高
    的头像 发表于 12-04 09:28 2060次阅读
    安森美垂直<b class='flag-5'>GaN</b>技术赋能功率器件应用<b class='flag-5'>未来</b>

    使用Firebase AI Logic生成图像模型的两种新功能

    为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑
    的头像 发表于 11-30 09:28 532次阅读

    安森美入局垂直GaNGaN进入高压时代

    电子发烧友网综合报道 近日,安森美发布器垂直GaN功率半导体技术,凭借 GaN-on-GaN 专属架构与多项性能突破,为全球高功率应用领域带来革命性解决方案,重新定义了行业在能效、紧凑性与耐用性上
    的头像 发表于 11-10 03:12 7770次阅读

    Leadway GaN系列模块的功率密度

    Leadway GaN系列模块以120W/in³的功率密度为核心,通过材料创新、电路优化与封装设计,实现了体积缩减40%、效率提升92%+的突破。其价值在于为工业自动化、机器人、电动汽车等空间受限
    发表于 10-22 09:09

    创龙 瑞芯微 RK3588 国产2.4GHz八核 工业开发板—视频图像处理框架

    创龙科技研发的 TL3588-EVM 评估板依托 RK3588/RK3588J SoC 强大的视频图像处理能力,可满足多场景图像应用需求。为帮助开发者全面了解其视频图像处理框架,本文系
    的头像 发表于 10-16 11:45 1688次阅读
    创龙 瑞芯微 RK3588 国产2.4GHz八核 工业开发板—视频<b class='flag-5'>图像</b>处理<b class='flag-5'>框架</b>

    物联网未来发展趋势如何?

    ,人们才会更加信任和接受物联网技术。 综上所述,物联网行业的未来发展趋势非常广阔。智能家居、工业互联网、智慧城市、医疗保健以及数据安全和隐私保护都将成为物联网行业的热点领域。我们有理由相信,在不久的将来,物联网进一步改变我们
    发表于 06-09 15:25

    工业相机图像采集卡:技术剖析、应用场景与未来发展

    CameraLink、CoaXPress、GigEVision等,高效、稳定地数据传输到计算机进行后续的图像处理、分析和应用。本文深入剖析工业相机图像采集卡的技术细
    的头像 发表于 05-28 13:49 903次阅读
    工业相机<b class='flag-5'>图像</b>采集卡:技术剖析、应用场景与<b class='flag-5'>未来</b><b class='flag-5'>发展</b>

    从清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!

    从清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!近年来,珠海市镓未来科技有限公司(以下简称“镓未来”)在第三代半导体行业异军突起,凭借领先的氮化镓(GaN)技术储备和不
    发表于 05-19 10:16

    功率GaN的新趋势:GaN BDS

    电子发烧友综合报道 最近多家GaN厂商推出双向GaN功率开关,即GaN BDS(Bidirectional Switch,双向开关)。这是一种较为新型的GaN功率器件产品,顾名思义,双
    发表于 04-20 09:15 1758次阅读