0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成对抗网络 vs 图像水印,去除效果理想

WpOh_rgznai100 来源:YXQ 2019-06-26 14:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前互联网飞速发展,越来越多的公司、组织和个人都选择在网上展示和分享图像。为了保护图像版权,大家都会选择在图像上打上透明或者半透明的水印。随着水印被广泛地使用,针对水印的各种处理技术也在不断发展,如何有效去除图像上的水印引发了越来越多人的研究兴趣。

今天的文章中,我们会介绍一种更为强大的水印去除器。这次我们借助生成对抗网络来实现,进一步提升水印去除器的性能,从而达到更为理想的去除效果。

生成对抗网络的前世今生

生成对抗网络(Generative Adversarial Networks,GAN),是由Ian Goodfellow等人在2014年首次提出。一般来说,生成对抗网络由两部分组成:生成器(Generator)和判别器(Discriminator)。生成器通过接收输入数据,学习训练数据的分布来生成目标数据。判别器通常是一个二分类模型,用来判别生成器生成数据的真假性。

我们可以将生成器和判别器看作互相对抗的双方,生成器的目的是令生成的数据尽可能的真实,让判别器无法区分真假;而判别器的目的是尽可能地识别出生成器生成的数据。在生成对抗网络的训练过程中,上面的对抗场景会持续进行,生成器和判别器的能力都得到了不断提升。训练的过程可以用如下公式表示:

其中G和D分别表示生成器和判别器,x为真实数据,z是生成器的输入数据。最后训练结束我们就可以使用生成器来生成以假乱真的数据。一个直观的生成对抗网络结构如下图所示。

生成对抗网络近些年被大量应用于计算机视觉领域,根据具体应用不同可以分为图像生成和图像转换两种类型的任务。图像生成可以看成是一种学后联想任务,其中的代表是图像自动生成模型(DCGAN),网络结构如下图所示。这类任务只给出我们希望生成的目标图像,此时生成器的输入是服从某一分布的噪声,通过和判别器的对抗训练,将其转换成目标图像的数据分布。

图像转换可以看成是一种目标引导任务,其中的代表是图像超分辨率模型(SRGAN),SRGAN的网络结构如下图所示。这类任务除了给出我们希望生成的目标图像外,还会给出转换前的原始图像,此时生成器的输入变为原始图像,生成器在和判别器的对抗训练过程中还要同时保证生成的图像和目标图像尽可能的相近。

生成对抗网络的发展非常迅速,近些年出现了各式各样GAN的变种,例如在训练上优化的WGAN和LSGAN,通过对输入添加条件限制来引导学习过程的Conditional GAN,图像生成任务中的BigGAN和StyleGAN,图像转换任务中的Pixel2Pixel和CycleGAN等等。期待未来生成对抗网络在计算机视觉领域给我们带来更多的惊喜。

生成对抗网络vs图像水印

上一节中我们介绍了生成对抗网络的核心思想和一些应用,现在我们尝试将生成对抗网络用于图像的水印去除。去水印的目的是将带水印的图像转变为无水印的图像,这本质上也是一种图像转换任务。

因此生成器的输入为带水印的图像,输出为无水印的图像;而判别器用于识别结果到底是原始真实的无水印图像,还是经过生成器生成的无水印图像。通过两者之间不断的对抗训练,生成器生成的无水印图像变得足够“以假乱真”,从而达到理想的去水印效果。

在实际的实践过程中,我们还做了一系列优化改进。下面我们分别介绍生成器和判别器的具体结构以及训练细节。在生成器的选择上,我们继续使用U-net网络结构,U-net通过在输入和输出之间添加跳跃连接,融合了低层级特征和高层级特征。与直接的编解码器结构相比,能够保留更多的图像背景信息,保证去除水印后的图像的真实性。

在判别器方面,我们使用了基于区域判别的全卷积网络。与传统的判别器直接输出整张图像的真假结果不同,我们通过对图像区域级别的判别,可以更好地对图像上的无水印和有水印部分进行区分。

此外,我们采用了Conditional GAN的思想,判别器在对原始真实的无水印图像和生成器生成的无水印图像进行区分的时候会加入带水印图像的条件信息,从而进一步提升生成器和判别器的学习性能。生成器和判别器的具体结构和细节如下图所示。

生成器生成的无水印图像除了要令判别器分辨不了真假之外,还需要保证和真实的无水印图像尽可能接近。为此我们组合一范数损失(L1 Loss)和感知损失(Perceptual Loss)作为内容损失,在生成器和判别器对抗的过程中加入训练。最终的损失函数为

其中的条件对抗损失为

最终我们使用生成器作为水印去除器实现图像上的水印去除。为了对比和单一全卷积网络实现的水印去除器的效果,我们可视化了一些去水印结果,左列是输入的水印区域,中间列是单一全卷积网络得到的无水印区域,右列是生成对抗网络得到的无水印区域。从可视化的结果可以看出,经过对抗训练后的生成器对水印的去除效果更优。

写在最后

图像水印去除问题吸引了越来越多人的研究兴趣,本篇文章介绍了如何利用生成对抗网络来实现水印自动去除。去水印研究的目的是为了验证水印的鲁棒性,更好地提升水印的反去除能力。如何设计一种AI去不掉的水印是一个极具挑战的问题,接下来我们会在这方面做一些尝试,希望能够为版权保护尽一份力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 水印
    +关注

    关注

    0

    文章

    26

    浏览量

    11829
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2327

    浏览量

    79235

原文标题:基于GAN的图像水印去除器,效果堪比PS高手

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用Firebase AI Logic生成图像模型的两种新功能

    为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文将探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑功能预览版;其二
    的头像 发表于 11-30 09:28 208次阅读

    理想汽车荣获汽车大模型安全证书

    2025中国汽车论坛举行“智舱安言计划——汽车生成式人工智能安全测评”颁证仪式。理想汽车车载大模型荣获由CCIA汽车网络安全工作委员会颁发的《生成内容安全测评证书》,及人工智能
    的头像 发表于 07-18 16:10 795次阅读

    硅无光束肖特基二极管 - 成对和四成对 skyworksinc

    电子发烧友网为你提供()硅无光束肖特基二极管 - 成对和四成对相关产品参数、数据手册,更有硅无光束肖特基二极管 - 成对和四成对的引脚图、接线图、封装手册、中文资料、英文资料,硅无光束
    发表于 07-14 18:33
    硅无光束肖特基二极管 - <b class='flag-5'>成对</b>和四<b class='flag-5'>成对</b> skyworksinc

    超声波清洗机对于微小毛刺的去除效果如何?

    介绍超声波清洗机对于微小毛刺的去除效果以及如何正确使用超声波清洗机。1、什么是超声波清洗机?超声波清洗机是利用超声波震动原理完成清洗的一种设备。它通过向水中输入超
    的头像 发表于 07-02 16:22 430次阅读
    超声波清洗机对于微小毛刺的<b class='flag-5'>去除</b><b class='flag-5'>效果</b>如何?

    利用NVIDIA 3D引导生成式AI Blueprint控制图像生成

    AI 赋能的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在能创造出令人惊叹的逼真视觉效果。即使取得了如此飞跃,仍然存在一个
    的头像 发表于 06-05 09:24 737次阅读

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。
    的头像 发表于 05-14 16:53 942次阅读

    基于RV1126开发板网络配置方法

    描述网卡的工作方式,然后Netplan工具就会根据yaml文件中的描述去自动生成对应的网络配置。        网络管理工具[NetworkManager]或者[Systemd-network]就会根据
    的头像 发表于 04-15 14:57 705次阅读
    基于RV1126开发板<b class='flag-5'>网络</b>配置方法

    如何使用离线工具od SPSDK生成完整图像

    SDSDK)会生成一个缺少前 4KB 的文件。 这些将由 flashloader 直接在目标上填充,使用将要传达给它的参数,对吧? 我需要离线工作。我需要生成一个 “完整图像”,但无法访问目标。 我该怎么做?
    发表于 03-28 06:51

    使用OpenVINO GenAI和LoRA适配器进行图像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用户可以将平平无奇的文本提示词转换为令人惊艳的视觉效果
    的头像 发表于 03-12 13:49 1524次阅读
    使用OpenVINO GenAI和LoRA适配器进行<b class='flag-5'>图像</b><b class='flag-5'>生成</b>

    ADS830/831采样效果理想是什么原因导致的?

    在使用贵公司的ADS830/831芯片时,采样效果理想。 在此提出问题: 1 FPGA给AD提供的CLK在80M时是否需要通过5V上拉把CLK信号增强。 2AD输出数据是否要加上电阻,实现
    发表于 02-17 07:58

    #新年新气象,大家新年快乐!#AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、
    发表于 01-13 10:46

    AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、
    发表于 01-13 10:32

    使用dac7731做数据输出不能得到理想效果是哪里出了问题?

    使用dac7731,做数据输出,不能得到理想效果 程序应该是没问题的,因为以前用过,后来不知道怎么回事就不行了,输出完全不对跳变。 配置为内部电压参考,采用+-10V的输出。 测5管脚输出,上
    发表于 01-06 07:11

    借助谷歌Gemini和Imagen模型生成高质量图像

    以获得卓越的视觉效果。这个过程并不止于此;一旦图像生成,Imagen 2 可以进一步优化以满足特定需求,从而创建一个强大的工作流程,用于制作顶级视觉内容。
    的头像 发表于 01-03 10:38 1335次阅读
    借助谷歌Gemini和Imagen模型<b class='flag-5'>生成</b>高质量<b class='flag-5'>图像</b>

    用TMS2812控制ADS1298进行肌电采集,将相同的程序烧写到flash中后再进行采集时效果理想,为什么?

    我用TMS2812控制ADS1298进行肌电采集,连接仿真器下采集的肌电信号较好,但如果将相同的程序烧写到flash中后再进行采集时,效果就不怎么理想,想知道是为什么会,仿真器和烧写下的采集图像见附件,请大神帮忙解答,万分感谢
    发表于 01-03 07:34