当前位置：首页 > 编程日记 > 正文

基于GAN的图像水印去除器，效果堪比PS高手

编程日记 2024-12-31 20:40:00

640?wx_fmt=jpeg

作者 | 李翔

转载自视说AI（ID:techtalkai）

简介：李翔，国内某互联网大厂AI民工，前携程酒店图像技术负责人，计算机视觉和深度学习重度爱好者，在ICCV和CVPR等会议上发表论文十余篇。

写在前面

当前互联网飞速发展，越来越多的公司、组织和个人都选择在网上展示和分享图像。为了保护图像版权，大家都会选择在图像上打上透明或者半透明的水印。随着水印被广泛地使用，针对水印的各种处理技术也在不断发展，如何有效去除图像上的水印引发了越来越多人的研究兴趣。

今天的文章中，我们会介绍一种更为强大的水印去除器。这次我们借助生成对抗网络来实现，进一步提升水印去除器的性能，从而达到更为理想的去除效果。

生成对抗网络的前世今生

生成对抗网络（Generative Adversarial Networks，GAN），是由Ian Goodfellow等人在2014年首次提出。一般来说，生成对抗网络由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器通过接收输入数据，学习训练数据的分布来生成目标数据。判别器通常是一个二分类模型，用来判别生成器生成数据的真假性。

我们可以将生成器和判别器看作互相对抗的双方，生成器的目的是令生成的数据尽可能的真实，让判别器无法区分真假；而判别器的目的是尽可能地识别出生成器生成的数据。在生成对抗网络的训练过程中，上面的对抗场景会持续进行，生成器和判别器的能力都得到了不断提升。训练的过程可以用如下公式表示：

640?wx_fmt=png

其中G和D分别表示生成器和判别器，x为真实数据，z是生成器的输入数据。最后训练结束我们就可以使用生成器来生成以假乱真的数据。一个直观的生成对抗网络结构如下图所示。

640?wx_fmt=png

生成对抗网络近些年被大量应用于计算机视觉领域，根据具体应用不同可以分为图像生成和图像转换两种类型的任务。图像生成可以看成是一种学后联想任务，其中的代表是图像自动生成模型（DCGAN），网络结构如下图所示。这类任务只给出我们希望生成的目标图像，此时生成器的输入是服从某一分布的噪声，通过和判别器的对抗训练，将其转换成目标图像的数据分布。

640?wx_fmt=png

图像转换可以看成是一种目标引导任务，其中的代表是图像超分辨率模型（SRGAN），SRGAN的网络结构如下图所示。这类任务除了给出我们希望生成的目标图像外，还会给出转换前的原始图像，此时生成器的输入变为原始图像，生成器在和判别器的对抗训练过程中还要同时保证生成的图像和目标图像尽可能的相近。

640?wx_fmt=png

生成对抗网络的发展非常迅速，近些年出现了各式各样GAN的变种，例如在训练上优化的WGAN和LSGAN，通过对输入添加条件限制来引导学习过程的Conditional GAN，图像生成任务中的BigGAN和StyleGAN，图像转换任务中的Pixel2Pixel和CycleGAN等等。期待未来生成对抗网络在计算机视觉领域给我们带来更多的惊喜。

生成对抗网络 vs 图像水印

上一节中我们介绍了生成对抗网络的核心思想和一些应用，现在我们尝试将生成对抗网络用于图像的水印去除。去水印的目的是将带水印的图像转变为无水印的图像，这本质上也是一种图像转换任务。

因此生成器的输入为带水印的图像，输出为无水印的图像；而判别器用于识别结果到底是原始真实的无水印图像，还是经过生成器生成的无水印图像。通过两者之间不断的对抗训练，生成器生成的无水印图像变得足够“以假乱真”，从而达到理想的去水印效果。

在实际的实践过程中，我们还做了一系列优化改进。下面我们分别介绍生成器和判别器的具体结构以及训练细节。在生成器的选择上，我们继续使用U-net网络结构，U-net通过在输入和输出之间添加跳跃连接，融合了低层级特征和高层级特征。与直接的编解码器结构相比，能够保留更多的图像背景信息，保证去除水印后的图像的真实性。

在判别器方面，我们使用了基于区域判别的全卷积网络。与传统的判别器直接输出整张图像的真假结果不同，我们通过对图像区域级别的判别，可以更好地对图像上的无水印和有水印部分进行区分。

此外，我们采用了Conditional GAN的思想，判别器在对原始真实的无水印图像和生成器生成的无水印图像进行区分的时候会加入带水印图像的条件信息，从而进一步提升生成器和判别器的学习性能。生成器和判别器的具体结构和细节如下图所示。

640?wx_fmt=png

生成器生成的无水印图像除了要令判别器分辨不了真假之外，还需要保证和真实的无水印图像尽可能接近。为此我们组合一范数损失（L1 Loss）和感知损失（Perceptual Loss）作为内容损失，在生成器和判别器对抗的过程中加入训练。最终的损失函数为

640?wx_fmt=png

其中的条件对抗损失为

640?wx_fmt=png

最终我们使用生成器作为水印去除器实现图像上的水印去除。为了对比和单一全卷积网络实现的水印去除器的效果，我们可视化了一些去水印结果，左列是输入的水印区域，中间列是单一全卷积网络得到的无水印区域，右列是生成对抗网络得到的无水印区域。从可视化的结果可以看出，经过对抗训练后的生成器对水印的去除效果更优。

640?wx_fmt=png

写在最后

图像水印去除问题吸引了越来越多人的研究兴趣，本篇文章介绍了如何利用生成对抗网络来实现水印自动去除。去水印研究的目的是为了验证水印的鲁棒性，更好地提升水印的反去除能力。如何设计一种AI去不掉的水印是一个极具挑战的问题，接下来我们会在这方面做一些尝试，希望能够为版权保护尽一份力。

参考资料：

[1] Towards photo-realistic visible watermark removal with conditional generative adversarial networks

[2] Image-to-image translation with conditional adversarial networks

[3] Photo-realistic single image super-resolution using a generative adversarial networ

（*本文为 AI科技大本营转载文章，转载请联系作者）

◆

精彩推荐

◆

参与投稿加入作者群，成为全宇宙最优秀的技术人~

640?wx_fmt=png

大会开幕倒计时5天！

2019以太坊技术及应用大会特邀以太坊创始人V神与众多海内外知名技术专家齐聚北京，聚焦区块链技术，把握时代机遇，深耕行业应用，共话以太坊2.0新生态。即刻扫码，享优惠票价。

640?wx_fmt=png

推荐阅读

6月技术福利限时免费领
2019年技术盘点容器篇（一）：听UCloud谈风生水起的K8S | 程序员硬核评测
异类框架BigDL，TensorFlow的潜在杀器！
吐血总结！100个Python面试问题集锦（上）
5G 时代，微软又走对了一步棋！
LinkedIn最新报告: 区块链成职位需求增长最快领域, 这些地区对区块链人才渴求度最高……
写代码不严谨，我就不配当程序员？
碾压Bert？“屠榜”的XLnet对NLP任务意味着什么
如何向妹子解释：为啥 5G 来了需要换 SIM卡！

你点的每个“在看”，我都认真当成了喜欢

https://www.dkcj.cn/info/34284.html

基于GAN的图像水印去除器，效果堪比PS高手

作者 | 李翔

相关文章：

Flink最锋利的武器：Flink SQL入门和实战 | 附完整实现代码

SQL SERVER中ROLLUP的用法

Mybait缓存机制

vs2008常用操作汇总

深度学习已至“瓶颈”？英特尔：数据处理是一剂良药

WIN32 C++ 遍历文件夹

UIView淡入淡出动画

sass的继承，混合宏，占位符的用法总结

js中cookie的使用详细分析

从事JAVA 20年最终却败给了Python，哭了！

c++删除文件夹

解决bootstrap下的图片自适应问题

边缘检测、Hough变换、轮廓提取、种子填充、轮廓跟踪

JS Array 中 shift 和 pop 的妙用

当今主流分割网络有哪些？12篇文章一次带你看完

正确生成浮点型的方法，解决sqlachemy Float浮点型的坑，生成float类型时，长度和精度均为0，导致查询不到结果！...

图像轮廓的提取和绘制

上海交大张拳石：神经网络的可解释性，从经验主义到数学建模

计算机网络模型到底是七层？五层？四层？

【推荐】使用Ultrapico Expresso学习正则表达式

OpenCV中常用到的轮廓处理函数汇总

《Linux内核原理与分析》第二周作业

首次！腾讯全面公开整体开源路线图

201771010111李瑞红《面向对象的程序设计》第八周实验总结

崛起的Python，真的影响了76万人？

OpenCV查找轮廓

非阻塞socket的连接

OpenCV下车牌定位算法实现代码

2018-2019-1 20165310 20165315 20165226 实验一开发环境的熟悉

上海居民被垃圾分类逼疯！这款垃圾自动分类器也许能帮上忙