各种去水印的开源工具

现在有很多去除水印的工具,但基本上都需要你花钱。作为资深白嫖党,想让我花钱,那是不可能的。

于是我做了下research(search, search, research…),我发现现在的“去水印”基本上都是一个思路:利用图像修复算法。把有水印的地方看作是图像损坏的地方,用相邻像素替换那些损坏的地方。

现在看看有什么开源工具可以用来去除图片上的水印。

1. openCV 图像修复

openCV中就有图像修复的方法,提供了两种算法分别基于2004 年由 Alexandru Telea 撰写的“基于快速行进方法的图像修复技术”Bertalmio,Marcelo,Andrea L. Bertozzi 和 Guillermo Sapiro 在 2001 年的论文“Navier-Stokes,流体动力学和图像和视频修补” 实现。调用cv.inpaint方法时,前者用cv.INPAINT_TELEA标记后者用cv.INPAINT_NS,openCV修复图像的方法使用起来很简单,只需要几行代码:

import numpy as np
import cv2 as cv

img = cv.imread('messi_2.jpg')
mask = cv.imread('mask2.png',0)
dst = cv.inpaint(img,mask,3,cv.INPAINT_TELEA)
# dst = cv.inpaint(img,mask,3,cv.INPAINT_NS)
cv.imshow('dst',dst)
cv.waitKey(0)
cv.destroyAllWindows()

上面messi_2.jpg是需要修复的图片,而mask2.png是掩模图片,这张图片的作用是指定图片损坏的位置,该图片只有黑白两色,白色就是损坏的地方。掩模图片和原图的大小(即宽高)必须完全一致,否则会报错。

第一张图像是原图。第二个图像是mask(掩模)。第三个图像是第一个算法的结果,最后一个图像是第二个算法的结果。

对于轻微损坏,或者说只有很少一两个水印的图片,这种方法还是可以的。可是,对于满屏水印的图片怎么办呢?

像这样的:

2. mask图像怎么创建

用openCV去除上面这样图片的水印,首先要面临的问题是mask图片怎么办?

new Bing是这样回答的:

创建掩模图像是图像修复过程中的一个重要步骤。掩模图像用于指示原始图像中需要修复的区域。以下是创建掩模图像的基本步骤:

  1. 打开图像编辑软件:你可以使用任何图像编辑软件,如Photoshop、GIMP或者Paint.NET。
  2. 导入原始图像:将需要修复的原始图像导入到图像编辑软件中。
  3. 创建新图层:在原始图像上创建一个新的图层,用于绘制掩模。
  4. 选择画笔工具:使用画笔工具,在新图层上绘制需要修复的区域。通常,我们使用白色来标记这些区域。
  5. 填充损坏区域:确保所有需要修复的区域都被白色完全覆盖。如果区域很小,可以使用放大工具来帮助精确>绘制。
  6. 保存掩模图像:完成绘制后,只保存包含掩模的图层(通常为白色损坏区域和黑色背景)为一个新的图像文>件,格式可以是PNG或BMP,以保留二值信息。 在OpenCV中使用掩模图像时,掩模应该是一个二值图像,其中白色代表需要修复的区域,黑色代表不需要修复的区域。如果你有任何疑问或需要进一步的帮助,请告诉我!

学会了吧?然后,让我展示一下真正的技术:

呐,这就是我根据上面的图片创建的掩模图像。

import cv2
def remove_watermark(image_path, watermark_path, output_path):
    # 读取原始图像和水印图像
    original_image = cv2.imread(image_path)
    watermark = cv2.imread(watermark_path, cv2.IMREAD_GRAYSCALE)
    # 去除水印
    watermark_removed = cv2.inpaint(original_image, watermark, 3, cv2.INPAINT_NS)
    # 保存去除水印后的图像
    cv2.imwrite(output_path, watermark_removed)
# 使用示例
remove_watermark("original_image.jpg", "mask.png", "output_image.jpg")

看一下效果吧:

这效果,真是一言难尽,你说它没去吧,它的确没有水印了;你说它去了吧,这还不如不去…

什么原因呢?难道是因为我涂鸦涂得不好?需要更精确?我想过一个鸡贼的办法:往这网站上传一个纯黑的图片,它加了水印我直接下载下来当mask,但这有点冒险…

于是,让我再展示一下真正的技术:

我把水印提取出来做mask这下够精确了吧。

再看效果:

这玩意,不能说跟原图一模一样,那也的确是没啥差别。我觉得这不是mask文件的问题,mask文件太精确不是好事,应该还是修复算法的问题。

3.机器学习修复算法

既然是算法不行,那,有没有更好的修复算法呢?有,就是使用卷积神经网络(CNN)来提取图像的特征,如边缘、纹理、颜色等信息然后修复。现成的也有:https://github.com/braindotai/Watermark-Removal-Pytorch 这个是使用Pytorch来训练;https://github.com/zuruoke/watermark-removal 这个用的是tensorflow。

遗憾的是:这两个,无论用哪一个,你都逃不掉创建mask。为什么不能通过机器学习自己识别水印创建mask呢?Watermark-Removal-Pytorch项目的README中也给出了解释:

总的来说: 做水印识别代价太大,而且效果不好。

当我想试试这两个项目得时候,又发现了另外一个项目:iopaint!这个有web界面可以直接在本地跑起来,而且可以下载训练好的模型直接用!于是我装起来试了一下:

直接涂在水印上就可以去除水印,可以涂一个去一个,也可以全部涂好一起去,一起去除要花得时间长一些。

去除的结果是这样的:

这个效果在我看来已经是非常不错了。还有一个让人惊喜的地方是,它还可以下载mask文件!

有了mask文件你就可以批量去除水印了,当然了,你所有图片水印的位置要都一样。我试了一下,某房产网站的图片水印的位置也都是一样的。如果它不升级更新,你可以用一个mask文件去除水印

iopaint run --model=lama --device=cpu \
--image=/path/to/image_folder \
--mask=/path/to/mask_folder \
--output=output_dir

这个命令的解释:

–image is the folder containing input images,

–mask is the folder containing corresponding mask images. When –mask is a path to a mask file, all images will be processed using this mask.

iopaint真的是个不错的项目,可是要用起来,你多少要有点编程知识。不过,iopaint有个机智的地方是:它有windows的一键安装包,但是,你得花钱买。哈哈哈。

参考:

https://apachecn.github.io/opencv-doc-zh/#/docs/4.0.0/9.2-tutorial_py_inpainting

https://github.com/zuruoke/watermark-removal

https://github.com/braindotai/Watermark-Removal-Pytorch

https://github.com/Sanster/IOPaint

https://www.iopaint.com/