一种去除图像中水印的方法及装置制造方法及图纸

技术编号:37528272 阅读:15 留言:0更新日期:2023-05-12 15:53
本发明专利技术公开了一种去除图像中水印的方法。步骤S1:采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,继续步骤S2;否则退出整个方法。步骤S2:对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则继续步骤S3。步骤S3:采用第二神经网络去除图像中的水印。本发明专利技术能够较好地去除图像中的水印,同时对展示知识产权信息等的白名单水印进行保护而不予去除。权信息等的白名单水印进行保护而不予去除。权信息等的白名单水印进行保护而不予去除。

【技术实现步骤摘要】
一种去除图像中水印的方法及装置


[0001]本专利技术涉及一种去除图像中的水印(watermark)的方法。

技术介绍

[0002]许多纸件的文档会通过拍照、扫描等方式转换为电子化的文档图像,在文档图像中有时会存在水印。一方面,水印影响用户的阅读体验。另一方面,水印会对文档图像的OCR(光学字符识别)带来干扰,影响OCR的识别结果。因此存在将文档图像中的水印去除的需求,这样能提高文档图像的可读性和美观度,提升用户体验。
[0003]然而图像(不限于文档图像)中的有些水印体现了知识产权所有者等重要信息,权利人希望在文档图像中保留这些水印。因此在去除图像中的水印时,还需要对不同类型的水印分别处理。

技术实现思路

[0004]本专利技术所要解决的技术问题是提出一种去除图像中的水印的方法。用户输入任意一张图像(带水印或不带水印),系统会自动判断是否存在水印,如果存在水印则自动去除水印,从而获得整洁漂亮的图像。
[0005]为解决上述技术问题,本专利技术公开了一种去除图像中水印的方法,包括如下步骤。步骤S1:采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,继续步骤S2;否则退出整个方法。步骤S2:对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则继续步骤S3。步骤S3:采用第二神经网络去除图像中的水印。
[0006]优选地,所述第一神经网络是U2‑
Net、U

Net、DeepLabV3、PSPNet、SegNet的任意一种。
[0007]进一步地,所述第一神经网络的训练方法如下;(1)制作训练数据;采集或生成多张带有水印的图片,在每张图片中由人工标注出水印区域;(2)训练第一神经网络;将每张带有水印的图片送入第一神经网络,第一神经网络输出该图片中的水印区域,使第一神经网络的输出尽可能与每张图片中已标注的水印区域保持一致。
[0008]优选地,所述步骤S1中,第一神经网络从输入图像中获取水印区域的掩膜;掩膜的大小与第一神经网络的输入图像的大小相同;掩膜中像素值为0表示不是水印区域、像素值不为0表示是水印区域;统计掩膜中像素值不为0的像素的数量N;如果N>T,则判定为输入图片中存在水印;否则判定为输入图片中不存在水印;T是判断阈值。
[0009]优选地,所述第二神经网络是自校准定位和背景优化SLBR。
[0010]进一步地,所述第二神经网络的训练方法如下;(1)制作训练数据;采集或生成多组图片;每组图片中的第一张是带有水印的图片;每组图片中的第二张是不带水印的图片;(2)训练第二神经网络;将每组图片中的第一张送入第二神经网络,第二神经网络输出去除
水印区域的图片,使第二神经网络的输出尽可能与每组图片中的第二张保持一致。
[0011]可选地,所述第二神经网络的训练数据中,每组图片中还有第三张,第三张是第一张图片中的水印区域的掩膜;在训练第二神经网络时,还将每组图片中的第三张送入第二神经网络。
[0012]优选地,所述步骤S1和/或步骤S3中,先将输入图像缩小尺寸,再送入第一神经网络或第二神经网络。
[0013]优选地,当所述第二神经网络处理的图片是缩放后的图片时,在步骤S3之后增加步骤S4。步骤S4:将所述第二神经网络输出的去除水印后的图片放大为步骤S1的原始图像大小,然后将原始图片去除水印区域后、与所述第二神经网络输出的去除水印且放大后的图片中的原水印区域进行合成,得到原始图像大小的去除水印后的图片。
[0014]优选地,所述步骤S1中,输入图像缩小后,一路经过第一神经网络、第二神经网络时不再缩放尺寸;所述步骤S3中,从第二神经网络输出后再放大回原始图像大小。
[0015]本专利技术还公开了一种去除图像中水印的装置,包括水印区域判断获取单元、白名单比对单元、水印去除单元。所述水印区域判断获取单元用于采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,则将图片及其水印区域传递给其他单元;否则退出整个流程。所述白名单比对单元用于对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则交由水印去除单元继续处理。所述水印去除单元用于采用第二神经网络去除图像中的水印。
[0016]本专利技术取得的技术效果是:能够较好地去除图像中的水印,从而获得更干净的图像,同时对展示知识产权信息等的白名单水印进行保护而不予去除。如果是文档图像还能提升OCR识别的准确率,提升用户的阅读体验。
附图说明
[0017]图1是本专利技术提出的去除图像中水印的方法的流程示意图。
[0018]图2是本专利技术提出的去除图像中水印的装置的结构示意图。
[0019]图中附图标记说明:1为水印区域判断获取单元、2为白名单比对单元、3为水印去除单元。
具体实施方式
[0020]请参阅图1,本专利技术提出的去除图像中水印的方法包括如下步骤。
[0021]步骤S1:采用一种用于图像分割(segmentation)的第一神经网络从输入图像中获得水印区域。神经网络(Neural Network,NN)是人工神经网络(Artificial Neural Network,ANN)的简称。所述第一神经网络例如是U2‑
Net、U

Net、DeepLabV3、PSPNet、SegNet的任意一种,优选采用U2‑
Net。如果第一神经网络从输入图片中获取到水印区域,继续步骤S2。如果第一神经网络从输入图片中未获取到水印区域,退出整个方法。
[0022]所述第一神经网络的训练方法如下。(1)制作训练数据。采集或生成多张带有水印的图片,优选为文档图片。在每张图片中由人工标注出水印区域。(2)训练第一神经网络。将每张带有水印的图片送入第一神经网络,第一神经网络输出该图片中的水印区域,使第一
神经网络的输出尽可能与每张图片中已标注的水印区域保持一致。这样训练好的第一神经网络就能够用于从输入图像中获取水印区域。
[0023]优选地,所述步骤S1中,所述第一神经网络的输入图片、输出图片的尺寸均为较小的分辨率,例如1024像素
×
1024像素。这就需要先将输入图像缩小为固定尺寸,再送入第一神经网络。这样做的优势为:(1)节约第一神经网络的计算和存储资源、处理速度快。(2)用于图像分割、图像填充的神经网络在小尺寸图像上感受野更大,学习结果更好。
[0024]可选地,所述步骤S1中,第一神经网络从输入图像中获取水印区域的掩膜(mask)。掩膜的大小与第一神经网络的输入图像的大小相同。掩膜中像素值(表示亮度)为0表示不是水印区域、像素值不为0表示是水印区域。统计掩膜中像素值不为0的像素的数量N。如果N>T,则判定为输入图片中存在水印本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种去除图像中水印的方法,其特征是,包括如下步骤;步骤S1:采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,继续步骤S2;否则退出整个方法;步骤S2:对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则继续步骤S3;步骤S3:采用第二神经网络去除图像中的水印。2.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第一神经网络是U2‑
Net、U

Net、DeepLabV3、PSPNet、SegNet的任意一种。3.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第一神经网络的训练方法如下;(1)制作训练数据;采集或生成多张带有水印的图片,在每张图片中由人工标注出水印区域;(2)训练第一神经网络;将每张带有水印的图片送入第一神经网络,第一神经网络输出该图片中的水印区域,使第一神经网络的输出尽可能与每张图片中已标注的水印区域保持一致。4.根据权利要求1所述的去除图像中水印的方法,其特征是,所述步骤S1中,第一神经网络从输入图像中获取水印区域的掩膜;掩膜的大小与第一神经网络的输入图像的大小相同;掩膜中像素值为0表示不是水印区域、像素值不为0表示是水印区域;统计掩膜中像素值不为0的像素的数量N;如果N>T,则判定为输入图片中存在水印;否则判定为输入图片中不存在水印;T是判断阈值。5.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第二神经网络是自校准定位和背景优化SLBR。6.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第二神经网络的训练方法如下;(1)制作训练数据;采集或生成多组图片;每组图片中的第一张是带有水印的图片;每组图片中的第二张是不带水印的图片;(2...

【专利技术属性】
技术研发人员:刘鹏伟郭丰俊龙腾牛力丁凯张彬
申请(专利权)人:上海临冠数据科技有限公司上海生腾数据科技有限公司上海盈五蓄数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1