水印去除模型训练样本生成方法、系统、储存介质、计算机技术方案

技术编号:38362895 阅读:6 留言:0更新日期:2023-08-05 17:31
一种水印去除模型训练样本生成方法、系统、储存介质、计算机;本发明专利技术基于计算机视觉技术自动合成水印,通过字体类型和字体大小生成长度不超过30个文字的背景透明水印文本,针对透明水印文本,实现水印文本0~180

【技术实现步骤摘要】
水印去除模型训练样本生成方法、系统、储存介质、计算机


[0001]本专利技术涉及计算机
,具体涉及一种水印去除模型训练样本生成方法、系统、储存介质、计算机。

技术介绍

[0002]随着数字媒体技术和计算机技术的发展,各种数字媒体如图像,通过互联网进行传播,人们可以进行下载使用。为了保护图像的版权,往往在图像中添加水印。由于水印会在一定程度上干扰或破坏图像的内在数据信息,为了更好地应用图像的价值,需要将图像中的水印去除。
[0003]目前,可以通过生成式对抗模型对水印图像进行水印去除,得到对应的干净图像,然而,传统的生成式对抗模型在水印去除过程中,可能会丢失水印图像的原有信息,导致得到的干净图像的质量较低;因此,需要通过水印去除模型进行训练进而去除水印,但是需要一定数量的训练样本进行训练才能够提升质量,而收集训练样本则十分麻烦,尤其是图像型的扫描件。

技术实现思路

[0004]本专利技术所要解决的技术问题是:提供一种能够生成水印训练样本的水印去除模型训练样本生成方法、系统、储存介质、计算机。
[0005]为了解决上述技术问题,本专利技术采用的第一种技术方案为:
[0006]一种水印去除模型训练样本生成方法,包括
[0007]S1:基于计算机视觉技术,通过不同字体和字体大小生成水印文本;
[0008]S2:将步骤S1生成的水印文本,生成背景为透明的图片;
[0009]S3:将步骤S1生成的水印文本,实现水印文本旋转并生成水印图片;
[0010]S4:上传待添加水印的图像型扫描件PDF;
[0011]S5:对图像型扫描件PDF进行分析,按照每页进行分别,生成每页图片;
[0012]S6:将步骤S2、S3生成的所有背景透明的一个水印图片与步骤S5生成每页图片,进行合成;
[0013]S7:将步骤S6合成的含水印图片,添加背景噪声则完成训练样本生成。
[0014]优选地,S1进一步包括:
[0015]基于计算机视觉技术,通过不同字体和字体大小生成长度不超过30个文字水印文本或字节数量不超过30个文字等同数量的字节。
[0016]优选地,S3进一步包括:
[0017]将步骤S1生成的水印文本,实现水印文本0~180
°
旋转并生成水印图片。
[0018]优选地,S4进一步包括:
[0019]上传待添加水印的图像型扫描件PDF,并执行加密程序。
[0020]优选地,执行S6后将S2、S3两个或两个以上水印图片在S5生成的图片中随机位置
进行合成,水印位置避免重合。
[0021]优选地,执行S7后将步骤S2、S3生成的水印图片与步骤S7所生成的含水印图片建立对应关系。
[0022]优选地,所述噪声为椒盐噪声。
[0023]为了解决上述技术问题,本专利技术采用的第二种技术方案为:
[0024]一种图像型扫描件水印去除模型训练样本生成系统,包括处理单元,所述处理单元执行上述的水印去除模型训练样本生成方法。
[0025]为了解决上述技术问题,本专利技术采用的第三种技术方案为:
[0026]一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的水印去除模型训练样本生成方法。
[0027]为了解决上述技术问题,本专利技术采用的第四种技术方案为:
[0028]一种计算机,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现上述的水印去除模型训练样本生成方法。
[0029]本专利技术的有益效果在于:本专利技术基于计算机视觉技术自动合成水印,通过字体类型和字体大小生成长度不超过30个文字的背景透明水印文本,针对透明水印文本,实现水印文本0~180
°
旋转并生成水印图片,上传待添加水印的图像型扫描件PDF,计算机完成图像型扫描件PDF分页,并将每页与所生成的背景透明水印图片进行合成,快速进行图像型扫描件PDF水印生成训练样本。
附图说明
[0030]图1为本专利技术具体实施方式的一种水印去除模型训练样本生成方法生成的水印文本示例;
[0031]图2为本专利技术具体实施方式的一种水印去除模型训练样本生成方法的图像型扫描件示例;
[0032]图3为本专利技术具体实施方式的一种水印去除模型训练样本生成方法的合成图片示例1;
[0033]图4为本专利技术具体实施方式的一种水印去除模型训练样本生成方法的合成图片示例2。
具体实施方式
[0034]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0035]实施例一
[0036]请参照图1至图4,一种(图像型扫描件)水印去除模型训练样本生成方法,包括
[0037]S11:基于计算机视觉技术,通过不同字体和字体大小生成长度不超过30个文字(汉字)水印文本或字节数量不超过30个文字等同数量的字节(例如一个汉字2字节,一个英文字母1字节,即60个英文字母);
[0038]S12:将步骤S11生成的水印文本,生成背景为透明的图片(参见图1);
[0039]S13:将步骤S11生成的水印文本,实现水印文本0~180
°
旋转并生成水印图片;
[0040]S14:上传待添加水印的图像型扫描件PDF,并执行加密程序;
[0041]S15:对图像型扫描件PDF进行分析,按照每页进行分别(将每页独立拆分出),生成每页图片(参见图2,给出一张图片作为示意,图中文字内容无意义,图3、图4同样文字无意义);
[0042]S16:将步骤S11、S13生成的所有背景透明的一个水印图片与步骤S15生成每页图片,进行合成(参照图3和图4(旋转45
°
后));
[0043]S17:将S12、S13两个或两个以上水印图片在S15生成的图片中随机位置进行合成,水印位置避免重合;
[0044]S18:将步骤S16合成的含水印图片,添加椒盐噪声则完成训练样本生成;
[0045]S19:将步骤S12、S13生成的水印图片与步骤S17所生成的含水印图片建立对应关系。
[0046]实施例二
[0047]一种图像型扫描件水印去除模型训练样本生成系统,包括处理单元,所述处理单元执行实施例一所述的水印去除模型训练样本生成方法。
[0048]实施例三
[0049]一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现实施例一所述的水印去除模型训练样本生成方法。
[0050]实施例四
[0051]一种计算机,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现实施例一所述的水印去除模型训练样本生成方法。
[0052]以上所述仅为本专利技术的实施例,并非因此限制本专利技术的专利范围,凡是利用本专利技术说明书及附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水印去除模型训练样本生成方法,其特征在于,包括S1:基于计算机视觉技术,通过不同字体和字体大小生成水印文本;S2:将步骤S1生成的水印文本,生成背景为透明的图片;S3:将步骤S1生成的水印文本,实现水印文本旋转并生成水印图片;S4:上传待添加水印的图像型扫描件PDF;S5:对图像型扫描件PDF进行分析,按照每页进行分别,生成每页图片;S6:将步骤S2、S3生成的所有背景透明的一个水印图片与步骤S5生成每页图片,进行合成;S7:将步骤S6合成的含水印图片,添加背景噪声则完成训练样本生成。2.根据权利要求1所述的水印去除模型训练样本生成方法,其特征在于,S1进一步包括:基于计算机视觉技术,通过不同字体和字体大小生成长度不超过30个文字水印文本或字节数量不超过30个文字等同数量的字节。3.根据权利要求1所述的水印去除模型训练样本生成方法,其特征在于,S3进一步包括:将步骤S1生成的水印文本,实现水印文本0~180
°
旋转并生成水印图片。4.根据权利要求1所述的水印去除模型训练样本生成方法,其特征在于,S4进一步包括:上传待添加水印的图像型扫描件PD...

【专利技术属性】
技术研发人员:翟晓刚
申请(专利权)人:中国人寿资产管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1