一种基于生成对抗网络的手写文字擦除方法技术

技术编号:39581814 阅读:12 留言:0更新日期:2023-12-03 19:32
本申请公开了一种基于生成对抗网络的手写文字擦除方法,步骤包括:收集带有手写文字的文档图像,并对文档进行人工标注,得到数据集;基于数据集,生成手写文字笔画掩码;对文档图像进行预处理,得到处理后数据;根据手写文字笔画掩码搭建基于生成对抗网络的手写文字擦除模型;利用处理后数据对手写文字擦除模型进行训练,得到最终模型;利用最终模型擦除文档图像中的手写文字部分

【技术实现步骤摘要】
一种基于生成对抗网络的手写文字擦除方法


[0001]本申请涉及图像处理领域,具体涉及一种基于生成对抗网络的手写文字擦除方法


技术介绍

[0002]手写文字在现代社会中扮演着重要的角色,被广泛应用于各种领域,包括文档编辑

签名

艺术创作等

然而,有时候需要对手写文字进行修改或擦除,以适应特定需求或纠正错误

使用
Adobe Photoshop
等图片编辑工具手动抹除图片中的手写文字效率很低,并且对使用者的门槛比较高,因此需要一种高效

准确的自动手写文字擦除方法

[0003]我们擦除手写文字的同时是不希望印刷的内容被错误的擦除的,然而文档图像中包含着很多的印刷文字,手写文字在很多情况下会紧靠印刷文字,要精确地擦除手写文字是一个很具挑战的问题

现有的方法难以擦除版面复杂的文档中的手写文字,手写文字擦除面临着多种问题,如擦除后图像的自然性

消除擦除痕迹等

因此,需要一种创新的手写文字擦除方法,能够有效地处理这些问题

随着深度学习技术的迅速发展,生成对抗网络
(GANs)
已经在图像处理领域展现出了强大的能力
。GANs
是一类由生成器和判别器组成的神经网络,通过对抗训练方式,生成器逐渐学习生成逼真的数据,而判别器则不断提高对真实数据和生成数据的识别能力
/>这种技术在图像生成

转换和修复方面取得了令人瞩目的成果


技术实现思路

[0004]本申请的目的是提供一种基于生成对抗网络的手写文字擦除的方法,可以用于自动去除文档图像中的手写污迹,获得干净的文档图像

[0005]为实现上述目的,本申请提供了一种基于生成对抗网络的手写文字擦除方法,步骤包括:
[0006]收集带有手写文字的文档图像,并对所述文档进行人工标注,得到数据集;
[0007]基于所述数据集,生成手写文字笔画掩码;
[0008]对所述文档图像进行预处理,得到处理后数据;
[0009]根据所述手写文字笔画掩码搭建基于生成对抗网络的手写文字擦除模型;
[0010]利用所述处理后数据对所述手写文字擦除模型进行训练,得到最终模型;
[0011]利用所述最终模型擦除文档图像中的手写文字部分

[0012]优选的,进行所述人工标注的方法包括:使用
Adobe Photoshop
工具对文档图像中的手写文字进行擦除,得到擦除后文档图像;使用四边形框对文档图像中的手写文字的坐标进行标注,得到手写文字四边形掩码

[0013]优选的,生成所述手写文字笔画掩码的方法包括:利用原始文档图像和所述擦除后文档图像做差值,然后进行阈值二值化

腐蚀膨胀消除噪声

向内收缩获取文字骨架

向外平滑扩张获取文字外边界来自动生成所述手写文字笔画掩码

[0014]优选的,得到所述处理后数据的方法包括:将完整的文档图像裁剪成若干个
512*512
像素大小的图像块,并在
±
10
°
范围内随机旋转图像块,并且以
0.5
的概率水平翻转图像块,得到所述处理后数据

[0015]优选的,构建的所述手写文字擦除模型包括:级联生成器和判别器;
[0016]所述级联生成器用于生成所述擦除后文档图像;
[0017]所述判别器用于对图像进行真假判别

[0018]优选的,所述级联生成器包括:粗糙擦除网络和精细擦除网络;
[0019]所述粗糙擦除网络用于预测所述手写文字笔画掩码和所述手写文字四边形掩码,同时生成初步擦除结果;
[0020]所述精细擦除用于对所述初步擦除结果进行精细的擦除,生成擦除手写文字后的文档图像

[0021]优选的,所述粗糙擦除网络包括:编码器

解码器和手写文字掩码预测头;
[0022]所述编码器用于提取文档图像特征;
[0023]所述解码器用于将所述文档图像特征解码成所述初步擦除结果;
[0024]所述手写文字掩码预测头用于从所述文档图像特征中预测所述手写文字笔画掩码和所述手写文字四边形掩码

[0025]优选的,所述精细擦除网络采用
U

net
网络结构

[0026]与现有技术相比,本申请的有益效果如下:
[0027]本申请旨在提供一种基于生成对抗网络的手写文字擦除方法,通过利用生成对抗网络,实现对手写文字的自动

高质量擦除

利用深度学习网络对文档图像进行特征提取,通过预测手写文字的笔画精确定位需要擦除的区域,采用级联的生成对抗网络对手写文字进行擦除

该方法不仅可以在保持擦除后图像的自然性的同时,还能够有效地消除擦除痕迹,从而满足多种手写文字处理需求

通过将深度学习和图像处理相结合,具有实现简单

速度快

擦除效果好等优点

附图说明
[0028]为了更清楚地说明本申请的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图

[0029]图1为本申请的方法流程示意图;
[0030]图2是本申请实施例的生成手写文字笔画掩码的流程图;
[0031]图3是本申请实施例的级联生成器的整体结构示意图;
[0032]图4是本申请实施例的残差连接块结构示意图;
[0033]图5是本申请实施例的精细生成器的结构示意图;
[0034]图6是本申请实施例的手写文字擦除效果示意图

具体实施方式
[0035]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例

基于
本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围

[0036]为使本申请的上述目的

特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明

[0037]如图1所示,为本实施例的方法流程示意图,步骤包括:
[0038]S1.
收集带有手写文字的文本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于生成对抗网络的手写文字擦除方法,其特征在于,步骤包括:收集带有手写文字的文档图像,并对所述文档进行人工标注,得到数据集;基于所述数据集,生成手写文字笔画掩码;对所述文档图像进行预处理,得到处理后数据;根据所述手写文字笔画掩码搭建基于生成对抗网络的手写文字擦除模型;利用所述处理后数据对所述手写文字擦除模型进行训练,得到最终模型;利用所述最终模型擦除文档图像中的手写文字部分
。2.
根据权利要求1所述的基于生成对抗网络的手写文字擦除方法,其特征在于,进行所述人工标注的方法包括:使用
Adobe Photoshop
工具对文档图像中的手写文字进行擦除,得到擦除后文档图像;使用四边形框对文档图像中的手写文字的坐标进行标注,得到手写文字四边形掩码
。3.
根据权利要求1所述的基于生成对抗网络的手写文字擦除方法,其特征在于,生成所述手写文字笔画掩码的方法包括:利用原始文档图像和所述擦除后文档图像做差值,然后进行阈值二值化

腐蚀膨胀消除噪声

向内收缩获取文字骨架

向外平滑扩张获取文字外边界来自动生成所述手写文字笔画掩码
。4.
根据权利要求1所述的基于生成对抗网络的手写文字擦除方法,其特征在于,得到所述处理后数据的方法包括:将完整的文档图像裁剪成若干个
512*512
像素大小的图像...

【专利技术属性】
技术研发人员:金连文黄鎏丰周伟英
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1