一种基于注意力机制的手写字符擦除方法及系统技术方案

技术编号:37351984 阅读:16 留言:0更新日期:2023-04-27 07:03
本发明专利技术提供了图像处理技术领域的一种基于注意力机制的手写字符擦除方法及系统,方法包括如下步骤:步骤S10、获取大量的包含手写字符和印刷体的原始图片,基于所述原始图片构建图片集;步骤S20、对所述图片集进行数据增强处理和图片预处理,进而得到训练数据集;步骤S30、基于注意力机制创建一擦除模型;步骤S40、利用所述训练数据集对擦除模型进行训练;步骤S50、利用训练后的所述擦除模型对待擦除图片的手写字符进行自动擦除。本发明专利技术的优点在于:极大的提升了手写字符擦除的精度以及效率。极大的提升了手写字符擦除的精度以及效率。极大的提升了手写字符擦除的精度以及效率。

【技术实现步骤摘要】
一种基于注意力机制的手写字符擦除方法及系统


[0001]本专利技术涉及图像处理
,特别指一种基于注意力机制的手写字符擦除方法及系统。

技术介绍

[0002]随着科技的进步,OCR扫描在学习、办公等众多场景中被使用,通过技术和算法,可以对扫描获得的纸张文档上的手写字符(笔迹)还原修复,即把图片上的手写字符进行电子擦除,以恢复文档本身的样子,无需重新编辑文档,提升用户体验。
[0003]传统上,手写字符的擦除需要经过两个步骤,首先需要提取手写字符,然后对手写字符区域进行像素值的填充。然而,传统方法的擦除效果不尽如人意,若使用图像编辑软件手工擦除又太消耗人力。
[0004]因此,如何提供一种基于注意力机制的手写字符擦除方法及系统,实现提升手写字符擦除的精度以及效率,成为一个亟待解决的技术问题。

技术实现思路

[0005]本专利技术要解决的技术问题,在于提供一种基于注意力机制的手写字符擦除方法及系统,实现提升手写字符擦除的精度以及效率。
[0006]第一方面,本专利技术提供了一种基于注意力机制的手写字符擦除方法,包括如下步骤:
[0007]步骤S10、获取大量的包含手写字符和印刷体的原始图片,基于所述原始图片构建图片集;
[0008]步骤S20、对所述图片集进行数据增强处理和图片预处理,进而得到训练数据集;
[0009]步骤S30、基于注意力机制创建一擦除模型;
[0010]步骤S40、利用所述训练数据集对擦除模型进行训练;
[0011]步骤S50、利用训练后的所述擦除模型对待擦除图片的手写字符进行自动擦除。
[0012]进一步地,所述步骤S10具体为:
[0013]获取大量的包含手写字符和印刷体的原始图片,利用图像编辑软件去除各所述原始图片中的手写字符得到目标图片,对各所述目标图片进行掩码处理得到掩码图片,基于各所述原始图片、目标图片以及掩码图片构建图片集。
[0014]进一步地,所述步骤S20具体为:
[0015]对所述图片集中的各图片进行随机旋转、随机翻转、亮度变换以及随机灰度化的数据增强处理;
[0016]设定一图片尺寸,基于所述图片尺寸对数据增强处理后的图片进行裁剪以完成图片预处理,进而得到训练数据集。
[0017]进一步地,所述步骤S30中,所述擦除模型设有一语义分割模块、一粗擦除模块以及一精细擦除模块;
[0018]所述语义分割模块用于对图片进行语义分割,以区分手写字符和印刷体;所述粗擦除模块用于对图片的手写字符进行一次擦除;所述精细擦除模块用于对图片的手写字符进行二次擦除;
[0019]所述语义分割模块、粗擦除模块以及精细擦除模块均基于注意力机制的Unet架构;所述语义分割模块以及粗擦除模块公用特征提取部分;所述语义分割模块以及粗擦除模块的高级网络层设有CBAM单元以及ASPP单元;所述精细擦除模块的低级网络层设有Non

Local自注意力单元,且网络特征通道数大于所述粗擦除模块的网络特征通道数。
[0020]进一步地,所述步骤S40具体为:
[0021]将所述训练数据集中的原始图片输入擦除模型进行训练,获取预测目标图片和预测掩码图片,通过目标损失函数计算所述训练数据集中的目标图片与预测目标图片的目标损失值,通过掩码损失函数计算所述训练数据集中的掩码图片与预测掩码图片的掩码损失值,累加所述目标损失值和掩码损失值得到总损失值,对所述擦除模型持续进行训练,直至达到预设的训练迭代数;
[0022]所述目标损失函数为平均绝对误差函数;所述掩码损失函数为交叉熵损失函数。
[0023]第二方面,本专利技术提供了一种基于注意力机制的手写字符擦除系统,包括如下模块:
[0024]图片集构建模块,用于获取大量的包含手写字符和印刷体的原始图片,基于所述原始图片构建图片集;
[0025]训练数据集构建模块,用于对所述图片集进行数据增强处理和图片预处理,进而得到训练数据集;
[0026]擦除模型创建模块,用于基于注意力机制创建一擦除模型;
[0027]擦除模型训练模块,用于利用所述训练数据集对擦除模型进行训练;
[0028]手写字符擦除模块,用于利用训练后的所述擦除模型对待擦除图片的手写字符进行自动擦除。
[0029]进一步地,所述图片集构建模块具体用于:
[0030]获取大量的包含手写字符和印刷体的原始图片,利用图像编辑软件去除各所述原始图片中的手写字符得到目标图片,对各所述目标图片进行掩码处理得到掩码图片,基于各所述原始图片、目标图片以及掩码图片构建图片集。
[0031]进一步地,所述训练数据集构建模块具体用于:
[0032]对所述图片集中的各图片进行随机旋转、随机翻转、亮度变换以及随机灰度化的数据增强处理;
[0033]设定一图片尺寸,基于所述图片尺寸对数据增强处理后的图片进行裁剪以完成图片预处理,进而得到训练数据集。
[0034]进一步地,所述擦除模型创建模块中,所述擦除模型设有一语义分割模块、一粗擦除模块以及一精细擦除模块;
[0035]所述语义分割模块用于对图片进行语义分割,以区分手写字符和印刷体;所述粗擦除模块用于对图片的手写字符进行一次擦除;所述精细擦除模块用于对图片的手写字符进行二次擦除;
[0036]所述语义分割模块、粗擦除模块以及精细擦除模块均基于注意力机制的Unet架
构;所述语义分割模块以及粗擦除模块公用特征提取部分;所述语义分割模块以及粗擦除模块的高级网络层设有CBAM单元以及ASPP单元;所述精细擦除模块的低级网络层设有Non

Local自注意力单元,且网络特征通道数大于所述粗擦除模块的网络特征通道数。
[0037]进一步地,所述擦除模型训练模块具体用于:
[0038]将所述训练数据集中的原始图片输入擦除模型进行训练,获取预测目标图片和预测掩码图片,通过目标损失函数计算所述训练数据集中的目标图片与预测目标图片的目标损失值,通过掩码损失函数计算所述训练数据集中的掩码图片与预测掩码图片的掩码损失值,累加所述目标损失值和掩码损失值得到总损失值,对所述擦除模型持续进行训练,直至达到预设的训练迭代数;
[0039]所述目标损失函数为平均绝对误差函数;所述掩码损失函数为交叉熵损失函数。
[0040]本专利技术的优点在于:
[0041]通过获取包含手写字符和印刷体的原始图片并构建图片集,对图片集进行数据增强处理和图片预处理以得到训练数据集,再利用训练数据集对创建的擦除模型进行训练,使得擦除模型具有较强的鲁棒性以及泛化性,且基于注意力机制创建擦除模型,增强了擦除模型的特征提取能力,并设置ASPP单元来提升语义分割模块和粗擦除模块的感受野,进一步提升特征提取能力,在精细擦除模块的低级网络层设置Non

Local自注意力单元,且网络特征通道数大于粗擦除模块的网络特征通道数,有效提升精细擦本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的手写字符擦除方法,其特征在于:包括如下步骤:步骤S10、获取大量的包含手写字符和印刷体的原始图片,基于所述原始图片构建图片集;步骤S20、对所述图片集进行数据增强处理和图片预处理,进而得到训练数据集;步骤S30、基于注意力机制创建一擦除模型;步骤S40、利用所述训练数据集对擦除模型进行训练;步骤S50、利用训练后的所述擦除模型对待擦除图片的手写字符进行自动擦除。2.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S10具体为:获取大量的包含手写字符和印刷体的原始图片,利用图像编辑软件去除各所述原始图片中的手写字符得到目标图片,对各所述目标图片进行掩码处理得到掩码图片,基于各所述原始图片、目标图片以及掩码图片构建图片集。3.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S20具体为:对所述图片集中的各图片进行随机旋转、随机翻转、亮度变换以及随机灰度化的数据增强处理;设定一图片尺寸,基于所述图片尺寸对数据增强处理后的图片进行裁剪以完成图片预处理,进而得到训练数据集。4.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S30中,所述擦除模型设有一语义分割模块、一粗擦除模块以及一精细擦除模块;所述语义分割模块用于对图片进行语义分割,以区分手写字符和印刷体;所述粗擦除模块用于对图片的手写字符进行一次擦除;所述精细擦除模块用于对图片的手写字符进行二次擦除;所述语义分割模块、粗擦除模块以及精细擦除模块均基于注意力机制的Unet架构;所述语义分割模块以及粗擦除模块公用特征提取部分;所述语义分割模块以及粗擦除模块的高级网络层设有CBAM单元以及ASPP单元;所述精细擦除模块的低级网络层设有Non

Local自注意力单元,且网络特征通道数大于所述粗擦除模块的网络特征通道数。5.如权利要求1所述的一种基于注意力机制的手写字符擦除方法,其特征在于:所述步骤S40具体为:将所述训练数据集中的原始图片输入擦除模型进行训练,获取预测目标图片和预测掩码图片,通过目标损失函数计算所述训练数据集中的目标图片与预测目标图片的目标损失值,通过掩码损失函数计算所述训练数据集中的掩码图片与预测掩码图片的掩码损失值,累加所述目标损失值和掩码损失值得到总损失值,对所述擦除模型持续进行训练,直至达到预设的训练迭代数;所述目标损失函数为平均绝对误差函数;所述掩码损失函数为交叉熵损失函数。6.一种基于注意力机制的手写字符擦除系统,其特征在于:...

【专利技术属性】
技术研发人员:杨辉黄家昌赵宝华邱道椿
申请(专利权)人:福建亿能达信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1