文字处理方法、系统、可读存储介质及计算机设备技术方案

技术编号:28478547 阅读:25 留言:0更新日期:2021-05-15 21:47
本发明专利技术公开了一种文字处理方法、系统、可读存储介质及计算机设备,该方法包括获取原始文字图像,并在原始文字图像中查找待修复文字的目标位置,以目标位置为中心,截取预设大小像素的区域,得到第一待修复文字图像;识别第一待修复文字图像中的原始文字高度,创建与第一待修复文字图像尺寸相同的空白图像,并在空白图像内输入与原始文字高度相同的待修复文字,得到第二待修复文字图像;将第一待修复文字图像和第二待修复文字图像输入训练后的生成式对抗网络模型中,得到目标图像,生成式对抗网络模型用于将第一待修复文字图像中的文字风格迁移至第二待修复文字图像中;提取目标图像中的待修复文字,并将待修复文字复制至目标位置处。标位置处。标位置处。

【技术实现步骤摘要】
文字处理方法、系统、可读存储介质及计算机设备


[0001]本专利技术涉及人工智能
,特别涉及一种文字处理方法、系统、可读存储介质及计算机设备。

技术介绍

[0002]扫描图像的做旧,目标是修复图像中破损或被污染的文字,用户在损坏的文字位置输入相应的文字,软件可自动地转换文字风格,使之与原有文字的字体风格保持一致,从而实现文字的做旧。
[0003]现有技术当中,实现文字做旧的主要方案是人为地将需要修复的文字从其他图像中扣取字体风格相同的文字,通过缩放、滤镜等操作达到文字做旧的目的;或者预先识别图像中所有的文字,建立文字与图像块对应关系(即一个文字对应一个图像块),在输入需要修复的文字时,直接查找相对文字对应的图像块,根据文字大小缩放后粘贴到指定位置。
[0004]然而,上述方案中,第一种需要用户具备专业的图像处理能力,文字修复的效果由于用户水平不同而产生差异,且整个过程需要手动操作,自动化程度低,处理效率低下;第二种虽然自动化程度较高,但依赖于文字识别准确率,对于识别错误的文字无能为力,另外,一份文档中大都无法覆盖所有的文字本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文字处理方法,其特征在于,所述方法包括:获取原始文字图像,并在所述原始文字图像中查找待修复文字的目标位置,以所述目标位置为中心,截取预设大小像素的区域,得到第一待修复文字图像;识别所述第一待修复文字图像中的原始文字高度,创建与所述第一待修复文字图像尺寸相同的空白图像,并在所述空白图像内输入与所述原始文字高度相同的待修复文字,得到第二待修复文字图像;将所述第一待修复文字图像和所述第二待修复文字图像输入训练后的生成式对抗网络模型中,得到目标图像,所述生成式对抗网络模型用于将所述第一待修复文字图像中的文字风格迁移至所述第二待修复文字图像中;提取所述目标图像中的所述待修复文字,并将所述待修复文字复制至所述目标位置处。2.根据权利要求1所述的文字处理方法,其特征在于,所述获取原始文字图像,并在所述原始文字图像中查找待修复文字的目标位置,以所述目标位置为中心,截取预设大小像素的区域,得到第一待修复文字图像的步骤包括:判断所述目标位置处是否含有所述待修复文字;若否,则将所述原始文字图像截取成多个所述预设大小像素的区域,遍历多个所述预设大小像素的区域,当判断到所述预设大小像素的区域中含有所述待修复文字时,则判定当前所述预设大小像素的区域为所述第一待修复文字图像。3.根据权利要求2所述的文字处理方法,其特征在于,所述判断到所述预设大小像素的区域中含有所述待修复文字的步骤包括:对所述预设大小像素的区域进行黑白二值化处理,计算黑白二值化处理后的所述预设大小像素的区域中黑色像素数量占所述预设大小像素中的总像素数量的比例;当所述比例超过预设值时,则判定所述预设大小像素中含有所述待修复文字。4.根据权利要求1所述的文字处理方法,其特征在于,所述识别所述第一待修复文字图像中的原始文字高度的步骤包括:对所述第一待修复文字图像进行黑白二值化处理,利用预设像素大小的结构元素对黑白二值化的所述第一待修复文字图像进行形态学膨胀处理;对膨胀后的所述第一待修复文字图像进行连通区域分析,得到多个连通第一待修复文字子图像块;计算多个所述连通第一待修复文字子图像块的平均高度,得到所述第一待修复文字图像中的原始文字高度。5.根据权利...

【专利技术属性】
技术研发人员:于雪曾江佑江少锋熊慧江
申请(专利权)人:江西博微新技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1