文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:34397377 阅读:46 留言:0更新日期:2022-08-03 21:32
本公开涉及一种文本识别方法、装置、存储介质及电子设备,所述方法包括:确定待识别文本图像对应的目标文本中的待纠错文字;根据所述目标文本,获取用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度;确定每个所述候选文字与所述待纠错文字之间的字形相似度;根据多个语义相似度和多个字形相似度,从多个候选文字中确定所述待纠错文字对应的目标文字,并将所述目标文本中的待纠错文字替换为所述目标文字。也就是说,本公开可以先获取用于纠正待纠错文字的多个候选文字,之后再结合语义相似度和字形相似度,从多个候选文字中确定目标文字,以替换目标文本中的待纠错文字,提高了文本识别的准确率。本识别的准确率。本识别的准确率。

【技术实现步骤摘要】
文本识别方法、装置、存储介质及电子设备


[0001]本公开涉及图像处理
,具体地,涉及一种文本识别方法、装置、存储介质及电子设备。

技术介绍

[0002]在光学字符识别领域,由于图片存在低对比度、光照不均等复杂多变的背景,文本布局存在扭曲、褶皱等现象,导致文本识别模型识别到的文本中存在错误文本。
[0003]相关技术中,可以通过预先创建的关键词词表,查找与错误文本距离最近的词,以便对错误文本进行纠正,但是,创建关键词词表需要收集海量语料,若关键词词表中不包含正确的关键词,则不能对错误文本进行纠正,从而导致文本识别的准确率比较低。

技术实现思路

[0004]为了解决上述问题,本公开提供一种文本识别方法、装置、存储介质及电子设备。
[0005]第一方面,本公开提供一种文本识别方法,所述方法包括:
[0006]确定待识别文本图像对应的目标文本中的待纠错文字;
[0007]根据所述目标文本,获取用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度;
[0008]确定每个所述候选文字与所述待纠错文字之间的字形相似度;
[0009]根据多个所述语义相似度和多个所述字形相似度,从多个所述候选文字中确定所述待纠错文字对应的目标文字,并将所述目标文本中的待纠错文字替换为所述目标文字。
[0010]可选地,所述确定待识别文本图像对应的目标文本中的待纠错文字包括:
[0011]将所述待识别图像输入预先训练的文本识别模型,以获取所述文本识别模型输出的所述目标文本和所述目标文本中每个文字对应的预测概率;
[0012]将所述目标文本中预测概率小于或等于预设概率阈值的文字,作为所述待纠错文字。
[0013]可选地,所述根据所述目标文本,获取用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度包括:
[0014]将所述目标文本输入预先训练的候选文字获取模型,以获取所述候选文字获取模型输出的多个所述候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度。
[0015]可选地,所述确定每个所述候选文字与所述待纠错文字之间的字形相似度包括:
[0016]确定所述待纠错文字对应的待纠错文字描述序列,以及每个所述候选文字对应的候选文字描述序列;
[0017]针对每个所述候选文字,根据所述待纠错文字描述序列和所述候选文字对应的候选文字描述序列,确定所述待纠错文字与所述候选文字之间的编辑距离,并根据所述编辑距离确定所述候选文字与所述待纠错文字之间的字形相似度。
[0018]可选地,所述根据多个所述语义相似度和多个所述字形相似度,从多个所述候选
文字中确定所述待纠错文字对应的目标文字包括:
[0019]针对每个所述候选文字,确定所述候选文字对应的所述语义相似度与所述字形相似度之间的相似度和值;
[0020]将多个所述候选文字中相似度和值大于或等于第一预设相似度阈值,且所述字形相似度大于或等于第二预设相似度阈值,且所述语义相似度大于或等于第三预设相似度阈值的待定候选文字,作为所述目标文字。
[0021]可选地,所述方法还包括:
[0022]在所述待定候选文字包括多个的情况下,将多个所述待定候选文字中字形相似度最大的所述待定候选文字,作为所述目标文字。
[0023]第二方面,本公开提供一种文本识别装置,所述装置包括:
[0024]待纠错文字确定模块,用于确定待识别文本图像对应的目标文本中的待纠错文字;
[0025]候选文字确定模块,用于根据所述目标文本,确定用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度;
[0026]字形相似度确定模块,用于确定每个所述候选文字与所述待纠错文字之间的字形相似度;
[0027]目标文字确定模块,用于根据多个所述语义相似度和多个所述字形相似度,从多个所述候选文字中确定所述待纠错文字对应的目标文字,并将所述目标文本中的待纠错文字替换为所述目标文字。
[0028]可选地,所述待纠错文字确定模块,还用于:
[0029]将所述待识别图像输入预先训练的文本识别模型,以获取所述文本识别模型输出的所述目标文本和所述目标文本中每个文字对应的预测概率;
[0030]将所述目标文本中预测概率小于或等于预设概率阈值的文字,作为所述待纠错文字。
[0031]可选地,所述候选文字确定模块,还用于:
[0032]将所述目标文本输入预先训练的候选文字获取模型,以获取所述候选文字获取模型输出的多个所述候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度。
[0033]可选地,所述字形相似度确定模块,还用于:
[0034]确定所述待纠错文字对应的待纠错文字描述序列,以及每个所述候选文字对应的候选文字描述序列;
[0035]针对每个所述候选文字,根据所述待纠错文字描述序列和所述候选文字对应的候选文字描述序列,确定所述待纠错文字与所述候选文字之间的编辑距离,并根据所述编辑距离确定所述候选文字与所述待纠错文字之间的字形相似度。
[0036]可选地,所述目标文字确定模块,还用于:
[0037]针对每个所述候选文字,确定所述候选文字对应的所述语义相似度与所述字形相似度之间的相似度和值;
[0038]将多个所述候选文字中相似度和值大于或等于第一预设相似度阈值,且所述字形相似度大于或等于第二预设相似度阈值,且所述语义相似度大于或等于第三预设相似度阈值的待定候选文字,作为所述目标文字。
[0039]可选地,所述目标文字确定模块,还用于:
[0040]在所述待定候选文字包括多个的情况下,将多个所述待定候选文字中字形相似度最大的所述待定候选文字,作为所述目标文字。
[0041]第三方面,本公开提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面所述方法的步骤。
[0042]第四方面,本公开提供一种电子设备,包括:
[0043]存储器,其上存储有计算机程序;
[0044]处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面所述方法的步骤。
[0045]通过上述技术方案,确定待识别文本图像对应的目标文本中的待纠错文字;根据所述目标文本,获取用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度;确定每个所述候选文字与所述待纠错文字之间的字形相似度;根据多个所述语义相似度和多个所述字形相似度,从多个所述候选文字中确定所述待纠错文字对应的目标文字,并将所述目标文本中的待纠错文字替换为所述目标文字。也就是说,本公开可以先获取用于纠正待纠错文字的多个候选文字,之后再结合语义相似度和字形相似度,从多个候选文字中确定目标文字,以替换目标文本中的待纠错文字,提高了文本识别的准确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:确定待识别文本图像对应的目标文本中的待纠错文字;根据所述目标文本,获取用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度;确定每个所述候选文字与所述待纠错文字之间的字形相似度;根据多个所述语义相似度和多个所述字形相似度,从多个所述候选文字中确定所述待纠错文字对应的目标文字,并将所述目标文本中的待纠错文字替换为所述目标文字。2.根据权利要求1所述的方法,其特征在于,所述确定待识别文本图像对应的目标文本中的待纠错文字包括:将所述待识别图像输入预先训练的文本识别模型,以获取所述文本识别模型输出的所述目标文本和所述目标文本中每个文字对应的预测概率;将所述目标文本中预测概率小于或等于预设概率阈值的文字,作为所述待纠错文字。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本,获取用于纠正所述待纠错文字的多个候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度包括:将所述目标文本输入预先训练的候选文字获取模型,以获取所述候选文字获取模型输出的多个所述候选文字,以及每个所述候选文字与所述目标文本之间的语义相似度。4.根据权利要求1所述的方法,其特征在于,所述确定每个所述候选文字与所述待纠错文字之间的字形相似度包括:确定所述待纠错文字对应的待纠错文字描述序列,以及每个所述候选文字对应的候选文字描述序列;针对每个所述候选文字,根据所述待纠错文字描述序列和所述候选文字对应的候选文字描述序列,确定所述待纠错文字与所述候选文字之间的编辑距离,并根据所述编辑距离确定所述候选文字与所述待纠错文字之间的字形相似度。5.根据权利要求1

4任一项所述的方法,其特征在于,所述根据多个所述语义相似度和多个所述字形相似度,从多个所述候选文字中确定所述待纠错文字对应的目标文字包括...

【专利技术属性】
技术研发人员:刘腾龙
申请(专利权)人:北京开拓鸿业高科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1