一种图像文字识别的纠错方法、纠错装置、设备及介质制造方法及图纸

技术编号:39160114 阅读:9 留言:0更新日期:2023-10-23 15:02
本申请提供了一种图像文字识别的纠错方法、纠错装置、设备及介质,所述方法包括:从原始文字图像中提取待纠错文本,并将待纠错文本输入到统计语言模型中,确定出待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符;针对于每个待纠错字符,将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中,确定出每个候选字符的可替换概率;基于每个候选字符的可替换概率从多个候选字符中确定出替换该待纠错字符的目标字符,并基于目标字符对该待纠错字符进行纠错,以得到纠错后文本。通过所述方法及装置,提高了图像文字识别的准确率,同时提高了对错误文字进行纠错的效率。字进行纠错的效率。字进行纠错的效率。

【技术实现步骤摘要】
一种图像文字识别的纠错方法、纠错装置、设备及介质


[0001]本申请涉及文字处理
,具体而言,涉及一种图像文字识别的纠错方法、纠错装置、设备及介质。

技术介绍

[0002]银行在长期业务处理过程中会产生大量的图像资料,在日常运营过程中,许多场景都存在大量需要人工录入的数据。例如,目前财务报表的数据获取基本上还是基于人工录入的方式,效率低,无法实现审批自动化。银行传统人工获取财务数据的方式已经严重阻碍了银行的运营效率和业务开展,而财报数据又是银行审批过程中的核心数据,只有提高财务报表数据的采集工作,银行的运营、审批效率才会又大幅提高的可能。高精度、稳定、可靠的图片文字识别技术替代传统人工录入方式,能有效提高银行业务自动化处理能力。
[0003]衡量一个图片文字识别系统最重要的指标就是准确率,即识别出的文字是否跟图片中实际文字相同,不同即为错误。过多的错误会造成系统可靠性差,反倒增加人工成本和操作风险。所以,如何提高图片文字识别的准确率成为了不容小觑的计算问题。

技术实现思路

[0004]有鉴于此,本申请的目的在于提供一种图像文字识别的纠错方法、纠错装置、设备及介质,提高了图像文字识别的准确率,同时提高了对错误文字进行纠错的效率。
[0005]第一方面,本申请实施例提供了一种图像文字识别的纠错方法,所述纠错方法包括:
[0006]从原始文字图像中提取待纠错文本,并将所述待纠错文本输入到统计语言模型中,确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符;
[0007]针对于每个待纠错字符,将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中,确定出每个候选字符的可替换概率;
[0008]基于每个候选字符的可替换概率从多个所述候选字符中确定出替换该待纠错字符的目标字符,并基于所述目标字符对该待纠错字符进行纠错,以得到纠错后文本。
[0009]进一步的,所述从原始文字图像中提取待纠错文本,包括:
[0010]对所述原始文字图像进行文字识别,得到所述原始文字图像对应的第一识别文字和所述第一识别文字对应的置信度;
[0011]当所述第一识别文字对应的置信度低于置信度阈值时,则对所述原始文字图像进行图像超分辨率重建,得到目标文字图像;
[0012]对所述目标文字图像进行文字识别,得到所述目标文字图像对应的第二识别文字和所述第二识别文字对应的置信度,当所述第二识别文字对应的置信度低于所述置信度阈值时,将所述第二识别文字确定为所述待纠错文本。
[0013]进一步的,所述将所述待纠错文本输入到统计语言模型中,确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符,包括:
[0014]将所述待纠错文本输入到统计语言模型中,得到所述待纠错文本中每个词对应的出现概率;
[0015]针对于所述出现概率小于或等于概率阈值的每个词,确定该词对应的多个候选词;
[0016]针对于该词对应的多个候选词,使用该候选词对所述待纠错文本中的该词进行替换,得到替换后文本,并确定所述替换后文本对应的语义困惑度;
[0017]当所述语义困惑度小于或等于困惑度阈值时,则将该词中的字符确定为所述待纠错字符,将该候选词中与所述待纠错字符位置相同的字符确定为所述待纠错字符对应的候选字符。
[0018]进一步的,通过以下步骤确定该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征:
[0019]针对于该待纠错字符对应的每个候选字符,计算该待纠错字符与该候选字符之间的多个相似度特征;其中,所述多个相似度特征包括以下至少一项:四码相似度、笔画编辑距离、笔画数相似度、结构相似度、偏旁相似度和拼音相似度;
[0020]将该待纠错字符与该候选字符之间的多个相似度特征、该候选字符所属的替换后文本对应的语义困惑度以及所述待纠错文本对应的置信度进行归一化,以得到该待纠错字符与该候选字符之间的字符相似度特征。
[0021]进一步的,通过以下步骤训练所述可替换概率预测模型:
[0022]获取训练数据集;其中,所述训练数据集中的训练数据包括待替换样本字符与候选样本字符之间的样本相似度特征以及用该候选样本字符替换该待替换样本字符的标注替换概率;
[0023]基于所述训练数据集对原始可替换概率预测模型进行训练,以得到所述可替换概率预测模型。
[0024]进一步的,所述基于所述训练数据集对所述原始可替换概率预测模型进行训练,以得到所述可替换概率预测模型,包括:
[0025]基于所述训练数据生成第一决策树,其中,所述第一决策树代表所述样本数据中每个候选样本字符对应的预测概率;
[0026]将所述第一决策树的预测结果与所述训练数据中的标注替换概率进行对比,计算所述第一决策树的预测误差和损失值;
[0027]基于所述第一决策树的预测误差生成第二决策树;
[0028]将所述第二决策树的预测结果与所述训练数据中的标注替换概率进行对比,计算所述第二决策树的预测误差和损失值;
[0029]若所述第二决策树的损失值大于损失阈值,或,所述原始可替换概率预测模型中决策树的数量小于数量阈值,则基于所述第二决策树的预测误差生成下一决策树,直至所述下一决策树的损失值小于所述损失阈值或所述原始可替换概率预测模型中决策树的数量等于所述数量阈值,得到所述可替换概率预测模型。
[0030]第二方面,本申请实施例还提供了一种图像文字识别的纠错装置,所述纠错装置
包括:
[0031]纠错字符确定模块,用于从原始文字图像中提取待纠错文本,并将所述待纠错文本输入到统计语言模型中,确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符;
[0032]可替换概率确定模块,用于针对于每个待纠错字符,将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中,确定出每个候选字符的可替换概率;
[0033]文本纠错模块,用于基于每个候选字符的可替换概率从多个所述候选字符中确定出替换该待纠错字符的目标字符,并基于所述目标字符对该待纠错字符进行纠错,以得到纠错后文本。
[0034]进一步的,所述纠错字符确定模块在用于从原始文字图像中提取待纠错文本时,所述纠错字符确定模块还用于:
[0035]对所述原始文字图像进行文字识别,得到所述原始文字图像对应的第一识别文字和所述第一识别文字对应的置信度;
[0036]当所述第一识别文字对应的置信度低于置信度阈值时,则对所述原始文字图像进行图像超分辨率重建,得到目标文字图像;
[0037]对所述目标文字图像进行文字识别,得到所述目标文字图像对应的第二识别文字和所述第二识别文字对应的置信度,当所述第二识别文字对应的置信度低于所述置信度阈值时,将所述第二识别文字确定为所述待纠错文本。
...

【技术保护点】

【技术特征摘要】
1.一种图像文字识别的纠错方法,其特征在于,所述纠错方法包括:从原始文字图像中提取待纠错文本,并将所述待纠错文本输入到统计语言模型中,确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符;针对于每个待纠错字符,将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中,确定出每个候选字符的可替换概率;基于每个候选字符的可替换概率从多个所述候选字符中确定出替换该待纠错字符的目标字符,并基于所述目标字符对该待纠错字符进行纠错,以得到纠错后文本。2.根据权利要求1所述的纠错方法,其特征在于,所述从原始文字图像中提取待纠错文本,包括:对所述原始文字图像进行文字识别,得到所述原始文字图像对应的第一识别文字和所述第一识别文字对应的置信度;当所述第一识别文字对应的置信度低于置信度阈值时,则对所述原始文字图像进行图像超分辨率重建,得到目标文字图像;对所述目标文字图像进行文字识别,得到所述目标文字图像对应的第二识别文字和所述第二识别文字对应的置信度,当所述第二识别文字对应的置信度低于所述置信度阈值时,将所述第二识别文字确定为所述待纠错文本。3.根据权利要求1所述的纠错方法,其特征在于,所述将所述待纠错文本输入到统计语言模型中,确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符,包括:将所述待纠错文本输入到统计语言模型中,得到所述待纠错文本中每个词对应的出现概率;针对于所述出现概率小于或等于概率阈值的每个词,确定该词对应的多个候选词;针对于该词对应的多个候选词,使用该候选词对所述待纠错文本中的该词进行替换,得到替换后文本,并确定所述替换后文本对应的语义困惑度;当所述语义困惑度小于或等于困惑度阈值时,则将该词中的字符确定为所述待纠错字符,将该候选词中与所述待纠错字符位置相同的字符确定为所述待纠错字符对应的候选字符。4.根据权利要求3所述的纠错方法,其特征在于,通过以下步骤确定该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征:针对于该待纠错字符对应的每个候选字符,计算该待纠错字符与该候选字符之间的多个相似度特征;其中,所述多个相似度特征包括以下至少一项:四码相似度、笔画编辑距离、笔画数相似度、结构相似度、偏旁相似度和拼音相似度;将该待纠错字符与该候选字符之间的多个相似度特征、该候选字符所属的替换后文本对应的语义困惑度以及所述待纠错文本对应的置信度进行归一化,以得到该待纠错字符与该候选字符之间的字符相似度特征。5.根据权利要求1所述的纠错方法,其特征在于,通过以下步骤训练所述可替换概率预测模型:获取训练数据集;其中,所述训练数据集中的训练数据包括待替换样本字符与候选样
本字符之间的样本相似度特征以及用该候选样本字符替换该待替换样本字符的标注替换概率;基于所述训练数据集对原...

【专利技术属性】
技术研发人员:周俊李学勇何海清姜超
申请(专利权)人:渤海银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1