一种图像文字识别的纠错方法、纠错装置、设备及介质制造方法及图纸

技术编号：39160114 阅读：9 留言：0更新日期：2023-10-23 15:02

本申请提供了一种图像文字识别的纠错方法、纠错装置、设备及介质，所述方法包括：从原始文字图像中提取待纠错文本，并将待纠错文本输入到统计语言模型中，确定出待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符；针对于每个待纠错字符，将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中，确定出每个候选字符的可替换概率；基于每个候选字符的可替换概率从多个候选字符中确定出替换该待纠错字符的目标字符，并基于目标字符对该待纠错字符进行纠错，以得到纠错后文本。通过所述方法及装置，提高了图像文字识别的准确率，同时提高了对错误文字进行纠错的效率。字进行纠错的效率。字进行纠错的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像文字识别的纠错方法、纠错装置、设备及介质

[0001]本申请涉及文字处理
，具体而言，涉及一种图像文字识别的纠错方法、纠错装置、设备及介质。

技术介绍

[0002]银行在长期业务处理过程中会产生大量的图像资料，在日常运营过程中，许多场景都存在大量需要人工录入的数据。例如，目前财务报表的数据获取基本上还是基于人工录入的方式，效率低，无法实现审批自动化。银行传统人工获取财务数据的方式已经严重阻碍了银行的运营效率和业务开展，而财报数据又是银行审批过程中的核心数据，只有提高财务报表数据的采集工作，银行的运营、审批效率才会又大幅提高的可能。高精度、稳定、可靠的图片文字识别技术替代传统人工录入方式，能有效提高银行业务自动化处理能力。
[0003]衡量一个图片文字识别系统最重要的指标就是准确率，即识别出的文字是否跟图片中实际文字相同，不同即为错误。过多的错误会造成系统可靠性差，反倒增加人工成本和操作风险。所以，如何提高图片文字识别的准确率成为了不容小觑的计算问题。

技术实现思路

[0004]有鉴于此，本申请的目的在于提供一种图像文字识别的纠错方法、纠错装置、设备及介质，提高了图像文字识别的准确率，同时提高了对错误文字进行纠错的效率。
[0005]第一方面，本申请实施例提供了一种图像文字识别的纠错方法，所述纠错方法包括：
[0006]从原始文字图像中提取待纠错文本，并将所述待纠错文本输入到统计语言模型中，确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符；

【技术保护点】

【技术特征摘要】
1.一种图像文字识别的纠错方法，其特征在于，所述纠错方法包括：从原始文字图像中提取待纠错文本，并将所述待纠错文本输入到统计语言模型中，确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符；针对于每个待纠错字符，将该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征输入到预先训练好的可替换概率预测模型中，确定出每个候选字符的可替换概率；基于每个候选字符的可替换概率从多个所述候选字符中确定出替换该待纠错字符的目标字符，并基于所述目标字符对该待纠错字符进行纠错，以得到纠错后文本。2.根据权利要求1所述的纠错方法，其特征在于，所述从原始文字图像中提取待纠错文本，包括：对所述原始文字图像进行文字识别，得到所述原始文字图像对应的第一识别文字和所述第一识别文字对应的置信度；当所述第一识别文字对应的置信度低于置信度阈值时，则对所述原始文字图像进行图像超分辨率重建，得到目标文字图像；对所述目标文字图像进行文字识别，得到所述目标文字图像对应的第二识别文字和所述第二识别文字对应的置信度，当所述第二识别文字对应的置信度低于所述置信度阈值时，将所述第二识别文字确定为所述待纠错文本。3.根据权利要求1所述的纠错方法，其特征在于，所述将所述待纠错文本输入到统计语言模型中，确定出所述待纠错文本中的多个待纠错字符以及每个待纠错字符对应的多个候选字符，包括：将所述待纠错文本输入到统计语言模型中，得到所述待纠错文本中每个词对应的出现概率；针对于所述出现概率小于或等于概率阈值的每个词，确定该词对应的多个候选词；针对于该词对应的多个候选词，使用该候选词对所述待纠错文本中的该词进行替换，得到替换后文本，并确定所述替换后文本对应的语义困惑度；当所述语义困惑度小于或等于困惑度阈值时，则将该词中的字符确定为所述待纠错字符，将该候选词中与所述待纠错字符位置相同的字符确定为所述待纠错字符对应的候选字符。4.根据权利要求3所述的纠错方法，其特征在于，通过以下步骤确定该待纠错字符与该待纠错字符对应的每个候选字符之间的字符相似度特征：针对于该待纠错字符对应的每个候选字符，计算该待纠错字符与该候选字符之间的多个相似度特征；其中，所述多个相似度特征包括以下至少一项：四码相似度、笔画编辑距离、笔画数相似度、结构相似度、偏旁相似度和拼音相似度；将该待纠错字符与该候选字符之间的多个相似度特征、该候选字符所属的替换后文本对应的语义困惑度以及所述待纠错文本对应的置信度进行归一化，以得到该待纠错字符与该候选字符之间的字符相似度特征。5.根据权利要求1所述的纠错方法，其特征在于，通过以下步骤训练所述可替换概率预测模型：获取训练数据集；其中，所述训练数据集中的训练数据包括待替换样本字符与候选样
本字符之间的样本相似度特征以及用该候选样本字符替换该待替换样本字符的标注替换概率；基于所述训练数据集对原...

【专利技术属性】
技术研发人员：周俊，李学勇，何海清，姜超，
申请(专利权)人：渤海银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人