基于RPA和AI的文本纠错方法、训练方法及其相关设备技术

技术编号:34437122 阅读:57 留言:0更新日期:2022-08-06 16:21
本公开提出一种基于RPA和AI的文本纠错方法、训练方法及其相关设备,涉及AI和RPA领域,其中,方法包括:基于OCR模型,对待识别图像进行字符识别,得到预测文本以及预测文本中各预测字符的置信度;根据各预测字符的置信度,从各预测字符中确定待处理字符;将预测文本中的待处理字符进行掩码;采用预测模型对掩码后的预测文本进行字符预测,得到待处理字符对应的至少一个替换字符;根据至少一个替换字符与待处理字符的相似度,从至少一个替换字符中确定目标字符;利用目标字符替换预测文本中的待识别字符,得到识别文本。由此,在基于OCR技术,识别得到文本信息后,对文本信息中的字符进行纠正,可以提升文本信息识别结果的准确性和可靠性。性。性。

【技术实现步骤摘要】
基于RPA和AI的文本纠错方法、训练方法及其相关设备


[0001]本公开涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)领域,尤其涉及一种基于RPA和AI的文本纠错方法、训练方法及其相关设备。

技术介绍

[0002]RPA是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]对于企业而言,可能经常需要对图像或PDF(Portable Document Format,可携带文档格式)文档中的字符信息进行识别并提取,比如,对图像中的发票信息、订单信息等进行识别并提取。相关技术中,可以基于光学字符识别(Optical Character Recognition,简称OCR)技术,提取图像或文档中的字符信息。
[0005]然而,受限于图像大小,OCR识别结果的准确性可能无法保证,比如,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于机器人流程自动化RPA和人工智能AI的文本纠错方法,其特征在于,所述方法包括:基于光学字符识别OCR模型,对待识别图像进行字符识别,以得到预测文本以及所述预测文本中各预测字符的置信度;根据各所述预测字符的置信度,从各所述预测字符中确定待处理字符;将所述预测文本中的所述待处理字符进行掩码,并采用预测模型对掩码后的预测文本进行字符预测,以得到所述待处理字符对应的至少一个替换字符;根据所述至少一个替换字符与所述待处理字符的相似度,从所述至少一个替换字符中确定目标字符,并利用所述目标字符替换所述预测文本中的所述待识别字符,以得到识别文本。2.根据权利要求1所述的方法,其特征在于,所述方法由RPA机器人执行。3.根据权利要求1所述的方法,其特征在于,所述将所述预测文本中的所述待处理字符进行掩码,并采用预测模型对掩码后的预测文本进行字符预测,包括:确定所述待处理字符在所述预测文本中的目标位置;获取掩码字符,并利用所述掩码字符替换所述预测文本中所述目标位置处的所述待处理字符,以得到掩码后的预测文本;将所述掩码后的预测文本输入至所述预测模型,以采用所述预测模型对所述掩码后的预测文本进行字符预测,以得到至少一个目标文本;将所述至少一个目标文本中所述目标位置处的字符,作为所述至少一个替换字符。4.根据权利要求3所述的方法,其特征在于,所述预测模型通过以下步骤训练得到:获取样本文本;对所述样本文本中的至少一个样本字符进行掩码,得到掩码后的样本文本;将所述掩码后的样本文本输入至初始的预测模型,以采用所述预测模型对所述掩码后的样本文本进行字符预测,得到输出文本;根据所述样本文本和所述输出文本之间的差异,对所述预测模型中的模型参数进行调整。5.根据权利要求1

4中任一项所述的方法,其特征在于,所述根据所述至少一个替换字符与所述待识别字符的相似度,从所述至少一个替换字符中确定目标字符之前,所述方法还包括:基于设定编码算法,对所述至少一个替换字符进行编码,以得到所述至少一个替换字符的第一编码值;基于所述设定编码算法,对所述待识别字符进行编码,以得到所述待识别字符的第二编码值;根据所述至少一个替换字符的第一编码值和所述第二编码值之间的差异,确定所述至少一个替换字符与所述待识别字符的相似度。6.根据权利要求1

4中任一项所述的方法,其特征在于,所述根据所述至少一个替换字符与所述待识别字符的相似度,从所述至少一个替换字符中确定目标字符之前,所述方法还包括:针对每个所述替换字符,根据所述替换字符进行绘制,得到第一图像;
根据所述待识别字符进行绘制,得到第二图像;根据所述第一图像和所述第二图像之间的相似度,确定所述替换字符与所述待识别字符之间的相似度。7.根据权利要求1

4中任一项所述的方法,其特征在于,所述根据所述至少一个替换字符与所述待识别字符的相似度,从所述至少一个替换字符中确定目标字符之前,所述方法还包括:对所述至少一个替换字符进行特征提取,得到所述至少一个替换字符的特征向量;对所述待识别字符进行特征提取,得到所述待识别字符的特征向量;根据所述至少一个替换字符的特征向量和所述待识别字符的特征向量之间的相似度,确定所述至少一个替换字符与所述待识别字符的相似度。8.根据权利要求1

4中任一项所述的方法,其特征在于,所述基于光学字符识别OCR模型,对待识别图像进行字符识别,包括:采用所述OCR模型中的特征提取分支,对所述待识别图像进行特征提取,以得到第一特征图;采用所述OCR模型中的融合分支,将所述第一特征图与位置图进行融合,以得到第二特征图,其中,所述位置图中各元素与所述第一特征图中各元素一一对应,所述位置图中的元素,用于指示所述第一特征图中对应元素在所述待识别图像中的坐标;采用所述OCR模型中的特征变换分支,将所述第二特征图进行特征变换,得到第三特征图;采用所述OCR模型中的预测分支,对所述第三特征图进行解码,以得到所述预测文本和所述预测文本中各所述预测字符对应的置信度。9.根据权利要求8所述的方法,其特征在于,所述采用所述OCR模型中的特征提取分支,对所述待识别图像进行特征提取,以得到第一特征图之前,所述方法还包括:对所述待识别图像进行角度预测,确定所述待识别图像的倾斜角度;根据所述倾斜角度,对所述待识别图像进行旋转处理。10.根据权利要求1

4中任一项所述的方法,其特征在于,所述根据各所述预测字符的置信度,从各所述预测字符中确定待处理字符,包括:将置信度高于置信度阈值的预测字符,作为所述待处理字符;或者,将置信度最大的预测字符,作为所述待处理字符;或者,将各所述预测字符按照置信度的取值由大至小排序,选取排序在前的目标个数的预测字符,作为所述待处理字符,其中,所述目标个数的取值与所述预测文本的长度正相关。1...

【专利技术属性】
技术研发人员:王建周
申请(专利权)人:来也科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1