票据识别结果校验方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39272330 阅读:6 留言:0更新日期:2023-11-07 10:51
本申请关于一种票据识别结果校验方法、装置、设备及存储介质,涉及图像信息数字化技术领域。该方法包括:获取图像识别结果;该图像识别结果包括通过图像识别模型对票据进行图像识别后得到的信息;基于预设的准确性校验规则对图像识别结果进行识别准确性校验,得到准确性校验结果;该准确性校验结果用于指示图像识别结果通过准确性校验规则的校验或图像识别结果未通过准确性校验规则的校验;基于准确性校验结果确定图像识别结果的校验置信度。通过上述方法,可以自动对该图像识别结果的准确性进行校验并给出该图像识别结果的准确度的参考,减少了人工进行图像识别结果的准确性判定的过程,提高了对图像识别结果的准确性的校验效率和准确度。效率和准确度。效率和准确度。

【技术实现步骤摘要】
票据识别结果校验方法、装置、计算机设备及存储介质


[0001]本申请实施例涉及图像信息数字化
,特别涉及一种票据识别结果校验方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展,OCR(Optical Character Recognition,光学字符识别)技术被应用在各个领域中。其中,在需要进行票据核查的场景中,可以通过OCR技术对上传的票据图像进行识别,以获取票据图像中的相关信息。
[0003]在相关技术中,通常通过对OCR技术对应的OCR模型进行大量的训练,来提高OCR模型的识别精度,将OCR模型的识别结果对应的识别置信度确定为识别结果的置信度。
[0004]然而,由于OCR模型的训练方式或训练样本数量的不同,OCR模型的识别能力参差不齐,从而影响OCR模型提供的识别置信度的可信度,进而影响对OCR模型输出的识别结果的可信度,需要人工进一步对OCR模型的识别结果进行可信度判断,且由于票据信息较为复杂,使得人工进行识别结果判断的准确性和效率较低。

技术实现思路

[0005]本申请实施例提供了一种票据识别结果校验方法、装置、计算机设备及存储介质,可以自动对图像识别结果的准确性进行校验并给出图像识别结果的准确度的参考,减少了人工进行图像识别结果的准确性判定的过程,提高了对图像识别结果的准确性的校验效率和准确度,该技术方案如下。
[0006]一方面,提供了一种票据识别结果校验方法,所述方法包括:
[0007]获取图像识别结果;所述图像识别结果包括通过图像识别模型对票据进行图像识别后得到的信息;
[0008]基于预设的准确性校验规则对所述图像识别结果进行识别准确性校验,得到准确性校验结果;所述准确性校验结果用于指示所述图像识别结果通过所述准确性校验规则的校验或所述图像识别结果未通过所述准确性校验规则的校验;
[0009]基于所述准确性校验结果确定所述图像识别结果的校验置信度。
[0010]另一方面,提供了一种票据识别结果校验装置,所述装置包括:
[0011]结果获取模块,用于获取图像识别结果;所述图像识别结果包括通过图像识别模型对票据进行图像识别后得到的信息;
[0012]校验模块,用于基于预设的准确性校验规则对所述图像识别结果进行识别准确性校验,得到准确性校验结果;所述准确性校验结果用于指示所述图像识别结果通过所述准确性校验规则的校验或所述图像识别结果未通过所述准确性校验规则的校验;
[0013]置信度确定模块,用于基于所述准确性校验结果确定所述图像识别结果的校验置信度。
[0014]在一种可能的实现方式中,所述图像识别结果包括至少两个票据字段,所述票据
字段包含数值信息以及文本信息;
[0015]所述准确性校验规则包括数值校验规则以及文本校验规则;所述数值校验规则指示票据中各个票据字段的数值信息之间的关联关系,所述文本校验规则用于指示标准化文本信息与票据字段的文本信息之间的对应关系。
[0016]在一种可能的实现方式中,所述校验模块,包括:
[0017]数值校验子模块,用于基于所述准确性校验规则中的所述数值校验规则对各个所述票据字段中的数值信息进行准确性校验;
[0018]文本校验子模块,用于基于所述准确性校验规则中的所述文本校验规则对各个所述票据字段中的文本信息进行准确性校验。
[0019]在一种可能的实现方式中,所述数值校验子模块,包括:
[0020]字段确定单元,用于基于所述数值校验规则确定各个所述票据字段中的验证字段以及计算字段组;所述计算字段组中包含至少两个所述票据字段;
[0021]数值计算单元,用于基于所述数值校验规则指示的票据中各个票据字段之间的关联关系对所述计算字段组中的各个数值信息进行计算,得到计算结果;
[0022]规则匹配单元,用于若所述计算结果与所述验证字段的数值信息相匹配,则确定各个所述票据字段中的数值信息通过所述数值校验规则的校验;若所述计算结果与所述验证字段的数值信息不匹配,则确定各个所述票据字段中的数值信息未通过所述数值校验规则的校验。
[0023]在一种可能的实现方式中,所述数值校验规则具有数值规则分值,所述文本校验规则具有文本规则分值;
[0024]所述置信度确定模块,用于,
[0025]获取所述图像识别模型输出的对应于各个所述票据字段的识别置信度;
[0026]基于各个数值信息对应于所述数值校验规则的数值规则分值以及各个文本信息对应于所述文本校验规则的文本规则分值,对各个所述票据字段的识别置信度进行调整,得到各个所述票据字段的校验置信度。
[0027]所述置信度确定模块,用于,
[0028]获取所述数值校验规则中包含的数值校验公式的数量,所述数值校验公式用于指示票据中各个票据字段的数值信息之间的关联关系;
[0029]在所述数值校验规则中包含的所述数值校验公式的数量大于数量阈值时,按照第一调整规则对各个字段的识别置信度进行调整,得到各个所述票据字段的校验置信度;所述第一调整规则规定有数值校验规则的第一数值规则分值以及文本校验规则的第一文本规则分值;
[0030]在所述数值校验规则中包含的所述数值校验公式的数量小于或等于所述数量阈值时,按照第二调整规则对各个字段的识别置信度进行调整,得到各个所述票据字段的校验置信度;所述第二调整规则规定有数值校验规则的第二数值规则分值以及文本校验规则的第二文本规则分值。
[0031]在一种可能的实现方式中,所述装置还包括:
[0032]标注模块,用于在确定所述图像识别结果中包含校验置信度小于目标置信度阈值的目标票据字段时,对所述图像识别结果中的所述票据字段以目标形式进行标注。
[0033]另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现上述的票据识别结果校验方法。
[0034]另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述的票据识别结果校验方法。
[0035]另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述各种可选实现方式中提供的票据识别结果校验方法。
[0036]本申请提供的技术方案可以包括以下有益效果:
[0037]本申请实施例提供的票据识别结果校验方法,在获取到图像识别模型对票据进行图像识别后的图像识别结果后,利用预设的准确性校验规则对图像识别结果进行准确性校验,并根据指示图像识别结果通过或未通过准确性校验规则校验的准确性校验结果来确定图像识别结果的校验置信度;通过上述方法,可以在获取到图像识别结果之后,自动对该图像识别结果的准确性进行校验并给出该图像识别结果的准确度的参考,减少了人工进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种票据识别结果校验方法,其特征在于,所述方法包括:获取图像识别结果;所述图像识别结果包括通过图像识别模型对票据进行图像识别后得到的信息;基于预设的准确性校验规则对所述图像识别结果进行识别准确性校验,得到准确性校验结果;所述准确性校验结果用于指示所述图像识别结果通过所述准确性校验规则的校验或所述图像识别结果未通过所述准确性校验规则的校验;基于所述准确性校验结果确定所述图像识别结果的校验置信度。2.根据权利要求1所述的方法,其特征在于,所述图像识别结果包括至少两个票据字段,所述票据字段包含数值信息以及文本信息;所述准确性校验规则包括数值校验规则以及文本校验规则;所述数值校验规则指示票据中各个票据字段的数值信息之间的关联关系,所述文本校验规则用于指示标准化文本信息与票据字段的文本信息之间的对应关系。3.根据权利要求2所述的方法,其特征在于,所述基于预设的准确性校验规则对所述图像识别结果进行准确性校验,包括:基于所述准确性校验规则中的所述数值校验规则对各个所述票据字段中的数值信息进行准确性校验;基于所述准确性校验规则中的所述文本校验规则对各个所述票据字段中的文本信息进行准确性校验。4.根据权利要求3所述的方法,其特征在于,所述基于所述准确性校验规则中的所述数值校验规则对所述图像识别结果中的数值信息进行准确性校验,包括:基于所述数值校验规则确定各个所述票据字段中的验证字段以及计算字段组;所述计算字段组中包含至少两个所述票据字段;基于所述数值校验规则指示的票据中各个票据字段之间的关联关系对所述计算字段组中的各个数值信息进行计算,得到计算结果;若所述计算结果与所述验证字段的数值信息相匹配,则确定各个所述票据字段中的数值信息通过所述数值校验规则的校验;若所述计算结果与所述验证字段的数值信息不匹配,则确定各个所述票据字段中的数值信息未通过所述数值校验规则的校验。5.根据权利要求3所述的方法,其特征在于,所述数值校验规则具有数值规则分值,所述文本校验规则具有文本规则分值;所述基于所述准确性校验结果确定所述图像识别结果的校验置信度,包括:获取所述图像识别模型输出的对应于各个所述票据字段的识别置信度;基于各个数值信息对应于所述数值校验规则的数值规则分值以及各个文本信息对应于所述文本校验规则的文本规则分值,对各个所述票...

【专利技术属性】
技术研发人员:张克运
申请(专利权)人:人保信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1