System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 识别结果的校准方法、装置、存储介质及电子装置制造方法及图纸_技高网

识别结果的校准方法、装置、存储介质及电子装置制造方法及图纸

技术编号:40554482 阅读:10 留言:0更新日期:2024-03-05 19:14
本发明专利技术实施例提供了一种识别结果的校准方法、装置、存储介质及电子装置,其中,该方法包括:获取对目标报表进行识别所得到的目标识别结果,其中,目标识别结果包括文字识别结果、数字识别结果,以及目标报表的报表类型;基于报表类型确定校准词库;基于文字识别结果中包括的每个待校准词组的第一拼写元素从校准词库中确定候选词组;基于每个待校准词组的第二拼写元素从候选词组中确定出每个待校准词组的目标校准词组;对数字识别结果中包括的每个数字进行校准,得到目标校准数字;基于目标校准词组以及目标校准数字校准目标识别结果。通过本发明专利技术,解决了相关技术中存在的校准报表的识别结果效率低的问题,达到提高校准报表的识别结果效率的效果。

【技术实现步骤摘要】

本专利技术实施例涉及自然语言处理领域,具体而言,涉及一种识别结果的校准方法、装置、存储介质及电子装置


技术介绍

1、企业的财务报表数据是企业经营状况的重要体现,是相关部门掌握不同地区不同行业经济发展情况的重要依据,因此,在对财务报表数据进行电子化录入的过程中,对财务报表数据的正确识别显得十分重要。在相关技术中,财务报表的电子化识别通常采用以下两种方法:

2、(1)大量人工对财报数据进行摘录;

3、(2)采用ocr识别技术对财报数据进行识别;

4、随着经济的快速发展,财报数据量显著增加,为其电子化工作带来了很多挑战。由于人工录入效率低下,且准确率难以控制,目前ocr识别技术得到更广泛使用。财务报表对数据的准确性要求极高,受限于算法准确率,仍需要额外的人工进行数据校对复核,依然会产生大量的人工消耗。

5、由此可知,相关技术中存在校准报表的识别结果效率低的问题。

6、针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。


技术实现思路

1、本专利技术实施例提供了一种识别结果的校准方法、装置、存储介质及电子装置,以至少解决相关技术中存在的校准报表的识别结果效率低的问题。

2、根据本专利技术的一个实施例,提供了一种识别结果的校准方法,包括:获取对目标报表进行识别所得到的目标识别结果,其中,所述目标识别结果包括文字识别结果、数字识别结果,以及所述目标报表的报表类型;基于所述报表类型确定校准词库;基于所述文字识别结果中包括的每个待校准词组的第一拼写元素从所述校准词库中确定候选词组;基于每个所述待校准词组的第二拼写元素从所述候选词组中确定出每个所述待校准词组的目标校准词组;对所述数字识别结果中包括的每个数字进行校准,得到目标校准数字;基于所述目标校准词组以及所述目标校准数字校准所述目标识别结果。

3、根据本专利技术的另一个实施例,提供了一种识别结果的校准装置,包括:获取模块,用于获取对目标报表进行识别所得到的目标识别结果,其中,所述目标识别结果包括文字识别结果、数字识别结果,以及所述目标报表的报表类型;第一确定模块,用于基于所述报表类型确定校准词库;第二确定模块,用于基于所述文字识别结果中包括的每个待校准词组的第一拼写元素从所述校准词库中确定候选词组;第三确定模块,用于基于每个所述待校准词组的第二拼写元素从所述候选词组中确定出每个所述待校准词组的目标校准词组;第一校准模块,用于对所述数字识别结果中包括的每个数字进行校准,得到目标校准数字;第二校准模块,用于基于所述目标校准词组以及所述目标校准数字校准所述目标识别结果。

4、根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

5、根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

6、通过本专利技术,获取对目标报表进行识别所得到的目标识别结果;基于根据目标识别结果中包括的报表类型确定校准词库;根据目标识别结果中的文字识别结果中包括的每个待校准词组的第一拼写元素从校准词库中确定候选词组;根据每个待校准词组的第二拼写元素从候选词组中确定出每个待校准词组的目标校准词组;对目标识别结果中的数字识别结果中包括的每个数字进行校准,得到目标校准数字;根据目标校准词组以及目标校准数字校准目标识别结果。由于在对目标识别结果进行校准时,可以根据待校准词组的第一拼写元素确定出候选词组,根据第二拼写元素从候选词组中确定出目标校准词组,并对数字识别结果进行校准,得到目标校准数字,根据目标校准词组以及目标校准数据校准目标识别结果,实现了对目标识别结果的自动校准。因此,可以解决相关技术中存在的校准报表的识别结果效率低的问题,达到提高校准报表的识别结果效率的效果。

本文档来自技高网...

【技术保护点】

1.一种识别结果的校准方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于所述文字识别结果中包括的每个待校准词组的第一拼写元素从所述校准词库中确定候选词组包括:

3.根据权利要求2所述的方法,其特征在于,在确定所述校准词库中包括的与所述第一拼写元素的拼写相似度大于或等于第一阈值的第二词组之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,在确定所述校准词库中包括的与所述第一拼写元素的编辑距离小于或等于缩放距离的第三词组之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,基于所述第一长度以及缩放系数确定所述缩放距离包括:

6.根据权利要求1所述的方法,其特征在于,基于每个所述待校准词组的第二拼写元素从所述候选词组中确定出每个所述待校准词组的目标校准词组包括:

7.根据权利要求6所述的方法,其特征在于,基于所述第二数量、所述第三数量、所述第四数量以及所述第五数量确定所述目标校准词组包括:

8.根据权利要求1所述的方法,其特征在于,对所述数字识别结果中包括的每个数字进行校准,得到目标校准数字包括:

9.一种识别结果的校准装置,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。

11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。

...

【技术特征摘要】

1.一种识别结果的校准方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于所述文字识别结果中包括的每个待校准词组的第一拼写元素从所述校准词库中确定候选词组包括:

3.根据权利要求2所述的方法,其特征在于,在确定所述校准词库中包括的与所述第一拼写元素的拼写相似度大于或等于第一阈值的第二词组之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,在确定所述校准词库中包括的与所述第一拼写元素的编辑距离小于或等于缩放距离的第三词组之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,基于所述第一长度以及缩放系数确定所述缩放距离包括:

6.根据权利要求1所述的方法,其特征在于,基于每个所述待校准词组的第二拼写元素从所述候选词...

【专利技术属性】
技术研发人员:王雨竹
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1