System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息识别方法、装置、电子设备及计算机存储介质制造方法及图纸_技高网

信息识别方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:40641738 阅读:6 留言:0更新日期:2024-03-13 21:23
本申请实施例提供了一种信息识别方法、装置、电子设备及计算机存储介质,其中,信息识别方法包括:获取至少包含目标数据格式的目标文本信息的目标图像,对目标图像进行文本信息识别,得到第一文本信息;根据预设的目标过滤算法对第一文本信息进行过滤,得到第二文本信息;基于第二文本信息,从预设的多个字符纠正方式中,确定第二文本信息对应的目标字符纠正方式;基于目标字符纠正方式对第二文本信息中的字符进行纠正,得到目标文本信息。通过对第一文本信息进行过滤,可以剔除文本信息识别结果中存在的干扰信息,再通过对第二文本信息进行字符纠正,可以进一步纠正错误信息,从而提高了识别目标文本信息的正确率,以满足用户需求。

【技术实现步骤摘要】

本申请实施例涉及数据处理,尤其涉及一种信息识别方法、装置、电子设备及计算机存储介质


技术介绍

1、在现代数字化应用中,通常需要对纸质发票或电子发票进行文本识别处理,以提取纸质发票或电子发票中的目标文本信息,例如,目标文本信息可以为发票号码、发票代码等信息。现有技术中,通常使用ocr(optical character recognition,光学字符识别)技术对纸质发票或电子发票进行文本识别处理,但识别结果存在干扰信息和错误信息,导致识别得到的目标文本信息的正确率较低,难以满足用户需求。


技术实现思路

1、有鉴于此,本申请实施例提供一种信息识别方法、装置、电子设备及计算机存储介质,以至少部分解决上述问题。

2、根据本申请实施例的第一方面,提供了一种信息识别方法,包括:获取至少包含目标数据格式的目标文本信息的目标图像,对目标图像进行文本信息识别,得到第一文本信息;根据预设的目标过滤算法对第一文本信息进行过滤,得到第二文本信息,目标过滤算法用于获取第一文本信息中符合目标数据格式的文本信息;基于第二文本信息,从预设的多个字符纠正方式中,确定第二文本信息对应的目标字符纠正方式;基于目标字符纠正方式对第二文本信息中的字符进行纠正,得到目标文本信息。

3、根据本申请实施例的第二方面,提供了一种信息识别装置,包括图像获取模块、过滤模块、第一纠正模块和第二纠正模块。其中,图像获取模块用于获取至少包含目标数据格式的目标文本信息的目标图像,对目标图像进行文本信息识别,得到第一文本信息;过滤模块用于根据预设的目标过滤算法对第一文本信息进行过滤,得到第二文本信息,目标过滤算法用于获取第一文本信息中符合目标数据格式的文本信息;第一纠正模块用于基于第二文本信息,从预设的多个字符纠正方式中,确定第二文本信息对应的目标字符纠正方式;第二纠正模块用于基于目标字符纠正方式对第二文本信息中的字符进行纠正,得到目标文本信息。

4、根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行如第一方面的方法对应的操作。

5、根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面的方法。

6、根据本申请实施例提供的信息识别方法、装置、电子设备及计算机存储介质,其中,信息识别方法包括:获取至少包含目标数据格式的目标文本信息的目标图像,对目标图像进行文本信息识别,得到第一文本信息;根据预设的目标过滤算法对第一文本信息进行过滤,得到第二文本信息,目标过滤算法用于获取第一文本信息中符合目标数据格式的文本信息;基于第二文本信息,从预设的多个字符纠正方式中,确定第二文本信息对应的目标字符纠正方式;基于目标字符纠正方式对第二文本信息中的字符进行纠正,得到目标文本信息。通过对第一文本信息进行过滤,可以剔除文本信息识别结果中存在的干扰信息,再通过对第二文本信息进行字符纠正,可以进一步纠正错误信息,从而提高了识别目标文本信息的正确率,以满足用户需求。

本文档来自技高网...

【技术保护点】

1.一种信息识别方法,其特征在于,包括:

2.根据权利要求1所述的信息识别方法,其特征在于,所述目标数据格式包括多个,所述预设的目标过滤算法包括与多个所述目标数据格式对应的多个目标过滤算法,所述根据预设的目标过滤算法对所述第一文本信息进行过滤,得到第二文本信息,包括:

3.根据权利要求1或2所述的信息识别方法,其特征在于,所述基于所述第二文本信息,从预设的多个字符纠正方式中,确定目标字符纠正方式,包括:

4.根据权利要求3所述的信息识别方法,其特征在于,若第一字符纠正方式为目标字符纠正方式,所述基于所述目标字符纠正方式对所述第二文本信息中的字符进行纠正,得到所述目标文本信息,包括:

5.根据权利要求3所述的信息识别方法,其特征在于,所述字符对照表中包括多个待纠正字符和目标字符之间的映射关系,所述根据预设的字符对照表,对所述待纠正字符串中的字符进行纠正,得到所述目标文本信息,包括:

6.根据权利要求1所述的信息识别方法,其特征在于,所述获取至少包含目标数据格式的目标文本信息的目标图像,包括:

7.根据权利要求6所述的信息识别方法,其特征在于,所述方法还包括:

8.一种信息识别装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。

...

【技术特征摘要】

1.一种信息识别方法,其特征在于,包括:

2.根据权利要求1所述的信息识别方法,其特征在于,所述目标数据格式包括多个,所述预设的目标过滤算法包括与多个所述目标数据格式对应的多个目标过滤算法,所述根据预设的目标过滤算法对所述第一文本信息进行过滤,得到第二文本信息,包括:

3.根据权利要求1或2所述的信息识别方法,其特征在于,所述基于所述第二文本信息,从预设的多个字符纠正方式中,确定目标字符纠正方式,包括:

4.根据权利要求3所述的信息识别方法,其特征在于,若第一字符纠正方式为目标字符纠正方式,所述基于所述目标字符纠正方式对所述第二文本信息中的字符进行纠正,得到所述目标文本信息,包括:

5.根据权利要求3所述的信息识别方法,其特征在于,所述...

【专利技术属性】
技术研发人员:赵成军刘绪锋刘鹏鲁龙刘杰赵哿滢樊伟
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1