信息识别方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:40641738 阅读:17 留言:0更新日期:2024-03-13 21:23
本申请实施例提供了一种信息识别方法、装置、电子设备及计算机存储介质,其中,信息识别方法包括:获取至少包含目标数据格式的目标文本信息的目标图像,对目标图像进行文本信息识别,得到第一文本信息;根据预设的目标过滤算法对第一文本信息进行过滤,得到第二文本信息;基于第二文本信息,从预设的多个字符纠正方式中,确定第二文本信息对应的目标字符纠正方式;基于目标字符纠正方式对第二文本信息中的字符进行纠正,得到目标文本信息。通过对第一文本信息进行过滤,可以剔除文本信息识别结果中存在的干扰信息,再通过对第二文本信息进行字符纠正,可以进一步纠正错误信息,从而提高了识别目标文本信息的正确率,以满足用户需求。

【技术实现步骤摘要】

本申请实施例涉及数据处理,尤其涉及一种信息识别方法、装置、电子设备及计算机存储介质


技术介绍

1、在现代数字化应用中,通常需要对纸质发票或电子发票进行文本识别处理,以提取纸质发票或电子发票中的目标文本信息,例如,目标文本信息可以为发票号码、发票代码等信息。现有技术中,通常使用ocr(optical character recognition,光学字符识别)技术对纸质发票或电子发票进行文本识别处理,但识别结果存在干扰信息和错误信息,导致识别得到的目标文本信息的正确率较低,难以满足用户需求。


技术实现思路

1、有鉴于此,本申请实施例提供一种信息识别方法、装置、电子设备及计算机存储介质,以至少部分解决上述问题。

2、根据本申请实施例的第一方面,提供了一种信息识别方法,包括:获取至少包含目标数据格式的目标文本信息的目标图像,对目标图像进行文本信息识别,得到第一文本信息;根据预设的目标过滤算法对第一文本信息进行过滤,得到第二文本信息,目标过滤算法用于获取第一文本信息中符合目标数据格式的文本信息;基于第二文本文档来自技高网...

【技术保护点】

1.一种信息识别方法,其特征在于,包括:

2.根据权利要求1所述的信息识别方法,其特征在于,所述目标数据格式包括多个,所述预设的目标过滤算法包括与多个所述目标数据格式对应的多个目标过滤算法,所述根据预设的目标过滤算法对所述第一文本信息进行过滤,得到第二文本信息,包括:

3.根据权利要求1或2所述的信息识别方法,其特征在于,所述基于所述第二文本信息,从预设的多个字符纠正方式中,确定目标字符纠正方式,包括:

4.根据权利要求3所述的信息识别方法,其特征在于,若第一字符纠正方式为目标字符纠正方式,所述基于所述目标字符纠正方式对所述第二文本信息中的字符进行纠正...

【技术特征摘要】

1.一种信息识别方法,其特征在于,包括:

2.根据权利要求1所述的信息识别方法,其特征在于,所述目标数据格式包括多个,所述预设的目标过滤算法包括与多个所述目标数据格式对应的多个目标过滤算法,所述根据预设的目标过滤算法对所述第一文本信息进行过滤,得到第二文本信息,包括:

3.根据权利要求1或2所述的信息识别方法,其特征在于,所述基于所述第二文本信息,从预设的多个字符纠正方式中,确定目标字符纠正方式,包括:

4.根据权利要求3所述的信息识别方法,其特征在于,若第一字符纠正方式为目标字符纠正方式,所述基于所述目标字符纠正方式对所述第二文本信息中的字符进行纠正,得到所述目标文本信息,包括:

5.根据权利要求3所述的信息识别方法,其特征在于,所述...

【专利技术属性】
技术研发人员:赵成军刘绪锋刘鹏鲁龙刘杰赵哿滢樊伟
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1