System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种识别背景信息的方法及系统。
技术介绍
1、在现有技术中,传统的文字识别技术仅局限于识别文字,一方面容易出现误识或漏识别的问题,另一方面无法有效的区分前景信息和背景信息,不利于获取有效的字段信息。
技术实现思路
1、本专利技术的目的在于基于待识别的票据或证件都包含的信息识别票据或证件的背景信息。由于票据或证件的背景信息都是固定不变且词汇量有限的,识别较为简单。通过去除背景信息,有利于获取完整的前景信息(例如,姓名、地址)。
2、第一方面,本专利技术披露了一种识别背景信息的方法,其特征在于,所述方法包括:获取待识别的图像,所述待识别的图像中包括至少一条字符串;获取所述待识别的图像对应的背景字典;所述背景字典包括固定信息;确定所述至少一条字符串与所述背景字典中所述固定信息的编辑距离,一条所述字符串与一条所述固定信息对应一个所述编辑距离;所述编辑距离为将一条所述字符串转换为所述背景字典中的一条所述固定信息所需的最少的编辑操作的次数;基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息。
3、在一些实施例中,所述方法还包括:基于所述背景信息,分离所述待识别的图像中的前景信息,所述前景信息为所述待识别的图像的用户信息。
4、在一些实施例中,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
5、在一些实施例中,所述背景字典包括银行背景字典、医院背景字典、身份证
6、在一些实施例中,所述基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息还包括:基于所述编辑距离确定所述至少一条字符串的第一距离,所述第一距离是一条所述字符串的所有编辑距离中的最小值;一条所述字符串对应一个所述第一距离;当所述第一距离小于第一预设阈值时,判断与所述第一距离对应的所述字符串是所述背景信息。
7、第二方面,本专利技术披露了一种识别背景信息的系统,其特征在于,所述系统包括:获取模块、背景信息识别模块和编辑距离计算模块;所述获取模块,包括第一获取单元和第二获取单元;所述第一获取单元被配置为获取待识别的图像,所述待识别的图像中包括至少一条字符串;所述第二获取单元被配置为获取所述待识别的图像对应的背景字典,所述背景字典包括固定信息;所述编辑距离计算模块被配置为确定所述至少一条字符串与所述背景字典中所述固定信息的编辑距离,一条所述字符串与一条所述固定信息对应一个所述编辑距离;所述编辑距离为将一条字符串转换为所述背景字典中的一条固定信息所需的最少的编辑操作的次数;所述背景信息识别模块被配置为基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息。
8、在一些实施例中,所述系统还被配置为:基于所述背景信息,分离所述待识别的图像中的前景信息,所述前景信息为所述待识别的图像的用户信息。
9、在一些实施例中,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
10、在一些实施例中,所述背景字典包括银行背景字典、医院背景字典、身份证背景字典和驾驶证背景字典。
11、在一些实施例中,所述背景信息识别模块进一步被配置为:基于所述编辑距离确定所述至少一条字符串的第一距离,所述第一距离是一条所述字符串的所有编辑距离中的最小值;一条所述字符串对应一个所述第一距离;当所述第一距离小于第一预设阈值时,判断与所述第一距离对应的所述字符串是所述背景信息。
本文档来自技高网...【技术保护点】
1.一种识别背景信息的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
4.根据权利要求1所述的方法,其特征在于,所述背景字典包括银行背景字典、医院背景字典、身份证背景字典和驾驶证背景字典。
5.根据权利要求1所述的方法,其特征在于,所述基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息还包括:
6.一种识别背景信息的系统,其特征在于,所述系统包括:获取模块、背景信息识别模块和编辑距离计算模块;
7.根据权利要求6所述的系统,其特征在于,所述系统还被配置为:
8.根据权利要求6所述的系统,其特征在于,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
9.根据权利要求6所述的系统,其特征在于,所述背景字典包括银行背景字典、医院背景字典、身份证背景字典和驾驶证背景字典。
10.根据
...【技术特征摘要】
1.一种识别背景信息的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
4.根据权利要求1所述的方法,其特征在于,所述背景字典包括银行背景字典、医院背景字典、身份证背景字典和驾驶证背景字典。
5.根据权利要求1所述的方法,其特征在于,所述基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息还包括:
【专利技术属性】
技术研发人员:苟巍,沈海峰,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。