【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种识别背景信息的方法及系统。
技术介绍
1、在现有技术中,传统的文字识别技术仅局限于识别文字,一方面容易出现误识或漏识别的问题,另一方面无法有效的区分前景信息和背景信息,不利于获取有效的字段信息。
技术实现思路
1、本专利技术的目的在于基于待识别的票据或证件都包含的信息识别票据或证件的背景信息。由于票据或证件的背景信息都是固定不变且词汇量有限的,识别较为简单。通过去除背景信息,有利于获取完整的前景信息(例如,姓名、地址)。
2、第一方面,本专利技术披露了一种识别背景信息的方法,其特征在于,所述方法包括:获取待识别的图像,所述待识别的图像中包括至少一条字符串;获取所述待识别的图像对应的背景字典;所述背景字典包括固定信息;确定所述至少一条字符串与所述背景字典中所述固定信息的编辑距离,一条所述字符串与一条所述固定信息对应一个所述编辑距离;所述编辑距离为将一条所述字符串转换为所述背景字典中的一条所述固定信息所需的最少的编辑操作的次数;基于所述编辑距离识
...【技术保护点】
1.一种识别背景信息的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
4.根据权利要求1所述的方法,其特征在于,所述背景字典包括银行背景字典、医院背景字典、身份证背景字典和驾驶证背景字典。
5.根据权利要求1所述的方法,其特征在于,所述基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息还包括:
6.一种识别背景信息的系统,其特
...【技术特征摘要】
1.一种识别背景信息的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述待识别的图像的类型与银行票据、医院票据、身份证或驾驶证相关。
4.根据权利要求1所述的方法,其特征在于,所述背景字典包括银行背景字典、医院背景字典、身份证背景字典和驾驶证背景字典。
5.根据权利要求1所述的方法,其特征在于,所述基于所述编辑距离识别所述待识别的图像中的背景信息,所述背景信息为所述待识别的图像的固定信息还包括:
【专利技术属性】
技术研发人员:苟巍,沈海峰,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。