【技术实现步骤摘要】
一种票据识别方法及装置
本专利技术涉及自动化办公领域,具体涉及一种票据识别方法及装置。
技术介绍
随着移动互联网技术的发展,办公智能化正在被广泛应用,其中,票据涉及到社会生活的各个领域,对于票据的智能识别和处理已成为目前研究的重点。在现有技术中,通常是利用光学字符识别(OpticalCharacterRecognition,简称:OCR)技术,对待处理票据对应的票据图像中的文字信息进行提取,并根据预设的票据识别框架,确定各文字信息对应的票据位置,对已获得的文字信息进行分类。但是,由于一些大型银行经营范围较广,在办理业务过程中,会产生种类繁多的票据。票据种类存在多样化,现有技术中的票据识别方法的适应性较差,无法灵活应用于各种类型的票据。因此,急需一种能够满足多种应用场景的票据识别方法,对提高票据识别效率具有重要意义。
技术实现思路
因此,本专利技术要解决的技术问题在于现有技术中的票据识别方法存在适应性较差的缺陷,从而提供一种票据识别方法及装置。本申请第一个方面提供一种票据识别方法,包 ...
【技术保护点】
1.一种票据识别方法,其特征在于,包括:/n获取待处理图像;其中,所述待处理图像中包括票据图像,所述票据图像中包括多个票据元素;/n根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果;其中,所述识别结果包括所述第一票据元素对应的元素类型、语义信息和位置特征;/n根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域;/n根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果;/n根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结 ...
【技术特征摘要】
1.一种票据识别方法,其特征在于,包括:
获取待处理图像;其中,所述待处理图像中包括票据图像,所述票据图像中包括多个票据元素;
根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果;其中,所述识别结果包括所述第一票据元素对应的元素类型、语义信息和位置特征;
根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域;
根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果;
根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果,生成票据识别结果。
2.根据权利要求1所述的票据识别方法,其特征在于,所述根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果,包括:
计算所述字符识别信息中的各字段与所述票据元素样本集合中各样本的相似度,根据所述相似度从大到小的排序结果,确定第一目标样本和所述第一目标样本对应的第一票据元素;
根据所述第一目标样本对应的元素类型,确定所述第一票据元素的元素类型;
根据所述第一目标样本对应的位置特征,确定所述第一票据元素的位置特征;
根据所述字符识别信息,确定所述第一票据元素的语义信息。
3.根据权利要求2所述的票据识别方法,其特征在于,所述根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域,包括:
在所述票据元素样本集合中,确定至少一个与所述第一目标样本存在位置关联关系的第二目标样本;根据所述第二目标样本对应的位置特征,确定所述第二票据元素对应的目标区域。
4.根据权利要求3所述的票据识别方法,其特征在于,所述根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果,包括:
在所述字符识别信息中提取与所述目标区域的位置对应的字段,以确定所述第二票据元素的语义信息;
根据所述第二目标样本对应的元素类型,确定所述第二票据元素的元素类型;
根据所述第二目标样本对应的位置特征,确定所述第二票据元素的位置特征。
5.根据权利要求1所述的票据识别方法,其特征在...
【专利技术属性】
技术研发人员:邓练兵,宋宇轩,方文佳,
申请(专利权)人:珠海大横琴科技发展有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。