【技术实现步骤摘要】
发票信息的识别方法、装置、电子设备及存储介质
本公开实施例涉及图像识别领域,尤其涉及一种发票信息的识别方法、装置、电子设备及存储介质。
技术介绍
随着深度学习算法尤其是卷积神经网络的发展,通过利用计算机自动识别报销单上所贴发票,然后自动录入到数据库成为可能,通过该技术可以极大的提高财务工作的效率。现有技术中,其技术实现可分为三步,第一步,从图片中切割出单张的发票,第二布,采用OCR技术对单张发票进行识别,第三布,采用文本结构化的技术将OCR识别的结果进行输出。但是,由于各种票据之间在图像特征上可能存在相似性过大,因此,在技术是线上需要利用人工以指定待选框的大小,这就降低了识别效率,提高了人工成本。
技术实现思路
针对上述问题,本公开提供了一种发票信息的识别方法、装置、电子设备及存储介质。第一方面,本公开提供了一种发票信息的识别方法,包括:对待处理发票的图像信息进行预处理,获得发票数据;将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域;将所 ...
【技术保护点】
1.一种发票信息的识别方法,其特征在于,包括:/n对待处理发票的图像信息进行预处理,获得发票数据;/n将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域;/n将所述待识别发票区域的图像输入至OCR识别模型,以使确定所述待识别发票区域中是否包括有预设字段,若是,则所述第一识别结果为第一类型发票,若否,则所述第一识别结果为非第一类型发票;/n将所述待识别发票区域的图像输入至训练完毕的发票类型识别模型,以对所述待处理的发票类型进行识别获得所述待处理发票属于各发票类型的第一概率,将根据各第一概率确定的所述待处理发票的发票类型作为所述第二识别结果;/ ...
【技术特征摘要】 【专利技术属性】
1.一种发票信息的识别方法,其特征在于,包括:
对待处理发票的图像信息进行预处理,获得发票数据;
将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域;
将所述待识别发票区域的图像输入至OCR识别模型,以使确定所述待识别发票区域中是否包括有预设字段,若是,则所述第一识别结果为第一类型发票,若否,则所述第一识别结果为非第一类型发票;
将所述待识别发票区域的图像输入至训练完毕的发票类型识别模型,以对所述待处理的发票类型进行识别获得所述待处理发票属于各发票类型的第一概率,将根据各第一概率确定的所述待处理发票的发票类型作为所述第二识别结果;
根据第一识别结果和第二识别结果确定所述待处理发票的识别结果。
2.根据权利要求1所述的识别方法,其特征在于,所述训练完毕的发票位置识别模型包括:依次连接的多个卷积池化层;
所述将所述发票数据输入训练完毕的发票位置识别模型,输出所述发票图像信息中的待识别发票区域,包括:
将所述发票数据输入训练完毕的发票位置识别模型,以使所述发票数据依次通过所述训练完毕的发票位置识别模型中的各卷积池化层并输出待识别发票区域在所述待处理发票的图像信息中的角点坐标,以及所述发票区域的置信度;其中,所述发票区域的置信度用于表示所述角点坐标的可信程度。
3.根据权利要求1所述的识别方法,其特征在于,所述确定所述待识别发票区域中是否包括有预设字段之前,包括:
根据所述待识别发票区域对所述图像信息进行图像分割,获得所述待识别发票区域对应的图像。
4.根据权利要求1所述的识别方法,其特征在于,所述根据第一识别结果和第二识别结果确定所述待处理发票的识别结果,包括:
当所述第一识别结果为第一类型发票时,所述待处理发票的识别结果为第一类型发票;
当所述第一识别结果为非第一类型发票时,则根据第一识别结果和第二识别结果确定所述待处理发票的识别结果。
5.根据权利要求1所述的识别方法,其特征在于,当确定所述待识别发票区域中不包括有预设字段时,所述识别方法还包括:
技术研发人员:张秋晖,刘岩,韩森尧,朱兴杰,
申请(专利权)人:泰康保险集团股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。