票据要素提取方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:26304877 阅读:24 留言:0更新日期:2020-11-10 20:01
本申请提供了一种票据要素提取方法、装置、电子设备及可读存储介质,应用于图像处理技术领域,其中该方法包括:对票据图像进行图像识别确定待识别文本区域,以及通过自然语言理解技术对待识别文本区域的的文本信息进行分类处理,确定目标票据的类型,继而基于目标票据的类型从待识别区域对应的文本信息中提取得到目标票据的要素信息。从而实现了票据要素信息的自动化提取,提升了票据要素提取的效率。

【技术实现步骤摘要】
票据要素提取方法、装置、电子设备及可读存储介质
本申请涉及图像识别
,具体而言,本申请涉及一种票据要素提取方法、装置、电子设备及可读存储介质。
技术介绍
随着互联网的发展,电子化办公成为一种趋势。企业业务人员办理业务过程中涉及票据的传输、管理时,往往将纸质票据转为票据图像进行传输或管理,如通过邮件进行票据图像的传输、将票据图像进行归类保存。当需要利用票据的相关要素时,往往是通过人工阅读的方式去提取票据真的相关要素,而人工阅读提取票据要素的方式存在效率低下的问题,因此,如何快速提取相关票据的要素成为了一个问题。
技术实现思路
本申请提供了一种票据要素提取方法、装置、电子设备及可读存储介质,用于实现票据要素信息的自动化提取,提升了票据要素提取的效率,本申请采用的技术方案如下:第一方面,提供了一种票据要素提取方法,该方法包括,识别确定目标票据的图像的至少一个待识别文本区域信息;对各个待识别区域对应的图像进行图像识别,确定各个待识别区域对应的文本信息;基于确定的各个待识别区域对应的文本信息通过自本文档来自技高网...

【技术保护点】
1.一种票据要素提取方法,其特征在于,包括:/n识别确定目标票据的图像的至少一个待识别文本区域信息;/n对各个待识别区域对应的图像进行图像识别,确定各个待识别区域对应的文本信息;/n基于确定的各个待识别区域对应的文本信息通过自然语言理解技术确定所述目标票据的类型;/n基于确定的所述目标票据的类型与各个待识别区域对应的文本信息提取目标票据的票据要素。/n

【技术特征摘要】
1.一种票据要素提取方法,其特征在于,包括:
识别确定目标票据的图像的至少一个待识别文本区域信息;
对各个待识别区域对应的图像进行图像识别,确定各个待识别区域对应的文本信息;
基于确定的各个待识别区域对应的文本信息通过自然语言理解技术确定所述目标票据的类型;
基于确定的所述目标票据的类型与各个待识别区域对应的文本信息提取目标票据的票据要素。


2.根据权利要求1所述的方法,其特征在于,所述识别确定目标票据图像的至少一个待识别文本区域信息包括:
基于预训练的目标检测模型识别确定目标票据图像的至少一个待识别文本区域信息;
所述预训练的目标检测模型为基于以下算法的任一种:YOLO、SSD、RetinaNet、FastRCNN、FasterRCNN、MaskRCNN。


3.根据权利要求1所述的方法,其特征在于,所述对各个待识别区域对应的图像进行图像识别,确定各个待识别区域对应的文本信息,包括:
通过预训练的基于CRNN与CTC算法的文字识别模型对各个待识别区域对应的图像进行图像识别,确定各个待识别区域对应的文本信息。


4.根据权利要求1所述的方法,其特征在于,所述基于确定的所述目标票据的类型与各个待识别区域对应的文本信息提取目标票据的票据要素,包括:
基于确定的所述目标票据的类型确定所述类型对应的票据元素关键字;
基于确定的所述票据元素关键字从各个待识别区域对应的文本信息提取目标票据的票据要素。


5.根据权利要求1所述的方法,其特征在于,所述票据要素包括以下至少一种:收款账号信息、金额信息、收款人信息、付款账号...

【专利技术属性】
技术研发人员:徐国功
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1