票据识别方法、装置及存储介质制造方法及图纸

技术编号:19178436 阅读:33 留言:0更新日期:2018-10-17 00:34
本发明专利技术提供一种票据识别方法:对输入的票据图片,先用智能识别算法对关键字段进行检测及识别,并得到关键字段的机器识别结果的置信度,将置信度低于阈值的关键字段发送至众包平台进行校验,通过众包平台将同一关键字段发送至多个用户进行校验,并获取多个用户对同一关键字段的校验结果,最后输出票据图片的识别结果。本发明专利技术还提供一种票据识别装置及存储介质。本发明专利技术能从而提高票据识别的准确率,从而快速建档。

Bill recognition method, device and storage medium

The invention provides a bill recognition method: for an input bill picture, the key section is detected and identified by an intelligent recognition algorithm, and the confidence of the machine recognition result of the key section is obtained. The key field whose confidence is lower than the threshold value is sent to the crowdsourcing platform for verification, and the same key is obtained through the crowdsourcing platform. Fields are sent to multiple users for checking, and the checking results of the same key field are obtained by multiple users. Finally, the recognition results of the ticket picture are output. The invention also provides a bill recognition device and a storage medium. The invention can improve the accuracy of the identification of bills, thereby rapidly establishing files.

【技术实现步骤摘要】
票据识别方法、装置及存储介质
本专利技术涉及人工智能领域,尤其涉及一种票据识别方法、设备及存储介质。
技术介绍
大型企业、机构、医院体检、保险行业等都有海量的票据需要进行信息的采集、录入以及电子化存档。目前我国的票据数字化管理程度还比较低,常采用的手动录入、人工建档的方式劳动强度大、效率低且成本开支大,而且容易出错。虽然目前能利用机器学习方法进行票据识别,但识别精度不高,这样就会造成票据多种信息的错误,无法快速建档,提高工作效率。
技术实现思路
鉴于以上内容,有必要提供一种票据识别方法、装置及存储介质,能提高票据识别的准确率,从而快速建档。一种票据识别方法,所述方法包括:识别设备获取待识别图片;所述识别设备从所述待识别图片中提取票据图片;所述识别设备从所述票据图片中检测至少一个文本位置;所述识别设备识别所述至少一个文本位置中每个文本位置处的关键字段,并得到每个文本位置处关键字段的机器识别结果及每个文本位置处关键字段的机器识别结果的置信度;所述识别设备根据每个文本位置处关键字段的机器识别结果的置信度,获取符合条件的第一类关键字段;所述识别设备将第一类关键字段中每个关键字段的图片发送至众包平本文档来自技高网...

【技术保护点】
1.一种票据识别方法,其特征在于,所述方法包括:识别设备获取待识别图片;所述识别设备从所述待识别图片中提取票据图片;所述识别设备从所述票据图片中检测至少一个文本位置;所述识别设备识别所述至少一个文本位置中每个文本位置处的关键字段,并得到每个文本位置处关键字段的机器识别结果及每个文本位置处关键字段的机器识别结果的置信度;所述识别设备根据每个文本位置处关键字段的机器识别结果的置信度,获取符合条件的第一类关键字段;所述识别设备将第一类关键字段中每个关键字段的图片发送至众包平台处理设备;所述众包平台处理设备将第一类关键字段中每个关键字段的图片发送至多个用户以使多个用户对第一类关键字段中同一关键字段的图...

【技术特征摘要】
1.一种票据识别方法,其特征在于,所述方法包括:识别设备获取待识别图片;所述识别设备从所述待识别图片中提取票据图片;所述识别设备从所述票据图片中检测至少一个文本位置;所述识别设备识别所述至少一个文本位置中每个文本位置处的关键字段,并得到每个文本位置处关键字段的机器识别结果及每个文本位置处关键字段的机器识别结果的置信度;所述识别设备根据每个文本位置处关键字段的机器识别结果的置信度,获取符合条件的第一类关键字段;所述识别设备将第一类关键字段中每个关键字段的图片发送至众包平台处理设备;所述众包平台处理设备将第一类关键字段中每个关键字段的图片发送至多个用户以使多个用户对第一类关键字段中同一关键字段的图片进行校验;根据第一类关键字段中每个关键字段对应的多个用户的检验结果,所述众包平台处理设备确定第一类关键字段中每个关键字段的识别结果;所述识别设备获取不符合条件的第二类关键字段,将第二类关键字段中每个关键字段的机器识别结果确定为第二类关键字段中每个关键字段的识别结果;所述识别设备将每个票据图片中第一类关键字段中每个关键字段的识别结果及第二类关键字段中每个关键字段的识别结果进行汇总,并输出每个票据图片的识别结果。2.如权利要求1所述的票据识别方法,其特征在于,所述识别设备从所述待识别图片中提取票据图片包括:所述识别设备利用训练好的票据提取模型提取所述至少一张票据图片中每张票据图片,其中每张票据图片属于训练所述票据提取模型的训练样本的一个类别。3.如权利要求1所述的票据识别方法,其特征在于,在所述识别设备从所述票据图片中检测至少一个文本位置之前,所述方法还包括:所述识别设备判断每张票据图片的位置是否有倾斜,对位置倾斜的票据图片进行位置矫正以使每张票据图片都处于标准位置中。4.如权利要求1所述的票据识别方法,其特征在于,所述识别设备从所述票据图片中检测至少一个文本位置包括:所述识别设备利用票面底色滤除技术对所述票据图片进行处理,得到滤除后的票据图片;所述识别设备利用训练好的文本位置检测模型检测所述滤除后的票据图片中至少一个文本位置,其中训练所述文本位置检测模型的训练样本为各种类别的票据样本。5.如权利要求1所述的票据识别方法,其特征在于,所述符合条件的第一类关键字段包括但不限于以下任意一种或者多种的组合:将机器识别结果的置信度低于或者等于置信阈值的关键字段作为所述第一类关键字段的一部分;将...

【专利技术属性】
技术研发人员:李佳琳刘鹏赵怡王健宗肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1