基于OCR的证件识别方法、装置、终端和存储介质制造方法及图纸

技术编号:26223323 阅读:34 留言:0更新日期:2020-11-04 10:55
本申请公开了一种基于OCR的证件识别方法、装置、终端和可读存储介质,基于OCR的证件识别方法获取待识别证件的图片,通过OCR对所述图片进行识别,将识别得到的字符存储至预设字符数组;基于预设正反面区分规则和所述预设字符数组的存储信息,判定所述预设待识别证件的正反面信息;基于所述正反面信息、所述预设字符数组的存储信息和预设版本区分规则,判定所述待识别证件的版本信息;基于所述版本信息、所述预设字符数组的存储信息和预设属性确认规则,获得所述待识别证件的证件内容。本申请能够识别新版证件的正反面信息和旧版证件正反面信息,从而提高了对待识别证件的识别效率。

【技术实现步骤摘要】
基于OCR的证件识别方法、装置、终端和存储介质
本申请涉及证件识别
,尤其涉及一种基于OCR的证件识别方法、装置、终端和存储介质。
技术介绍
随着移动互联网的普及,港澳地区居民来往内地通行证与台湾地区居民来往内地通行证的证件信息录入场景越来越多。目前识别设备无法同时识别新版和旧版的证件,并且只能识别证件的正面内容,如遇到回乡证更新换代,当下的光学字符识别OCR服务(OpticalCharacterRecognition,光学字符识别)需收集大量的新版数据集重新训练,不能快速支持。由此可见,目前基于OCR的证件识别效率低。
技术实现思路
本申请的主要目的在于提供一种基于OCR的证件识别方法、装置、终端及计算机存储介质,旨在解决现有技术中基于OCR的证件识别效率低的技术问题。为实现上述目的,本申请实施例提供一种基于OCR的证件识别方法,所述基于OCR的证件识别方法的步骤包括:获取待识别证件的图片,通过OCR对所述图片进行识别,将识别得到的字符存储至预设字符数组;基于预设正反面区分规则和所述预设字符数本文档来自技高网...

【技术保护点】
1.一种基于OCR的证件识别方法,其特征在于,所述基于OCR的证件识别方法包括以下步骤:/n获取待识别证件的图片,通过OCR对所述图片进行识别,将识别得到的字符存储至预设字符数组;/n基于预设正反面区分规则和所述预设字符数组的存储信息,判定所述预设待识别证件的正反面信息;/n基于所述正反面信息、所述预设字符数组的存储信息和预设版本区分规则,判定所述待识别证件的版本信息;/n基于所述版本信息、所述预设字符数组的存储信息和预设属性确认规则,获得所述待识别证件的证件内容。/n

【技术特征摘要】
1.一种基于OCR的证件识别方法,其特征在于,所述基于OCR的证件识别方法包括以下步骤:
获取待识别证件的图片,通过OCR对所述图片进行识别,将识别得到的字符存储至预设字符数组;
基于预设正反面区分规则和所述预设字符数组的存储信息,判定所述预设待识别证件的正反面信息;
基于所述正反面信息、所述预设字符数组的存储信息和预设版本区分规则,判定所述待识别证件的版本信息;
基于所述版本信息、所述预设字符数组的存储信息和预设属性确认规则,获得所述待识别证件的证件内容。


2.如权利要求1所述的基于OCR的证件识别方法,其特征在于,所述按识别的先后顺序,将得到的所述预设字符数组逐个存储以生成存储信息;
所述基于预设正反面区分规则和所述预设字符数组的存储信息,判定所述预设待识别证件的正反面信息的步骤包括:
依次检测所述预设字符数组的存储信息中最后三行每行的非汉字字符个数;
若所述每行的非汉字字符个数符合第一预设范围,且所述最后三行任一行包括第一预设字符,则判定所述待识别证件的正反面信息为反面证件;
若所述每行的非汉字字符个数不符合第一预设范围,则判定所述待识别证件的正反面信息为正面证件。


3.如权利要求2所述的基于OCR的证件识别方法,其特征在于,所述基于所述正反面信息、所述预设字符数组的存储信息和预设版本区分规则,判定所述待识别证件的版本信息的步骤包括:
当所述待识别证件的正反面信息为反面证件时,若所述预设字符数组的存储信息符合行数小于10并且大于5,且不存在预设文字,则判定所述待识别证件的版本信息为新版证件;
若所述预设字符数组的存储信息符合行数小于6并且存在所述预设文字,则判定所述待识别证件的版本信息为旧版证件;
当所述待识别证件的正反面信息为正面证件时,若所述预设字符数组的存储信息符合第一预设版本区分规则,则判定所述待识别证件的版本信息为新版证件;
若所述预设字符数组的存储信息符合第二预设版本区分规则,则判定所述待识别证件的版本信息为旧版证件。


4.如权利要求3所述的基于OCR的证件识别方法,其特征在于,所述基于所述版本信息、所述预设字符数组的存储信息和预设属性确认规则,获得所述待识别证件的证件内容的步骤包括:
检测所述预设字符数组中第二行或第三行是否存在数量小于第一预设值的目标汉字,若存在,则所述目标汉字为中文姓名;
检测所述中文姓名后两行的预设字符数组,若所述中文姓名后两行的预设字符数组存在数量大于第二预设值的目标大写字母,若存在,则所述目标大写字母为所述中文姓名的英文姓名,其中,所述第二预设值大于所述第一预设值。


5.如权利要求3所述的基于OCR的证件识别方法,其特征在于,所述基于所述版本信息、所述预设字符数组的存储信息和预设属性确认规则,获得所述待识别证件的证件内容的步骤还包括:
当版本信息为新版证件时,检测所述预设字符数组中第九行至第十三行是否存在数量大于所述第一预设值的汉字,并且所述汉字存在第二预设字符,若存在,则所述第二预设字符为签发机关;
检测所述预设字符数组中第五行至第八行是否存在字符长度小于第三预设值的第三预设字符或第四预设字符,若存在,则所述第三预设字符或所述第四预设字符为性别信息;
检测所述预设字符数组中最后两行是否存在字符个数小于第四预设值的目标数字,若存在,则所述目标数字的最后两位数字为签发次数,若不存在,且所述最后两行中只存在任一目标行的字符个数大于第五预设值,则所述目标行的最后两位数字为签发次数;
当版本信息为旧版证件时,检测所述预设字符数组中第四行至第六行是否存在字符长度小于所述第三预设值的...

【专利技术属性】
技术研发人员:邓建泉黄云晋张智斌
申请(专利权)人:前海人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1