基于图像匹配的证件号码识别方法技术

技术编号：38230197 阅读：7 留言：0更新日期：2023-07-25 17:58

本发明专利技术公开了基于图像匹配的证件号码识别方法，属于证件识别技术领域，包括如下步骤，证件号码区域定位：使用预先训练的文本检测模型定位该图像所有文本坐标位置；字符分割：对证件号码区域图像进行灰度处理，然后二值化处理并进行连通区域分析；创建证件号码单字符图像模板库：将证件号码文本图像分割成十个单字符图像，挑选字符集，保存作为模板库；字符匹配：将多个单字符图形进行排序并在模板中进行匹配得到概率矩阵，然后在列方向进行索引得到识别结果。本发明专利技术旨在识别证件号码，不需要大量标注数据，同时使用连通区域分析法获得证件号码图像单字符所在位置，获得的边界框紧贴字符区域，使得裁剪出来的字符更加精准。使得裁剪出来的字符更加精准。使得裁剪出来的字符更加精准。

全部详细技术资料下载

【技术实现步骤摘要】
基于图像匹配的证件号码识别方法

[0001]本专利技术涉及证件识别
，尤其涉及基于图像匹配的证件号码识别方法。

技术介绍

[0002]某一国家某一类型证件(如身份证、驾驶证等)，其证件号码的字体是确定的、一致的，基于此，可采用图像匹配的方式进行证件号码的识别；
[0003]证件号码的识别属于光学字符识别技术范畴，常见的方法是人工提取图像特征，然后训练机器学习分类模型进行字符分类，如SVM、XGBOOST等，然后基于深度学习算法，使用卷积神经网络和循环神经网络提取特征，结合CTC或者注意力机制进行字符预测，如CRNN、SATRN等，无论是基于传统人工提取特征和基于深度学习技术，都需要大量标注数据进行模型的训练，并且模型文件往往很大；
[0004]现有技术专利(CN201810736445.4，基于OpenCV的银行卡号识别方法)也采用模板匹配的方法进行号码识别，需要区分强光照、中光照、弱光照和光照不均匀四种情况，再使用膨胀腐蚀提取号码区域图像；通过列投影法进行字符分割，最后模板匹配得到字符文本，其缺点在于需要区分光照场景，并且膨胀腐蚀进行卡号区域的定位提取也很容易受到背景及光照影响；因此提出基于图像匹配的证件号码识别方法解决上述问题。

技术实现思路

[0005]本专利技术的目的是为了解决现有技术中无论是基于传统人工提取特征和基于深度学习技术，都需要大量标注数据进行模型的训练，并且模型文件往往很大的问题，而提出的基于图像匹配的证件号码识别方法。
[0006]为了实现上述目的，...

【技术保护点】

【技术特征摘要】
1.基于图像匹配的证件号码识别方法，其特征在于，包括如下步骤，S1、证件号码区域定位：使用预先训练的文本检测模型定位该图像所有文本坐标位置，根据文本坐标位置和文本条的宽高比筛选出证件号码区域图像；S2、字符分割：对证件号码区域图像进行灰度处理，然后二值化处理得到二值图，对二值图进行连通区域分析，将连通区域转换为边界框，基于这些边界框在二值图上分割出已经二值化处理后的单字符图像；S3、创建证件号码单字符图像模板库：将证件号码文本图像分割成十个单字符图像，挑选字符集，对身份证中0
‑
9十个字符，进行二值化处理，保存作为模板库；S4、字符匹配：通过字符分割后得到多个单字符图像，模板库中字符按0到9进行排序，将每个字符图像都与模板库中的每个字符进行模板匹配，得到N行M列的匹配概率矩阵，在列方向计算最大概率值索引，根据该索引从模板库中可得到N个字符，即为证件号码的识别结果。2.根据权利要求1所述的基于图像匹配的证件号码识别方法，其特征在于：所述S3中证件号码的字符集是固定的，例如国内居...

【专利技术属性】
技术研发人员：高利军，黄泽琪，李茜，马宇翔，胡博，
申请(专利权)人：唯思电子商务深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人