一种证件OCR识别方法及系统技术方案

技术编号：33071789 阅读：16 留言：0更新日期：2022-04-15 10:06

本发明专利技术公开了一种证件OCR识别方法及系统，包括：采集证件图像、证件图像预处理、证件图像粗定位、证件图像文本定位、证件图像文本识别、证件图像文本校正；其中，证件图像粗定位，包括：对证件图像进行文本检测，识别筛选出文本区域；对所有文本区域进行裁剪，得到对应的文本图片集；对文本图片集进行逐个识别，将识别结果与预选定基准区域的基准字符串格式进行匹配；选择匹配度最高的图片文本框为基准定位。本发明专利技术通过对现有OCR识别方法进行改进，克服边缘检测困难、校正身份证照片倾斜、改善字迹模糊，提高识别率，降低拒识率。降低拒识率。降低拒识率。

全部详细技术资料下载

【技术实现步骤摘要】
一种证件OCR识别方法及系统

[0001]本专利技术涉及图像识别
，具体涉及一种证件OCR识别方法及系统。

技术介绍

[0002]身份证等证件识别技术使用成熟的OCR文字识别技术，通过手机或者带有摄像头的终端设备对身份证拍照，并对身份证照片做OCR文字识别，提取身份证信息。此技术越来越被广大消费用户认知并使用，不仅集合了身份证识别，还包括驾驶证识别、行驶证识别、护照识别、车牌识别、银行卡号识别、名片识别等集合化的功能。
[0003]现有身份证等证件的OCR识别方法，包括：1.采集身份证等证件图像；2.证件图像预处理：图像预处理是指对身份证等证件图像进行灰度化、二值化和去噪、纠偏、透视变换等处理，以使身份证图像的质量得到改善，同时保留和增强身份证中纹理和颜色的信息，去除可能影响身份证区域纹理和颜色信息的噪点，为身份证图像定位提供方便；其中，常用的预处理方法包括：图像灰度化、图像灰度拉伸和空域滤波之中值滤波。
[0004]3.证件图像粗定位：图像粗定位是指图像经过各种算法的处理后能够清楚地显示出身份证图像区域，同时使图像中的非身份证区域减弱，从而能准确有效地定位出身份证中各个要素在图像中的位置；其中，使用的算法主要有：边缘检测法、数学形态学法、基于纹理分析的定位方法、行检测和边缘统计法、遗传算法、Hough变化和轮廓线法、基于小波变换的方法和神经网络法等；例如，现有专利CN109034165A公开了《一种证件图像的裁切方法、装置、系统及存储介质》，其采用边缘检测法对灰度图像进行边缘线段检测，得到所述...

【技术保护点】

【技术特征摘要】
1.一种证件OCR识别方法，包括：采集证件图像、证件图像预处理、证件图像粗定位、证件图像文本定位、证件图像文本识别、证件图像文本校正；其特征在于，所述证件图像粗定位，包括：对证件图像进行文本检测，识别筛选出文本区域；对所有所述文本区域进行裁剪，得到对应的文本图片集；对所述文本图片集进行逐个识别，将识别结果与预选定基准区域的基准字符串格式进行匹配；选择匹配度最高的图片文本框为基准定位。2.如权利要求1所述的证件OCR识别方法，其特征在于，所述基准区域为证件上固定位置的机器读码区。3.如权利要求1所述的证件OCR识别方法，其特征在于，采用基于卷积神经网络CNN架构的CRAFT技术对证件图像进行文本检测。4.如权利要求1所述的证件OCR识别方法，其特征在于，使用OCR工具，采用按行识别模式，对所述文本图片集进行逐个识别。5.如权利要求1~4中任一项所述的证件OCR识别方法，其特征在于，所述证件图像文本定位，包括：对预处理后的二值化图像进行逐点像素霍夫变换，探测出图像中各行文本所在的直线；统计各行文本所在直线的倾斜角度，将最集中的倾斜角度作为整个证件图像的图像倾斜角度；基于所述图像倾斜角度，旋转得到校正图像和校正基准定位；基于校正图像和校正基准定位，对各文本框进行定位校正，裁剪得到各文本框图像。6.如权利要求5所述的证件OCR识别方法，其特征在于，所述统计各行文本所在直线的倾斜角度，将最集中的倾斜角度作为整个证件图像的图像倾斜角度；包括：从0度开始，按0.1度步进，对所有直线所在角度区间进行计数统计；获得直线角度最集中的区间，并将该区间对应角度的中间值作为整个证件图像的图像倾斜角度。7.如权利要求5所述的证件OCR识别方法，其特征在于，所述基于所述图像倾斜角度，旋转得到校正图像和校正基准定位；包括：根据所述图像倾斜角，获得仿射映射矩阵M；基于所述仿射映射矩阵M，对原图像进行仿射变换，得到校正图像；基于所述仿射...

【专利技术属性】
技术研发人员：刘海龙，闵刚，姚占龙，
申请(专利权)人：北京锐融天下科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人