基于OCR技术的身份证识别方法、存储介质及装置制造方法及图纸

技术编号：36469400 阅读：39 留言：0更新日期：2023-01-25 23:11

本发明专利技术公开了一种基于OCR技术的身份证识别方法、存储介质及装置。该方法包括以下步骤：A.获取含有身份证图像的待识别图像，从待识别图像中截取身份证图像；B.采用渐进尺度扩张算法识别出上述身份证图像中的各个文本行的位置坐标；C.根据各个文本行的位置坐标，通过文本识别算法识别出上述身份证图像中各个文本框的文本；D.采用版面分析算法识别出上述身份证图像中的多个身份证信息要素以及各要素的位置坐标；E.根据上述身份证图像中各个身份证信息要素的位置坐标以及各个文本框的位置坐标，将各个文本框的文本与对应的身份证信息要素进行匹配，输出各个身份证信息要素所匹配的文本。该方法能够提高身份证信息的识别准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
基于OCR技术的身份证识别方法、存储介质及装置

[0001]本专利技术涉及OCR
，尤其涉及一种基于OCR技术的身份证识别方法、存储介质及装置。

技术介绍

[0002]随着移动互联网的发展，许多企业或者政府机关推出了自己的移动APP或者小程序等，方便用户通过移动终端进行业务查询、办理等操作。这些操作通常需要获取用户的身份证信息进行身份认证，用户手动输入会比较繁琐且速度较慢，为此，业内技术人员开发了通过OCR技术自动识别身份证图像从而获取身份证信息的功能，用户只需使用移动终端摄像头拍摄身份证图像上传，移动APP/小程序即可自动识别身份证图像中的文本并输出文本信息（即身份证信息），无需用户手动输入，方便快捷。但若遇到有些少数民族身份证，由于其除了印刷有以汉语显示的身份证信息以外，还在汉语的上方或者下方印刷有以少数民族语言显示的身份证信息，文本行之间离较近，现有的身份证OCR识别方式容易将少数民族的身份证的相邻的两行文本行误识别为一行文本行，导致识别出错。

技术实现思路

[0003]本专利技术所要解决的技术问...

【技术保护点】

【技术特征摘要】
1.一种基于OCR技术的身份证识别方法，其特征是，包括以下步骤：A.获取含有身份证图像的待识别图像，从待识别图像中截取身份证图像；B.采用渐进尺度扩张算法识别出上述身份证图像中的各个文本行的位置坐标；C.根据各个文本行的位置坐标，通过文本识别算法识别出上述身份证图像中各个文本框的文本；D.采用版面分析算法识别出上述身份证图像中的多个身份证信息要素以及各要素的位置坐标；E.根据上述身份证图像中各个身份证信息要素的位置坐标以及各个文本框的位置坐标，将各个文本框的文本与对应的身份证信息要素进行匹配，输出各个身份证信息要素所匹配的文本。2.如权利要求1所述的基于OCR技术的身份证识别方法，其特征是：步骤A中具体是通过目标检测模型从待识别图像中截取身份证图像，目标检测模型包括用于提取待识别图像的图像特征的主干网络、对图像特征进行上采样的FPN网络、对图像特征进行下采样的PAN网络以及用于进行最优解筛选的NMS算法；目标检测模型从待识别图像中截取身份证图像的过程如下：A1.接收所输入的身份证图像；A2.通过主干网络提取该身份证图像的图像特征；A3.通过FPN网络和PAN网络对所提取的图像特征进行上、下采样后输出预测特征图；A4.通过NMS算法对该预测特征图进行最优解筛选，输出身份证图像的位置坐标和身份证的面向信息；A5.根据身份证图像的位置坐标从待识别图像中截取身份证图像。3.如权利要求1所述的基于OCR技术的身份证识别方法，其特征是，步骤B具体地，提取上述身份证图像的图像特征，通过FPN网络对该图像特征进行上采样后输出预测特征图，然后采用渐进尺度扩张算法对该预测特征图进行文本检测，从而识别出上述身份证图像中的各个文本框的位置坐标。4.如权利要求1所述的基于OCR技术的身份证识别方法，其特征是，步骤C中，在通过文本识别算法识别出上述身份证图像中各个文本框的文本之前，执行倾斜文本处理步骤：随机取一个文本框...

【专利技术属性】
技术研发人员：王先来，
申请(专利权)人：广州佰锐网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人