基于深度学习和传统算法的证照版面分析方法技术

技术编号：39671089 阅读：14 留言：0更新日期：2023-12-11 18:36

本发明专利技术公开了一种基于深度学习和传统算法的证照版面分析方法，包括获得证照版面的机读码区域的边缘角点的四个坐标，使用标准的证照尺寸，对待采集的所述证照版面进行所述机读码区域的对齐；使用标准尺寸的预设坐标点的视读区域坐标位置，抠取出视读区，使用目标检测算法识别所述证照版面的所述视读区的字符；采用从下到上的补齐方式，调整标准尺寸的预设坐标点当中各个识别区域的外接框；抠取出需要进行字符识别的准确区域，送入卷积循环神经网络结构进行识别，得到最终的字符识别结果；将已知栏目区域和所述字符识别结果对应，得到最终的结构化输出结果

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习和传统算法的证照版面分析方法

[0001]本专利技术涉及文字识别
，尤其涉及一种基于深度学习和传统算法的证照版面分析方法
。

技术介绍

[0002]在常规的证件识别中，证件识别准确度由于证件的版面分布复杂，给证件的识别带来了较大挑战，目前对证件结构化输出的方法有以下两种：
[0003]通过模板匹配，需要前处理时尽量摆正证件，然后使用做好的标准件直接抠取框选区域
。
这种方法仅仅适用于严格的配合式拍摄，当证件有残缺和畸变时，就无法准确的得出输出结果，容易导致结构化输出识别的问题，基于模板直接匹配的方法，是通过前期对证件进行严格处理，比如透视变化，仿射变换，将待识别的证件做成一个尺寸
、
区域与模板严格匹配的证件；这种方法在使用过程中需要找到四个关键的坐标点进行证件的拉伸的变形处理，而每个关键点覆盖的面积越大，图像的标准化处理效果越好，但是有的护照证件的关键点不明显时，上述方法就容易失效，待匹配图片有畸变，匹配的结果会出现内容缺失，结构化输出会失效
。
[0004]基于深度学习的算法，通过直接识别证件项目的小字栏，然后根据每种类型证件上文字内容的分布，得到证件识别内容的结构化输出结果，所述方法对硬件算力要求高，使用成本高，同时当证件拍摄不够清晰，小字栏目识别失败时，相关的证件信息结构化输出失败；详而言之，由于拍摄条件的限制，小字栏目在进行识别的时候容易丢失，栏目丢失后，识别的内容无法找到对应栏目归属，输出识别结果缺失，例如，韩国护照的小字栏

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习和传统算法的证照版面分析方法，其特征在于，包括以下步骤：获得证照版面的机读码区域的边缘角点的四个坐标，使用标准证照的尺寸，对待采集的所述证照版面进行所述机读码区域的对齐；使用标准尺寸的预设坐标点的视读区域坐标位置，抠取出视读区，使用目标检测算法识别所述证照版面的所述视读区的字符；采用从下到上的补齐方式，调整标准尺寸的预设坐标点当中各个识别区域的外接框；抠取出需要进行字符识别的准确区域，送入卷积循环神经网络结构进行识别，得到最终的字符识别结果；将标准证照的已知栏目区域和所述字符识别结果对应，得到最终的结构化输出结果
。2.
根据权利要求1所述的分析方法，其特征在于，调整标准尺寸的预设坐标点当中各个识别区域的外接框之后
,
还包括
:
通过对所述视读区需识别的字符区域进行外接框的移动，得到准确的所述识别区域的所述外接框
。3.
根据权利要求2所述的分析方法，其特征在于，获得证照版面的机读码区域的边缘角点的四个坐标之前，先对采集到的所述证照版面的生物信息页进行预处理，对机读码区域进行数据增强，进行所述机读码区域的字符识别
。4.
根据权利要求3所述的分析方法，其特征在于，进行所述机读码区域的字符识别后，根据所述机读码区域的字符信息解读，确认所述证照版面所归属的国家和证照类型
。5.
根据权利要求4所述的分析方法，其特征在于，抠取出需要进行字符识别的准确区域时，先对所述需识别的字符区域进行高斯滤波
、
灰度化图像
、
中值滤波处理
。6.
根据权利要求5所述的分析方法，其特征在于，对所述需识别的字符区域进行高斯滤...

【专利技术属性】
技术研发人员：付雪平，夏炉系，聂芸芸，杨梅，苗应亮，
申请(专利权)人：盛视科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人