基于深度学习和传统算法的证照版面分析方法技术

技术编号:39671089 阅读:14 留言:0更新日期:2023-12-11 18:36
本发明专利技术公开了一种基于深度学习和传统算法的证照版面分析方法,包括获得证照版面的机读码区域的边缘角点的四个坐标,使用标准的证照尺寸,对待采集的所述证照版面进行所述机读码区域的对齐;使用标准尺寸的预设坐标点的视读区域坐标位置,抠取出视读区,使用目标检测算法识别所述证照版面的所述视读区的字符;采用从下到上的补齐方式,调整标准尺寸的预设坐标点当中各个识别区域的外接框;抠取出需要进行字符识别的准确区域,送入卷积循环神经网络结构进行识别,得到最终的字符识别结果;将已知栏目区域和所述字符识别结果对应,得到最终的结构化输出结果

【技术实现步骤摘要】
基于深度学习和传统算法的证照版面分析方法


[0001]本专利技术涉及文字识别
,尤其涉及一种基于深度学习和传统算法的证照版面分析方法


技术介绍

[0002]在常规的证件识别中,证件识别准确度由于证件的版面分布复杂,给证件的识别带来了较大挑战,目前对证件结构化输出的方法有以下两种:
[0003]通过模板匹配,需要前处理时尽量摆正证件,然后使用做好的标准件直接抠取框选区域

这种方法仅仅适用于严格的配合式拍摄,当证件有残缺和畸变时,就无法准确的得出输出结果,容易导致结构化输出识别的问题,基于模板直接匹配的方法,是通过前期对证件进行严格处理,比如透视变化,仿射变换,将待识别的证件做成一个尺寸

区域与模板严格匹配的证件;这种方法在使用过程中需要找到四个关键的坐标点进行证件的拉伸的变形处理,而每个关键点覆盖的面积越大,图像的标准化处理效果越好,但是有的护照证件的关键点不明显时,上述方法就容易失效,待匹配图片有畸变,匹配的结果会出现内容缺失,结构化输出会失效

[0004]基于深度学习的算法,通过直接识别证件项目的小字栏,然后根据每种类型证件上文字内容的分布,得到证件识别内容的结构化输出结果,所述方法对硬件算力要求高,使用成本高,同时当证件拍摄不够清晰,小字栏目识别失败时,相关的证件信息结构化输出失败;详而言之,由于拍摄条件的限制,小字栏目在进行识别的时候容易丢失,栏目丢失后,识别的内容无法找到对应栏目归属,输出识别结果缺失,例如,韩国护照的小字栏目识别,由于证件的拍摄模糊,小字识别置信度较低,直接影响最终识别结果


技术实现思路

[0005]本专利技术的一个目的在于提供一种基于深度学习和传统算法的证照版面分析方法,在基于深度学习的优势上,融合传统算法,对护照进行版面分析,达到证件识别结果的准确输出

[0006]本专利技术的其它优势和特点通过下述的详细说明得以充分体现并可通过所附权利要求中特地指出的手段和装置的组合得以实现

[0007]依本专利技术的一个方面,能够实现前述目的和其他目的和优势的本专利技术的一种基于深度学习和传统算法的证照版面分析方法,包括:
[0008]获得证照版面的机读码区域的边缘角点的四个坐标,使用标准证照的尺寸,对待采集的所述证照版面进行所述机读码区域的对齐;
[0009]使用标准尺寸的预设坐标点的视读区域坐标位置,抠取出视读区,使用目标检测算法识别所述证照版面的所述视读区的字符;
[0010]采用从下到上的补齐方式,调整标准尺寸的预设坐标点当中各个识别区域的外接框;
[0011]抠取出需要进行字符识别的准确区域,送入卷积循环神经网络结构进行识别,得到最终的字符识别结果;
[0012]将标准证照的已知栏目区域和所述字符识别结果对应,得到最终的结构化输出结果

[0013]根据本专利技术的一个实施例,调整标准尺寸的预设坐标点当中各个识别区域的外接框之后
,
还包括
:
通过对所述视读区需识别的字符区域进行外接框的移动,得到准确的所述识别区域的所述外接框

[0014]根据本专利技术的一个实施例,获得证照版面的机读码区域的边缘角点的四个坐标之前,先对采集到的所述证照版面的生物信息页进行预处理,对机读码区域进行数据增强,进行所述机读码区域的字符识别

[0015]根据本专利技术的一个实施例,进行所述机读码区域的字符识别后,根据所述机读码区域的字符信息解读,确认所述证照版面所归属的国家和证照类型

[0016]根据本专利技术的一个实施例,抠取出需要进行字符识别的准确区域时,先对所述需识别的字符区域进行高斯滤波

灰度化图像

中值滤波处理

[0017]根据本专利技术的一个实施例,对所述需识别的字符区域进行高斯滤波

灰度化图像

中值滤波处理后,对所述需识别的字符区域进行
sauvola
二值化

腐蚀膨胀

投影算法处理

[0018]根据本专利技术的一个实施例,通过标准尺寸的预设坐标点的坐标信息去抠取识别区域的步骤包括:获取待处理图片机读码区域在整张图像的坐标;使用机读码的四个顶点坐标进行仿射变换,摆正图片;根据待处理机读码的宽高和标准的机读码的宽高比,对原始图片进行
resize
;同时,生成标准的机读码区域在整张图像的坐标;对图片多余的边缘进行裁剪,对缺少的边缘进行像素填充

[0019]根据本专利技术的一个实施例,护照视读区域的坐标框调整顺序按照距离机读码区域最近的距离开始,然后依次往上处理

[0020]根据本专利技术的一个实施例,进行中值滤波处理时,选择一个
(2n+1)(2n+1)
的窗口
(n
是大于或等于1的值
)
,使用窗口沿图像数据的行方向和列方向从左至右,从上至下沿每个像素滑动;每次滑动,对窗口内的像素灰度进行排序,并用中间值代替窗口中心位置的像素灰度值

[0021]根据本专利技术的一个实施例,进行投影算法处理时,水平投影即通过将二值化的图像在有
y
轴方向上进行像素累加,然后通过阈值分割出每一行字符;纵向投影即通过将二值化的图像在
x
轴方向上进行像素累加,然后通过阈值分割出每一个字符,并同时去掉左右两端空白无字符的区域,从而生成最终的字符识别结果

[0022]本专利技术中在基于深度学习的优势上,融合传统算法,对护照进行版面分析,达到证件识别结果的准确输出,从而准确地做到结构化输出,即使证件拍摄不够清晰,存在畸变的情况下,依然可以准确的做到结构化输出识别结果;随着深度学习方法的发展,结合传统图像处理,对于证件版面的逐像素分析,使得证件的识别结果得到了一个新的层面的提升

附图说明
[0023]图1为本专利技术的一个实施例的基于深度学习和传统算法的证照版面分析方法的算法流程图

[0024]图2为本专利技术的上述实施例的基于深度学习和传统算法的证照版面分析方法的抠取识别区域的步骤流程图

[0025]图3为本专利技术的上述实施例的基于深度学习和传统算法的证照版面分析方法的坐标框调整顺序的步骤流程图

[0026]图4为本专利技术的上述实施例的基于深度学习和传统算法的证照版面分析方法的抠取准确区域的步骤流程图

具体实施方式
[0027]以下描述用于揭露本专利技术以使本领域技术人员能够实现本专利技术

以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型

在以下描述中界定的本专利技术的基本原理可以应用于其他实施方案
...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习和传统算法的证照版面分析方法,其特征在于,包括以下步骤:获得证照版面的机读码区域的边缘角点的四个坐标,使用标准证照的尺寸,对待采集的所述证照版面进行所述机读码区域的对齐;使用标准尺寸的预设坐标点的视读区域坐标位置,抠取出视读区,使用目标检测算法识别所述证照版面的所述视读区的字符;采用从下到上的补齐方式,调整标准尺寸的预设坐标点当中各个识别区域的外接框;抠取出需要进行字符识别的准确区域,送入卷积循环神经网络结构进行识别,得到最终的字符识别结果;将标准证照的已知栏目区域和所述字符识别结果对应,得到最终的结构化输出结果
。2.
根据权利要求1所述的分析方法,其特征在于,调整标准尺寸的预设坐标点当中各个识别区域的外接框之后
,
还包括
:
通过对所述视读区需识别的字符区域进行外接框的移动,得到准确的所述识别区域的所述外接框
。3.
根据权利要求2所述的分析方法,其特征在于,获得证照版面的机读码区域的边缘角点的四个坐标之前,先对采集到的所述证照版面的生物信息页进行预处理,对机读码区域进行数据增强,进行所述机读码区域的字符识别
。4.
根据权利要求3所述的分析方法,其特征在于,进行所述机读码区域的字符识别后,根据所述机读码区域的字符信息解读,确认所述证照版面所归属的国家和证照类型
。5.
根据权利要求4所述的分析方法,其特征在于,抠取出需要进行字符识别的准确区域时,先对所述需识别的字符区域进行高斯滤波

灰度化图像

中值滤波处理
。6.
根据权利要求5所述的分析方法,其特征在于,对所述需识别的字符区域进行高斯滤...

【专利技术属性】
技术研发人员:付雪平夏炉系聂芸芸杨梅苗应亮
申请(专利权)人:盛视科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1