【技术实现步骤摘要】
证卡信息识别及其边缘检测模型训练方法、装置
本专利技术涉及信息处理
,特别涉及证卡信息识别方法及装置、边缘检测模型训练方法及装置、电子设备、存储介质。
技术介绍
随着图片文本识别技术的准确率的不断提升,其越来越多的被应用于对证件、票证等证卡图片的文本识别,以提取证卡中的信息。目前,对于不同类型的证卡信息识别,需要针对每类证卡训练一个识别模型,浪费人力又浪费算力。另外,为了排除证卡图片的背景区域对证卡信息识别的干扰,进行证卡信息识别之前,需要对获取的证卡图片进行边缘检测,以获得证卡边缘图片。目前常使用的边缘检测模型会识别出图片中所有的线条,而大部分线条并不是图中证件的边缘,其会干扰证卡边缘图片的提取,从而影响对证卡图片进行信息识别的效率和准确率。
技术实现思路
本专利技术提供一种效率高、准确率高且可对不同类型证件进行证件信息识别的证卡信息识别方法及装置、边缘检测模型训练方法及装置、电子设备、存储介质。具体地,本专利技术是通过如下技术方案实现的:第一方面,提供一种证卡信息识别方法,所述证卡信息识别方法包括:将待识别证卡的证卡图片输入边缘检测模型,其中,所述边缘检测模型采用不同类型的证卡的证卡图片样本训练完成;经所述边缘检测模型对输入的证卡图片进行边缘检测,得到证卡边缘信息,并根据所述证卡边缘信息确定所述证卡图片中的证卡区域;使用与所述待识别证卡的类型相同的证卡的证卡模板,对所述证卡区域进行模板匹配,以定位所述证卡区域中的文本识别子区域;对所 ...
【技术保护点】
1.一种证卡信息识别方法,其特征在于,所述证卡信息识别方法包括:/n将待识别证卡的证卡图片输入边缘检测模型,其中,所述边缘检测模型采用不同类型的证卡的证卡图片样本训练完成;/n经所述边缘检测模型对输入的证卡图片进行边缘检测,得到证卡边缘信息,并根据所述证卡边缘信息确定所述证卡图片中的证卡区域;/n使用与所述待识别证卡的类型相同的证卡的证卡模板,对所述证卡区域进行模板匹配,以定位所述证卡区域中的文本识别子区域;/n对所述文本识别子区域进行文本识别,以提取证卡信息。/n
【技术特征摘要】
1.一种证卡信息识别方法,其特征在于,所述证卡信息识别方法包括:
将待识别证卡的证卡图片输入边缘检测模型,其中,所述边缘检测模型采用不同类型的证卡的证卡图片样本训练完成;
经所述边缘检测模型对输入的证卡图片进行边缘检测,得到证卡边缘信息,并根据所述证卡边缘信息确定所述证卡图片中的证卡区域;
使用与所述待识别证卡的类型相同的证卡的证卡模板,对所述证卡区域进行模板匹配,以定位所述证卡区域中的文本识别子区域;
对所述文本识别子区域进行文本识别,以提取证卡信息。
2.如权利要求1所述的证卡信息识别方法,其特征在于,采用不同类型的证卡的证卡图片样本训练所述边缘检测模型,包括:
获取不同类型的证卡的证卡图片样本,所述证卡图片样本标注有证卡边缘标注信息;
从所述证卡图片样本中提取证卡边缘图片,并将获取的证卡边缘图片嵌入至其他背景图片中,得到标注有证卡边缘标注信息的合成图片;
将所述证卡图片样本和所述合成图片作为训练样本迭代训练神经网络;
确定每次迭代过程中所述神经网络输出的证卡边缘预测信息与所述证卡边缘标注信息之间的差异;
基于所述差异调整所述神经网络的网络参数,直至满足训练停止条件时结束训练,得到所述边缘检测模型。
3.如权利要求2所述的证卡信息识别方法,其特征在于,将获取的证卡边缘图片嵌入至其他背景图片中之后,还包括:
根据所述其他背景图片的图片参数调整所述证卡边缘图片的图片参数。
4.如权利要求3所述的证卡信息识别方法,其特征在于,所述图片参数包括以下参数中的至少一种:
像素值、亮度、色彩深度。
5.如权利要求1所述的证卡信息识别方法,其特征在于,所述证卡边缘信息包括:多个点坐标;
根据所述证卡边缘信息确定所述证卡图片中的证卡区域,包括:
对所述多个点坐标进行霍夫变换得到多条线段;
将所述多条线段中倾斜角的差值小于倾斜角阈值,且线段间距小于间距阈值的两条线段合并;
根据合并后的线段确定所述证卡区域。
6.如权利要求1所述的证卡信息识别方法,其特征在于,使用与所述待识别证卡的类型相同的证卡的证卡模板,对所述证卡区域进行模板匹配之前,包括:
将所述待识别证卡的证卡图片输入证件类型识别模型,其中,所述证件类型识别模型采用包含证件类型标注信息的证卡图片训练完成;
经所述证件类型识别模型对输入的证卡图片进行特征提取,并根据所述特征确定所述待识别证卡的类型,以获取与所述待识别证卡的类型相同的证卡的证卡模板。
7.如权利要求1所述的证卡信息...
【专利技术属性】
技术研发人员:魏良宵,
申请(专利权)人:杭州数梦工场科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。