【技术实现步骤摘要】
一种证件分类方法、装置及设备
本说明书一个或多个实施例涉及计算机
,尤其涉及一种证件分类方法、装置及设备。
技术介绍
目前,随着互联网技术的发展,网上办理业务已经越来越普遍,越来越多的业务,如通信行业、金融行业、出入境等领域都需要对用户的证件信息进行采集和登记,以进行实名制管理。在对证件进行识别认证时,首先需要对证件进行分类,但是随着科学技术与经济的发展,证件种类逐渐增多,对证件进行分类显得更加困难。现有技术中基于传统机器学习的多类证件检测分类模型对证件进行分类,在面临日益增多的证件类型时,分类的准确率较低,已经不能满足市场的需求。因此,需要提供一种更可靠的证件分类方案。
技术实现思路
有鉴于此,本说明书一个或多个实施例提供了一种证件分类方法、装置及设备,用于提高证件分类的准确率。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种证件分类方法,包括:获取待识别证件的证件图像;采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;确定所述置信度分数大于第一预设分数的多个候选证件类型;对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度 ...
【技术保护点】
1.一种证件分类方法,包括:/n获取待识别证件的证件图像;/n采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;/n确定所述置信度分数大于第一预设分数的多个候选证件类型;/n对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;/n分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;/n计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;/n将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。/n
【技术特征摘要】
1.一种证件分类方法,包括:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
2.如权利要求1所述的方法,所述采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数之后,还包括:
确定所述置信度分数大于第二预设分数的一个候选证件类型;所述第二预设分数大于所述第一预设分数;
将所述置信度分数大于第二预设分数的候选证件类型确定为所述待识别证件的类型。
3.如权利要求1所述的方法,所述分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量之前,还包括:
对所述多个所述候选证件类型中的一个候选证件类型,获取所述一个候选证件类型的多个证件样本;
根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域;
采用卷积神经网络分别提取所述标志区域和所述固定文字区域中的特征向量,得到所述多个证件样本的多个特征向量;
对所述多个特征向量按照区域进行聚类,得到所述标志区域的第一聚类中心向量,以及所述固定文字区域的第二聚类中心向量;
基于所述第一聚类中心向量与所述第二聚类中心向量,得到所述一个候选证件类型对应的第二特征向量。
4.如权利要求1所述的方法,所述对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量,具体包括:
根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域;
采用卷积神经网络提取所述待识别证件的标志区域和所述固定文字区域中的特征向量;
对所述特征向量按照区域进行聚类,得到所述待识别证件的标志区域的第三聚类中心向量,以及所述待识别证件的固定文字区域的第四聚类中心向量;
基于所述第三聚类中心向量与所述第四聚类中心向量,得到所述待识别证件的第一特征向量。
5.如权利要求3所述的方法,所述根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域之前,还包括:
确定所述候选证件边角的四个顶点的初始位置坐标;
根据所述候选证件边角的四个顶点的初始位置坐标将所述候选证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
6.如权利要求4所述的方法,所述根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域之前,还包括:
确定所述待识别证件边角的四个顶点的初始位置坐标;
根据所述待识别证件边角的四个顶点的初始位置坐标将所述待识别证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
7.如权利要求1所述的方法,所述采用分类模型对所...
【专利技术属性】
技术研发人员:陈志军,甘宇飞,
申请(专利权)人:支付宝实验室新加坡有限公司,
类型:发明
国别省市:新加坡;SG
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。