一种证件分类方法、装置及设备制造方法及图纸

技术编号:24411592 阅读:18 留言:0更新日期:2020-06-06 09:27
本说明书实施例提供一种证件分类方法、装置及设备。方案包括:采用分类模型对获取的证件图像进行初步识别,得到针对多种证件类型的多个置信度分数之后;对置信度分数大于第一预设分数的多个候选证件类型以及待识别证件进行二次比对,具体地,分别提取出多个候选证件类型中的标志区域和固定文字区域的多个特征向量,再提取出待识别证件中标志区域和固定文字区域的特征向量;计算第一特征向量与多个第二特征向量的相似度,在得到的多个相似度值中,将最大的相似度值对应的候选证件类型确定为待识别证件的类型。

A method, device and equipment of certificate classification

【技术实现步骤摘要】
一种证件分类方法、装置及设备
本说明书一个或多个实施例涉及计算机
,尤其涉及一种证件分类方法、装置及设备。
技术介绍
目前,随着互联网技术的发展,网上办理业务已经越来越普遍,越来越多的业务,如通信行业、金融行业、出入境等领域都需要对用户的证件信息进行采集和登记,以进行实名制管理。在对证件进行识别认证时,首先需要对证件进行分类,但是随着科学技术与经济的发展,证件种类逐渐增多,对证件进行分类显得更加困难。现有技术中基于传统机器学习的多类证件检测分类模型对证件进行分类,在面临日益增多的证件类型时,分类的准确率较低,已经不能满足市场的需求。因此,需要提供一种更可靠的证件分类方案。
技术实现思路
有鉴于此,本说明书一个或多个实施例提供了一种证件分类方法、装置及设备,用于提高证件分类的准确率。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种证件分类方法,包括:获取待识别证件的证件图像;采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;确定所述置信度分数大于第一预设分数的多个候选证件类型;对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。本说明书实施例提供的一种证件分类装置,包括:证件图像获取模块,用于获取待识别证件的证件图像;识别模块,用于采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;第一候选证件类型确定模块,用于确定所述置信度分数大于第一预设分数的多个候选证件类型;第一特征向量提取模块,用于对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;第二特征向量提取模块,用于分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;相似度计算模块,用于计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;证件类型确定模块,用于将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。本说明书实施例提供的一种证件分类设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取待识别证件的证件图像;采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;确定所述置信度分数大于第一预设分数的多个候选证件类型;对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种证件分类方法。本说明书一个实施例实现了能够达到以下有益效果:在通过对采用分类模型对所述证件图像进行识别后,将置信度分数大于第一预设分数的多个候选证件类型再进行细粒度的特征提取;对待识别证件以及多个候选证件类型中的标志区域和固定文字区域进行特征提取,分别得到待识别证件的第一特征向量和多个证件类型对应的多个第二特征向量;计算第一特征向量与多个第二特征向量的相似度,得到多个相似度值;将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型对多种候选证件类型;通过将待识别证件和候选证件类型进行二次比对,提高了证件分类的准确率。附图说明此处所说明的附图用来提供对本说明书一个或多个实施例的进一步理解,构成本说明书一个或多个实施例的一部分,本说明书的示意性实施例及其说明用于解释本说明书一个或多个实施例,并不构成对本说明书一个或多个实施例的不当限定。在附图中:图1为本说明书实施例中一种证件分类方法的整体方案示意图;图2为本说明书实施例提供的一种证件分类方法的流程示意图;图3为本说明书实施例提供的一种证件分类方法中的证件示意图;图4为本说明书实施例提供的一种证件分类方法中分类结果为单峰结构的示意图;图5为本说明书实施例提供的一种证件分类方法中分类结果为多峰结构的示意图;图6为本说明书实施例提供的一种证件分类方法中特征聚类示意图;图7为本说明书实施例提供的一种证件分类方法中二次比对流程示意图;图8为本说明书实施例提供的对应于图2的一种证件分类装置的结构示意图;图9为本说明书实施例提供的对应于图2的一种证件分类设备的结构示意图。具体实施方式为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。以下结合附图,详细说明本说明书各实施例提供的技术方案。图1为本说明书实施例中一种证件分类方法的整体方案示意图。如图1所示,将待识别证件先进行CNN分类,得到每种证件类型对应的置信度分数,按照置信度分数将经过CNN分类得到的分类结果分为单峰结构和多峰结构,其中,多峰结构可以指的是大于第一预设分数的置信度分数存在多个,比如:置信度分数大于0.1的置信度分数有三个,这三个置信度分数分别对应类别4、类别7和类别9,此时,由于这三个类别的置信度分数接近,待识别证件属于这些多峰对应类别的概率接近,不能直接采用现有技术中的简单CNN分类模型来进行分类,需要进行细粒度识别,进行二次比对,进一步确定这三种候选证件类型与待识别证件的相似度分数,如图1中所示,假设经过二次比对后,证件类别4与待识别证件的相似度分数为0.67,证件类别7与待识别证件的相似度分数为0.99,证件类别9与待识别证件的相似度分数为0.5,此时,证件类别7与待识别证件的相似度分数最高,可以将证件类别7确定为待识别证件的类别。单峰结构可以指的是大于第二预设分数的置信度分数只有一个,比如,置信度分数大于0.5的置信度分数本文档来自技高网...

【技术保护点】
1.一种证件分类方法,包括:/n获取待识别证件的证件图像;/n采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;/n确定所述置信度分数大于第一预设分数的多个候选证件类型;/n对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;/n分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;/n计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;/n将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。/n

【技术特征摘要】
1.一种证件分类方法,包括:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。


2.如权利要求1所述的方法,所述采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数之后,还包括:
确定所述置信度分数大于第二预设分数的一个候选证件类型;所述第二预设分数大于所述第一预设分数;
将所述置信度分数大于第二预设分数的候选证件类型确定为所述待识别证件的类型。


3.如权利要求1所述的方法,所述分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量之前,还包括:
对所述多个所述候选证件类型中的一个候选证件类型,获取所述一个候选证件类型的多个证件样本;
根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域;
采用卷积神经网络分别提取所述标志区域和所述固定文字区域中的特征向量,得到所述多个证件样本的多个特征向量;
对所述多个特征向量按照区域进行聚类,得到所述标志区域的第一聚类中心向量,以及所述固定文字区域的第二聚类中心向量;
基于所述第一聚类中心向量与所述第二聚类中心向量,得到所述一个候选证件类型对应的第二特征向量。


4.如权利要求1所述的方法,所述对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量,具体包括:
根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域;
采用卷积神经网络提取所述待识别证件的标志区域和所述固定文字区域中的特征向量;
对所述特征向量按照区域进行聚类,得到所述待识别证件的标志区域的第三聚类中心向量,以及所述待识别证件的固定文字区域的第四聚类中心向量;
基于所述第三聚类中心向量与所述第四聚类中心向量,得到所述待识别证件的第一特征向量。


5.如权利要求3所述的方法,所述根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域之前,还包括:
确定所述候选证件边角的四个顶点的初始位置坐标;
根据所述候选证件边角的四个顶点的初始位置坐标将所述候选证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。


6.如权利要求4所述的方法,所述根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域之前,还包括:
确定所述待识别证件边角的四个顶点的初始位置坐标;
根据所述待识别证件边角的四个顶点的初始位置坐标将所述待识别证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。


7.如权利要求1所述的方法,所述采用分类模型对所...

【专利技术属性】
技术研发人员:陈志军甘宇飞
申请(专利权)人:支付宝实验室新加坡有限公司
类型:发明
国别省市:新加坡;SG

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1