一种CNN模型、CNN训练方法以及基于CNN的静脉识别方法技术

技术编号:15864460 阅读:388 留言:0更新日期:2017-07-23 09:42
本发明专利技术公开了一种CNN模型、CNN训练方法以及基于CNN的静脉识别方法,CNN模型包括多个卷积层,一个全连阶层以及SoftMax层;CNN训练过程中首先扩充数据库,结合多种包含相似特征的生物特征数据库,来进行模型的训练;全连接层与SoftMax层共同作为一个多分类的分类器;训练一个多分类的神经网络以使其学习到能够辨别静脉类别的特征;训练完成后,将全连接层的前一层输出作为特征,通过计算这些特征的余弦距离来度量一对图像的相似度。本发明专利技术融合多模态的生物特征数据库用于训练网络,解决了训练样本不足的难题,在超大的身份认证数据库中可以很大的提高检索速度。

【技术实现步骤摘要】
一种CNN模型、CNN训练方法以及基于CNN的静脉识别方法
本专利技术涉及深度学习和静脉识别
,特别涉及一种CNN模型、CNN训练方法以及基于CNN的静脉识别方法。
技术介绍
随着科学技术的发展,生物特征识别技术在某些方面逐渐代替传统的身份认证方法使得人们的生活越来越便利,尤其是其中的手指静脉识别技术越来越受到研究者的重视。因为静脉位于表皮之下不像指纹容易受到外界因素破坏,并且由于肉眼不可见而难以被窃取和伪造,因而具有极高的稳定性和安全性。此外,手指静脉的设备做得轻巧便捷,从而使得手指静脉识别技术具有很大的应用前景,但是目前该技术依旧还存在很多问题亟待解决,如:(1)获取的图像质量相对较低,传统的方法难以获得满意的识别效果;(2)目前的识别算法对较大的旋转和平移等变化较敏感等;当前的指静脉识别通常是依靠手工挑选的特征,这些特征表达能力相对较低,并且不够鲁棒;(3)目前大多数手指静脉识别算法多是基于特定的数据库设计的,很难泛化到其他相类似的数据库库,对应用场景有很大的限制。近几年研究者在静脉特征提取上的工作主要可以分为如下四类:全局统计特征、细节点特征、形状特征和纹理特征。就全局统计特征而言,它主要是基于统计理论对样本进行主成分分析或者线性判别投影,将降维后得到的数据作为特征。例如,有使用PCA和LDA对图像进行降维,然后使用SVM进行分类。有(2D)2PCA算法被用于提取特征,然后使用KNN进行分类。由于PCA和LDA都是线性方法,然而静脉图像识别是一个高度非线性的任务。这些方法很难处理旋转形变等问题。细节点是图像中的一些显著且关键的点,它应该具有很强的辨别性。例如有人提出使用SIFT作为静脉图像的细节点。这种方法在一定程度上可以减轻对仿射变换的影响。但是当图像较模糊时(多数时候静脉图像都是不清晰的),特征点的定位很不稳定。此外,静脉纹路的形状特征上也得到了深入的研究。有人提出使用重复线跟踪法提取静脉的纹路特征、使用均值曲率提取纹路、使用多方向Gabor滤波器提取纹路,或者使用线宽检测提取纹线,然后使用一个椭圆映射归一化因为旋转带来的静脉畸变问题。但由于成像设备问题,静脉图像一般比较模糊,该类方法会遇到与基于细节点特征的方法类似的问题:从模糊图像上提取的特征不够稳定。此外,该类方法对旋转变换同样比较敏感。纹理特征是目前静脉识别的主流研究方向。其中最具有代表性的特征是LBP、WLD、LDP、HOG等。有学者统计带方向的2维高斯滤波器或者Gabor滤波器的响应直方图作为纹理特征表达。相对前面几类特征而言,纹理特征的优势是不再对图像的清晰度敏感,当静脉的纹路不是很清晰时依旧可以依据其他信息进行识别。且这一类特征都具有较高的维度,可以充分发挥机器学习算法优势。但是这些算法仍然是手工选取的特征,其表达和辨别能力有限。近年来,基于深度学习的算法因为其可以学习到更高层的抽象特征,解决很多传统算法难以应对的问题,这使得深度学习算法越来越受研究者青睐。人脸识别、图像分类领域得益于深度学习的引入有了很大的发展。然而由于指静脉识别领域可用的数据库太少,从而限制着深度学习在该领域的应用。也有人首先在指静脉领域做了一些深度学习算法的尝试,但由于数据库太小,其性能并不是很理想。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种CNN模型,减少对训练样本的需求,提高识别性能。本专利技术的另一目的在于提供一种基于上述CNN模型的训练方法,融合多模态的生物特征数据库用于训练网络,解决了训练样本不足的难题。本专利技术的另一目的在于提供一种基于CNN的静脉识别方法,匹配方法只有几个简单的余弦距离的计算,在超大的身份认证数据库中可以很大的提高检索速度。本专利技术的目的通过以下的技术方案实现:一种CNN模型,包括多个卷积堆、卷积层,一个全连阶层以及SoftMax层。优选的,所述CNN模型包括三个卷积堆、三个卷积层。优选的,采用VGGFace-Net的底层三个卷积堆用于提取底层特征。优选的,最后一层卷积层使用3*5大小的形状。一种基于上述CNN模型的训练方法,包括以下步骤:扩充数据库,结合多种包含相似特征的生物特征数据库,来进行模型的训练;底层卷积堆被用于提取样本图像的底层特征,另外卷积层生成静脉识别任务的高层抽象特征;全连接层与SoftMax层共同作为一个多分类的分类器;训练一个多分类的神经网络以使其学习到能够辨别静脉类别的特征。优选的,可以采用样本增广策略进一步扩充数据集。优选的,可以采用旋转策略扩充数据集:对原图旋转±3和±5度共生成4个新样本。优选的,可以采用裁剪策略扩充数据集:对图像用一定大小的矩形在4个角都随机两次不同程度的截取共生成8个新样本。优选的,在模型的训练过程中设置权值衰减为0.01;卷积堆的学习率为0,其余卷积层的学习率从最开始的0.01衰减至1e-9或者当lossvalue不再减小时停止训练。优选的,对训练模型输入图片做去均值处理,采用的输入大小为128×192。一种基于CNN的静脉识别方法,包括以下步骤:训练一个用于区分大类别的CNN模型,通过训练这个模型区分大量的类别可以强迫它学习到更有辨别力的特征,训练完成后,将全连接层的前一层输出作为特征,得到输出的4个多维向量,标记这四个特征向量为f1、f2、f3和f4;首先计算单个特征向量对的余弦距离,如果距离值大于阈值th,则认为这一对特征向量是相似的,否则为不相似;接下来进行整个样本的相似性判断;带有偏移补偿的匹配过程描述如下:对图像A和B采用5种匹配模式,如下式,其中,BIN(·)是一个二值化的操作,它判断单对特征向量之间是否匹配:distij=cos<fAi,fBj>对于匹配模式1,匹配区域对应于图A的特征向量f3&f4及图B的特征向量f1&f2;因此该匹配模式需要计算和的余弦距离以及和的余弦距离,当这两个余弦距离值都满足阈值时,则认为图像A和B是相似的,模式2到模式4的匹配过程与模式1类似;而模式5则采用完全匹配方式,需要计算图像A和B的四个特征向量的余弦值,当这四个余弦距离值都满足阈值时,则认为图像A和B是相似的。优选的,在进行静脉识别时,当一个用户输入手指图像时只需要做一次卷积运算提取注册样本的特征,然后在身份认证数据库中存储大量的注册样本都是以特征的形式存储,识别过程中可以直接在提取的特征的基础上与待识别样本进行对比。本专利技术与现有技术相比,具有如下优点和有益效果:1、本专利技术使用迁移学习的理论设计网络的底层,从而减少对训练样本的需求;设计网络的顶层部分提取包含位置信息的特征,能够提高识别性能,在多个数据库下都获得了优异的性能。2、本专利技术融合多模态的生物特征数据库用于训练网络,解决了训练样本不足的难题。3、本专利技术的匹配方法只有几个简单的余弦距离的计算,在超大的身份认证数据库中可以很大的提高检索速度。附图说明图1是掌静脉、掌纹、指静脉数据库的样本示例。图2是一个CNN网络各层的特征可视化图。图3是同一手指静脉的图像含有部分的偏移示意图。图4是实施例中CNN网络的结构图。图5是实施例中CNN网络特征提取及用于分类的过程示意图。图6是每个特征向量对应的感受野区域。图7是五种匹配模式示意图,第一行表示样本A和B的特征向量之间的对应,第本文档来自技高网
...
一种CNN模型、CNN训练方法以及基于CNN的静脉识别方法

【技术保护点】
一种CNN模型,其特征在于,包括多个卷积层,一个全连阶层以及SoftMax层。

【技术特征摘要】
1.一种CNN模型,其特征在于,包括多个卷积层,一个全连阶层以及SoftMax层。2.根据权力要求1所述的CNN模型,其特征在于,采用VGGFace-Net的底层三个卷积堆用于提取底层特征。3.根据权力要求1所述的CNN模型,其特征在于,最后一层卷积层使用3*5大小的形状。4.一种基于权利要求1所述的模型的CNN训练方法,其特征在于,包括以下步骤:扩充数据库,结合多种包含相似特征的生物特征数据库,来进行模型的训练;底层卷积层被用于提取样本图像的底层特征,另外的卷积层生成静脉识别任务的高层抽象特征;全连接层与SoftMax层共同作为一个多分类的分类器;训练一个多分类的神经网络以使其学习到能够辨别静脉类别的特征。5.根据权力要求4所述的CNN训练方法,其特征在于,可以采用样本增广策略进一步扩充数据集。6.根据权力要求4所述的CNN训练方法,其特征在于,可以采用旋转策略扩充数据集:对原图旋转±3和±5度共生成4个新样本。7.根据权力要求4所述的CNN训练方法,其特征在于,可以采用裁剪策略扩充数据集:对图像用一定大小的矩形在4个角都随机两次不同程度的截取共生成8个新样本。8.根据权力要求4所述的CNN训练方法,其特征在于,对训练模型输入图片做去均值处理,采用的输入大小为128×192。9.一种基于权利要求1所述的模型的静脉识别方法,其特征在于,包括以下步骤:训练一个用于区分大类别的CNN模型,通过训练这个模型区分大量的类别可以强迫它学习到更有辨别力的特征,训练完成后,将全连接层的前一层输出作为特征,得到输出的4个多维向量,标...

【专利技术属性】
技术研发人员:胡慧康文雄邓飞其
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1