基于全卷积神经网络的虹膜分割方法和装置、介质和设备制造方法及图纸

技术编号:33344571 阅读:25 留言:0更新日期:2022-05-08 09:36
本发明专利技术公开了一种基于全卷积神经网络的虹膜分割方法和装置、介质和设备。在一个具体的实施例中,所述方法包括将预处理后的虹膜图像输入训练好的压缩模型,进行预处理后的虹膜图像中的特征提取得到压缩虹膜特征P;将压缩虹膜特征P作为注意力模块的输入,为所述虹膜图像的不同像素分配不同的权重W,最终输出虹膜特征P

【技术实现步骤摘要】
基于全卷积神经网络的虹膜分割方法和装置、介质和设备


[0001]本专利技术涉及互联网应用
更具体地,涉及一种基于全卷积神经网络的虹膜分割方法和装置、介质和设备。

技术介绍

[0002]近年来,通过生物识别来进行身份验证在银行、边境、门禁控制等安全领域中越来越普遍,包括指纹识别、人脸识别、虹膜识别等生物识别技术已经广泛地出现在我们的生活中。在各类生物识别信息中,虹膜因为其高可靠性、高稳定性以及非接触性,受到了很多研究者的关注。虹膜识别主要包括虹膜获取、虹膜分割、归一化、虹膜编码、虹膜匹配五个步骤。其中虹膜分割是指从获取到的虹膜图片中分割出虹膜区域。作为后续识别过程的基础,虹膜分割对整个虹膜识别过程的速度和准确率都有重要影响。
[0003]传统的虹膜分割算法主要依靠数字图像处理技术,根据虹膜图像的灰度和梯度信息来进行分割,以微分

差分算法和霍夫变换算法为主要代表。传统方法的主要问题在于参数空间非常大,带来了大量的计算耗时。同时传统方法只能处理高质量的虹膜图片,需要用户在虹膜获取过程中高度配合,否则睫毛、眼睑等的遮挡,以及反光、阴影等都会影响到计算结果。
[0004]随着人工智能的发展,深度学习技术在计算机视觉的各项任务中取得了超越传统方法的表现。虹膜分割作为计算机视觉的任务之一,也在被积极探索着使用深度学习技术的可能性。但是不同于一般的图像分割任务,虹膜分割对于算法的准确率、鲁棒性、实时性都有着极高的要求。另外大部分基于深度学习的虹膜分割方法只能得到虹膜掩码,为了进行后续的归一化,还需要使用其他方式在虹膜掩码的基础上得到虹膜内外边界的信息,这种方式区别于以往算法的先得到内外边界再得到虹膜掩码,对于遮挡严重的情况很容易出现定位错误。

技术实现思路

[0005]为了解决上述问题,本专利技术的目的在于提供一种基于全卷积神经网络的虹膜分割方法和装置、介质和设备。
[0006]为达到上述目的,本专利技术采用下述技术方案:
[0007]本专利技术第一方面提供了一种基于全卷积神经网络的虹膜分割方法,所述方法包括:
[0008]对采集到的虹膜图像进行预处理;
[0009]将预处理后的虹膜图像输入训练好的压缩模型,进行所述预处理后的虹膜图像中的特征提取得到压缩虹膜特征P;
[0010]将所述压缩虹膜特征P作为注意力模块的输入,为所述虹膜图像的不同像素分配不同的权重W,最终输出虹膜特征P


[0011]将所述虹膜特征P

作为训练好的扩张模型的输入,进行上采样并在通道维度上与
所述压缩模型中对应的特征融合将虹膜图像扩张至原始输入大小;
[0012]对所述扩张模型的输出结果进行通道分离,得到虹膜掩码、瞳孔掩码和虹膜外边界;
[0013]通过后处理对所述虹膜掩码、瞳孔掩码和虹膜外边界进行优化去除噪声,得到最终的虹膜掩码和虹膜内外边界信息。
[0014]进一步地,所述对采集到的虹膜图像进行预处理包括:
[0015]使用均值消减法对所述采集到的虹膜图像进行预处理,从而凸显虹膜特征,并通过中心裁剪和/或缩放的方式对所述虹膜图像的尺寸进行调整以得到预设尺寸的虹膜图像。
[0016]进一步地,所述训练好的压缩模型的结构如下:
[0017]第一层为卷积层,包括64个尺寸为3*3*3的卷积核,步长为1,该层使用SAME模式填充,以保证卷积前后特征大小不变,只有通道数变化;
[0018]第二层为卷积层,包括64个尺寸为3*3*64的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output0;
[0019]第三层为最大池化层,其步长为2,大小为2*2;
[0020]第四层为卷积层,包括128个尺寸为3*3*64的卷积核,步长为1,该层使用SAME模式填充;
[0021]第五层为卷积层,包括128个3*3*128的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output1;
[0022]第六层为最大池化层,其步长为2,大小为2*2;
[0023]第七层为卷积层,其包括256个3*3*128的卷积核,步长为1,该层使用SAME模式填充;
[0024]第八层为卷积层,其包括256个3*3*256的卷积核,步长为1,该层使用SAME模式填充;
[0025]第九层为卷积层,其包括256个3*3*256的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output2;
[0026]第十层为最大池化层,其步长为2,大小为2*2;
[0027]第十一层为卷积层,其包括512个3*3*256的卷积核,步长为1,该层使用SAME模式填充;
[0028]第十二层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充;
[0029]第十三层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output3;
[0030]第十四层为最大池化层,其步长为2,大小为2*2;
[0031]第十五层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充;
[0032]第十六层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充;
[0033]第十七层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式
填充,其输出矩阵为压缩虹膜特征P;
[0034]其中,每个卷积层后面都跟随一个ReLU激活函数。
[0035]进一步地,所述将所述压缩虹膜特征P作为注意力模块的输入,为所述虹膜图像的不同像素分配不同的权重包括:
[0036]使用全局平均池化,得到压缩虹膜特征P的全局平均值AdaptiveAvgPool(P),然后用由256个尺寸为1*1*512的卷积核组成的卷积层进行卷积,接着用线性插值进行上采样,将全局平均值AdaptiveAvgPool(P)恢复至原始大小,计算公式为:
[0037]G(P)=Up(Conv1×1(AdaptiveAvgPool(P)))
……
(1)
[0038]其中,Conv1×1(AdaptiveAvgPool(P))表示卷积层的输出结果;
[0039]Up(Conv1×1(AdaptiveAvgPool(P)))表示上采样输出结果;
[0040]用256个尺寸为1*1*512的卷积核对所述压缩虹膜特征P进行卷积,最后一个卷积层的输出为D1(P):
[0041]D1(P)=Conv1×1(P)
……
(2)
[0042]分别使用空洞率为6、12、18的空洞卷积对所述压缩虹膜特征P进行卷积,3个空洞卷积分别包括256个尺寸为3*3*512的卷积核:
[0043][0044][0045]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于全卷积神经网络的虹膜分割方法,其特征在于,所述方法包括:对采集到的虹膜图像进行预处理;将预处理后的虹膜图像输入训练好的压缩模型,进行所述预处理后的虹膜图像中的特征提取得到压缩虹膜特征P;将所述压缩虹膜特征P作为注意力模块的输入,为所述虹膜图像的不同像素分配不同的权重W,最终输出虹膜特征P

;将所述虹膜特征P

作为训练好的扩张模型的输入,进行上采样并在通道维度上与所述压缩模型中对应的特征融合将虹膜图像扩张至原始输入大小;对所述扩张模型的输出结果进行通道分离,得到虹膜掩码、瞳孔掩码和虹膜外边界;通过后处理对所述虹膜掩码、瞳孔掩码和虹膜外边界进行优化去除噪声,得到最终的虹膜掩码和虹膜内外边界信息。2.根据权利要求1所述的方法,其特征在于,所述对采集到的虹膜图像进行预处理包括:使用均值消减法对所述采集到的虹膜图像进行预处理,从而凸显虹膜特征,并通过中心裁剪和/或缩放的方式对所述虹膜图像的尺寸进行调整以得到预设尺寸的虹膜图像。3.根据权利要求1所述的方法,其特征在于,所述训练好的压缩模型的结构如下:第一层为卷积层,包括64个尺寸为3*3*3的卷积核,步长为1,该层使用SAME模式填充,以保证卷积前后特征大小不变,只有通道数变化;第二层为卷积层,包括64个尺寸为3*3*64的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output0;第三层为最大池化层,其步长为2,大小为2*2;第四层为卷积层,包括128个尺寸为3*3*64的卷积核,步长为1,该层使用SAME模式填充;第五层为卷积层,包括128个3*3*128的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output1;第六层为最大池化层,其步长为2,大小为2*2;第七层为卷积层,其包括256个3*3*128的卷积核,步长为1,该层使用SAME模式填充;第八层为卷积层,其包括256个3*3*256的卷积核,步长为1,该层使用SAME模式填充;第九层为卷积层,其包括256个3*3*256的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output2;第十层为最大池化层,其步长为2,大小为2*2;第十一层为卷积层,其包括512个3*3*256的卷积核,步长为1,该层使用SAME模式填充;第十二层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充;第十三层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充,其输出矩阵记为output3;第十四层为最大池化层,其步长为2,大小为2*2;第十五层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充;第十六层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充;第十七层为卷积层,其包括512个3*3*512的卷积核,步长为1,该层使用SAME模式填充,
其输出矩阵为压缩虹膜特征P;其中,每个卷积层后面都跟随一个ReLU激活函数。4.根据权利要求1所述的方法,其特征在于,所述将所述压缩虹膜特征P作为注意力模块的输入,为所述虹膜图像的不同像素分配不同的权重包括:使用全局平均池化,得到压缩虹膜特征P的全局平均值AdaptiveAvgPool(P),然后用由256个尺寸为1*1*512的卷积核组成的卷积层进行卷积,接着用线性插值进行上采样,将全局平均值AdaptiveAvgPool(P)恢复至原始大小,计算公式为:G(P)=Up(Conv1×1(AdaptiveAvgPool(P)))
……
(1)其中,Conv1×1(AdaptiveAvgPool(P))表示卷积层的输出结果;Up(Conv1×1(AdaptiveAvgPool(P)))表示上采样输出结果;用256个尺寸为1*1*512的卷积核对所述压缩虹膜特征P进行卷积,最后一个卷积层的输出为D1(P):D1(P)=Conv1×1(P)
……
(2)分别使用空洞率为6、12、18的空洞卷积对所述压缩虹膜特征P进行卷积,3个空洞卷积分别包括256个尺寸为3*3*512的卷积核:分别包括256个尺寸为3*3*512的卷积核:分别包括256个尺寸为3*3*512的卷积核:将所述各卷积层的输出结果G(P)、D1(P)、D2(P)、D3(P)和D4(P)在通道维度上进行拼接,然后进行两次卷积,并用sigmoid()激活函数进行激活,得到注意力机制的输出权重W:W=Sigmoid(Conv3×3(Conv3×3(H)))
……
(7)其中符号表示在通道...

【专利技术属性】
技术研发人员:张颖捷
申请(专利权)人:北京无线电计量测试研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1