一种基于多层神经网络的虹膜分割方法技术

技术编号:36507993 阅读:22 留言:0更新日期:2023-02-01 15:34
一种基于多层神经网络的虹膜分割方法,属于虹膜分割方法技术领域。它包括以下步骤:1:获取虹膜分割的样本集;2:读取虹膜分割的样本数据,进行图片预处理;3:将数据集划分成训练集和测试集;4:构建虹膜分割模型;5:设置对于模型训练的损失函数;6:对虹膜分割模型进行训练。本发明专利技术使用深度可分离卷积作为模型的编码层,减小了模型参数量和计算量;使用空间金字塔池化和多核池化结合的注意力层,通过获取多个输入的上下文信息,增加了模型的感受野;使用注意力模块对编码层的输出进行处理并和解码层相拼接结合,抑制了图像中的不相关区域,并且突出了局部区域的显著特征,提升了模型对于虹膜的分割精度。于虹膜的分割精度。于虹膜的分割精度。

【技术实现步骤摘要】
一种基于多层神经网络的虹膜分割方法


[0001]本专利技术属于虹膜分割方法
,具体涉及一种基于多层神经网络的虹膜分割方法。

技术介绍

[0002]近年来人工智能技术的快速发展,神经网络为图像分割领域的应用提供了一种新的研究方向。基于神经网络的图像分割,可以根据是对带有语义标签的图像像素分类问题,或是对图像中单个对象的分割问题,分为语义分割和实例分割,其基本形式是对图像像素使用一组对象的类别进行像素标记,形成不同对象的分割图像。
[0003]图像分割常被运用在很多不同领域,如信息安全领域,如何在海量信息中保护个人隐私,防止被他人利用而造成重大损失等此类问题越来越受到人们的关注,其中身份认证是信息安全的重要组成部分。
[0004]常见的身份识别方式,如身份证、智能卡、指纹识别、人脸识别等,均存在不同方面的缺点,如易丢失、易盗取、易干扰等,容易产生个人隐私被泄露的风险,无法满足在日益增长的大数据下个人身份信息和隐私得到保障的需求。相较于以上身份认证方式存在的缺点,虹膜是人体独一无二存在,且不会随着人的发育而改变,其高度的独特性和不可更改性等特点,使虹膜识别被认为是最安全的生物识别技术之一,可靠性高、隐私性强、不需要物理接触等特点,使虹膜识别比其他身份识别技术拥有更好的可用性。
[0005]一个完整的虹膜认证系统通常包括虹膜图像采集、虹膜分割定位、虹膜特征提取、虹膜数据库匹配等操作过程。其中,虹膜分割是虹膜认证系统中重要的部分,其准确性会直接导致在虹膜数据库中是否能成功认证。但是由于在复杂场景下采集的虹膜图像具有大量的噪声和干扰,且基于深度学习的虹膜分割网络模型参数量大,比传统方法计算耗时,需要消耗大量的计算资源,使虹膜分割方法面临在实际应用中许多挑战。因此,如何设计一个安全、准确、稳定、参数量适当且计算快速的虹膜分割方法是一个亟待解决瓶颈问题。
[0006]现有的虹膜分割方法可以大致分为两种,基于虹膜边界的分割和基于虹膜图像像素的分割。基于虹膜边界的分割通常使用微分积分算子计算图像中偏导数最大值来定位虹膜边界,实现虹膜分割,然而基于边界的方法高度依赖于用户合作环境,在非合作环境下复杂且变换的背景会影响算法的准确度,难以满足日益增长的虹膜识别需求。在基于虹膜图像像素的分割中,基于深度学习的像素级图像分割算法显示出更加优越的性能,通过对虹膜和非虹膜像素进行分类,筛选出虹膜前景和无关背景,输出对应分割图像,然而模型参数量大、学习不充分、计算时间长等缺点,降低了虹膜分割效率。

技术实现思路

[0007]本专利技术的目的在于针对现有神经网络技术无法有效获取虹膜的特征信息、计算量大、计算速度慢的问题,提出一种基于深度可分离卷积和注意力机制的虹膜分割方法,能够提高人体虹膜分割的准确度和分割速度。
[0008]本专利技术提供如下技术方案:
[0009]一种基于多层神经网络的虹膜分割方法,包括以下步骤:
[0010]步骤1:获取虹膜分割的样本集;
[0011]步骤2:读取虹膜分割的样本数据,进行图片预处理;
[0012]步骤3:将预处理后的虹膜分割数据集划分成训练集和测试集;
[0013]步骤4:构建基于深度可分离卷积和注意力机制的虹膜分割模型,虹膜分割模型包括编码层、注意力层和解码层;
[0014]步骤5:设置对于模型训练的损失函数;
[0015]步骤6:使用Pytorch框架对基于深度可分离卷积和注意力机制的虹膜分割模型进行训练。
[0016]进一步的,所述编码层中每一层通过两次深度可分离卷积模块,再通过下采样卷积层将输入大小缩小一倍的同时,将输入特征通道增加一倍;所述深度可分离卷积模块包括3
×
3的卷积、批标准化、Relu函数、1
×
1卷积、批标准化和ReLu函数。
[0017]进一步的,所述解码层中采用2
×
2反卷积将输入大小增加一倍的同时,使用3
×
3卷积、批标准化和LeakyRelu函数将输入特征通道减小一倍,输出O1;同时采用注意力模块将编码层中对应相同输出通道大小的输出O2通过1
×
1卷积和批标准化后输出W2,将O1同样经过1
×
1卷积和批标准化后输出W1,然后将W1和W2相加后通过LeakyRelu函数输出W3,将W3通过1
×
1卷积、批标准化和Sigmoid函数后输出W4,将W4和O2相乘输出O3,最后将O1和O3进行拼接形成O4即为该层解码层的输出。
[0018]进一步的,所述注意力层采用空间金字塔池化和全局平均池化获得池化输出后,后接多核池化充分提取该层输入的上下文特征信息;所述空间金字塔池化采用空洞卷积,使用3
×
3的卷积核和1
×
1的卷积核的不同并行组合,能够获取多个输入的上下文信息,增加模型感受野。
[0019]进一步的,所述注意力层信息处理的过程如下:
[0020]空间金字塔池化的输入F1在通过一组空洞卷积并行计算后,其中d为卷积核的感受野,同时采用全局平均池化一同并行处理输出F2;
[0021]F2经过3
×
3卷积和Signoid函数后和F1点乘生成F3,将F3和F1进行相加后经过3
×
3卷积、批标准化和LeakyRelu函数生成F4;
[0022]多核池化依靠多个有效视场获取不同的全局信息,对全局信息进行不同大小接收场的上下文信息编码;分别采用一组最大池化卷积对F4进行处理,然后分别使用1
×
1卷积和反卷积层,过滤噪声干扰的同时保证输出大小和输入一致,将4个输出拼接后输出F5,然后将F4和F5进行拼接后经过一层1
×
1卷积层输出F6。
[0023]进一步的,图像在经过编码层、注意力层和解码层后,通过1
×
1卷积、批处理化、LeakyRelu函数和Sigmoid函数后,输出模型预测的分割图像。
[0024]进一步的,所述步骤5中,基于深度可分离卷积和注意力机制的虹膜分割模型采用binary cross entropy函数作为损失函数,公式如下:
[0025][0026]其中,L
n


w
×
(tar get
×
ln(pt)+(1

tar get)
×
ln(1

pt))
[0027]式中,N为样本的数量,w为权重值,target为标签值,pt为模型的预测值。
[0028]通过采用上述技术,与现有技术相比,本专利技术的有益效果如下:
[0029]本专利技术使用深度可分离卷积作为模型的编码层,减小了模型参数量和计算量;使用空间金字塔池化和多核池化结合的注意力层,通过获取多个输入的上下文信息,增加了模型的感受野;使用注意力模块对编码层的输出进行处理并和解码层相拼接结合,抑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多层神经网络的虹膜分割方法,其特征在于:包括以下步骤:步骤1:获取虹膜分割的样本集;步骤2:读取虹膜分割的样本数据,进行图片预处理;步骤3:将预处理后的虹膜分割数据集划分成训练集和测试集;步骤4:构建基于深度可分离卷积和注意力机制的虹膜分割模型,虹膜分割模型包括编码层、注意力层和解码层;步骤5:设置对于模型训练的损失函数;步骤6:使用Pytorch框架对基于深度可分离卷积和注意力机制的虹膜分割模型进行训练。2.根据权利要求1所述的一种基于多层神经网络的虹膜分割方法,其特征在于所述编码层中每一层通过两次深度可分离卷积模块,再通过下采样卷积层将输入大小缩小一倍的同时,将输入特征通道增加一倍;所述深度可分离卷积模块包括3
×
3的卷积、批标准化、Relu函数、1
×
1卷积、批标准化和ReLu函数。3.根据权利要求1所述的一种基于多层神经网络的虹膜分割方法,其特征在于所述解码层中采用2
×
2反卷积将输入大小增加一倍的同时,使用3
×
3卷积、批标准化和LeakyRelu函数将输入特征通道减小一倍,输出O1;同时采用注意力模块将编码层中对应相同输出通道大小的输出O2通过1
×
1卷积和批标准化后输出W2,将O1同样经过1
×
1卷积和批标准化后输出W1,然后将W1和W2相加后通过LeakyRelu函数输出W3,将W3通过1
×
1卷积、批标准化和Sigmoid函数后输出W4,将W4和O2相乘输出O3,最后将O1和O3进行拼接形成O4即为该层解码层的输出。4.根据权利要求1所述的一种基于多层神经网络的虹膜分割方法,其特征在于所述注意力层采用空间金字塔池化和全局平均池化获得池化输出后,后接多核池化充分提取该层输入的上下文特征信息;所述空间金字塔池化采用空洞卷积,使用3
×
3...

【专利技术属性】
技术研发人员:王丽萍翁杭立
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1