当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于多尺度池化的卷积神经网络人脸识别方法技术

技术编号:13771698 阅读:63 留言:0更新日期:2016-09-29 17:02
本发明专利技术公开了一种基于多尺度池化的卷积神经网络人脸识别方法。该方法利用多尺度池化的卷积神经网络来提取人脸图像的特征以实现人脸识别。在构建卷积神经网络的过程中,采用卷积和最大值采样交替的方法对特征进行深度提取,另外对每层卷积层采用了多尺度池化的策略和步骤,一并输入到全连接层,使其具有多尺度的、固定大小的特征列向量。本发明专利技术不需要对输入的人脸图像做截取或调整尺寸,不同尺寸的图像都能使用同一个网络进行训练和识别。基于多尺度池化的卷积神经网络不但解决了输入图像尺寸可以不固定的问题,使得网络能够提取多尺度的人脸特征,而且对网络性能带来极大的提升,将会促进多尺度池化的卷积神经网络在人脸识别中的广泛应用。

【技术实现步骤摘要】

本专利技术属于深度学习、人脸识别领域,涉及一种基于多尺度池化的卷积神经网络人脸识别方法
技术介绍
人脸识别是一门融合生物学、心理学和认知科学等多学科的生物识别技术,运用多类技术如模式识别、图像处理和计算机视觉等,在金融、安防监控、身份识别、社交娱乐与沟通等领域具有得到广泛的市场应用前景。目前,国内外对人脸识别的技术研究主要围绕特征提取和分类算法这两个方向展开。基于深度卷积神经网络的人脸识别技术已经非常成熟,但传统的卷积神经网络的输入人脸图像的尺寸都是固定的(例如:256*256),这是因为利用BP反向传播算法更新权重和偏置时需要全连接层有固定输入维度,但对卷积层和池化层的输入的尺寸可以是任意。因此面对输入人脸图像尺寸不同时,往往需要对输入图像做截取和固定尺寸的操作,这种人工改变输入人脸图像的尺寸破坏原图像的尺度和长宽比例,会导致部分重要信息的丢失。
技术实现思路
本专利技术目的在于针对现有人脸识别技术的不足,提供一种基于多尺度池化的卷积神经网络人脸识别方法。整个网络分为3大部分,输入层,特征提取层和输出层,其中特征提取层细分为交替连接的3个卷积层与3个池化层和一个全连接层。最后一个池化层采用了多尺度池化的策略和步骤,使得输入到全连接层的是固定大小的特征列向量,最终使得网络可以利用BP反向传播算法进行有监督的训练。本专利技术不需要提前对输入的人脸图像做截取或固定大小,采用卷积和最大值池化交替的方法对特征进行深度提取,直到最后一层池化采用多尺度的方法使得全连接层前的输入具有固定的大小,全连接层后输入softmax分类器输出类别标签信息以实现人脸识别。多尺度池化结构使得不同尺寸、大小和长宽比的输入图像都能使用同一个网络进行训练和识别分类。通过自动调整池化的采样尺寸和步长获得固定输出大小的特征矩阵。对比传统的滑动池化采样窗口采用单一的采样尺寸,多尺度的池化能够获得多尺度的人脸特征,使得网络对目标形变具有较好的鲁棒性,不但解决了输入图像尺寸不固
定的问题还带来网络性能的极大提升。本专利技术的目的是通过以下技术方案来实现的:一种基于多尺度池化的卷积神经网络人脸识别方法,包括以下步骤:(1)采集t个人的标准人脸灰度图,其中每个人采集d张,得到d×t张标准人脸灰度图作为训练图像;每张训练图像对应一个t×1维的二值人脸类别标记向量ylable=[y1 y2 y3 … yt]T,其中第n个人脸图像的类别标签向量ylable中元素yi应满足以下条件: y i = 1 i = n y i = 0 i ≠ n ]]>(2)卷积神经网络参数初始化:所述卷积神经网络包含输入层I1、卷积层C2、池化层S3、卷积层C4、池化层S5、卷积层C6、多尺度池化层S7、多尺度池化层S8、多尺度池化层S9、全连接层L10、输出层O11;按照0为均值,0.01为标准方差的高斯分布来随机初始化卷积层C2的k个a×a像素的小块作为卷积核模板,定义为权重i=1,j=1,2,...,k;此外对应位置的偏置j=1,2,...,k初始化为0;类似的,随机初始化卷积层C4的p个b×b大小的卷积核模板,定义为权重i=1,2,...,k,j=1,2,...,p和对应位置的偏置j=1,2,...,p;随机初始化卷积层C6的q个c×c大小的卷积核模板,定义为权重i=1,2,...,p,j=1,2,...,q和对应位置的偏置j=1,2,...,q。所有的权重Kij和偏置bj都是可训练的网络参数;(3)输入层I1:对输入大小为w×h的图像X(w,h不固定)的所有像素xi进行减均值和归一化的预处理,将预处理后的图像Xin作为输入层。(4)卷积层C2:由k个不同的特征图谱j=1,2,...,k组成,每个特征图谱由输入图像Xin分别与k个卷积核模板Kij进行卷积运算,卷积结果加上偏置bj,再经过一个激活函数ReLU(·)得到;每个特征图谱具体计算公式为: X j C 2 = Re L U ( X i n ⊗ K i j C 2 + b j C 2 ) = max ( 0 , 本文档来自技高网
...

【技术保护点】
一种基于多尺度池化的卷积神经网络人脸识别方法,其特征在于,该方法包括以下步骤:(1)采集t个人的标准人脸灰度图,其中每个人采集d张,得到d×t张标准人脸灰度图作为训练图像;每张训练图像对应一个t×1维的二值人脸类别标记向量ylable=[y1 y2 y3 … yt]T,其中第n个人脸图像的类别标签向量ylable中元素yi应满足以下条件:yi=1i=nyi=0i≠n]]>(2)卷积神经网络参数初始化:所述卷积神经网络包含输入层I1、卷积层C2、池化层S3、卷积层C4、池化层S5、卷积层C6、多尺度池化层S7、多尺度池化层S8、多尺度池化层S9、全连接层L10、输出层O11;按照0为均值,0.01为标准方差的高斯分布来随机初始化卷积层C2的k个a×a像素的小块作为卷积核模板,定义为权重此外对应位置的偏置初始化为0;类似的,随机初始化卷积层C4的p个b×b大小的卷积核模板,定义为权重和对应位置的偏置随机初始化卷积层C6的q个c×c大小的卷积核模板,定义为权重和对应位置的偏置所有的权重Kij和偏置bj都是可训练的网络参数。(3)输入层I1:对输入大小为w×h的图像X(w,h不固定)的所有像素xi进行减均值和归一化的预处理,将预处理后的图像Xin作为输入层。(4)卷积层C2:由k个不同的特征图谱组成,每个特征图谱由输入图像Xin分别与k个卷积核模板Kij进行卷积运算,卷积结果加上偏置bj,再经过一个激活函数ReLU(·)得到;每个特征图谱具体计算公式为:XjC2=ReLU(Xin⊗KijC2+bjC2)=max(0,Xin⊗KijC2+bjC2),i=1,j=1,2,...,k]]>其中代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x);的大小均为(h‑a+1)×(w‑a+1)。(5)池化层S3:采用最大值采样对卷积层C2得到的结果进行统计计算。采样尺寸为m,采样方法为取采样区域的最大值,采样区域不重叠;池化层S3的每个特征图谱由卷积层C2的每个特征图谱下采样得到。采样后的水平和垂直空间分辨率变为原来的1/m,大小为(h‑a+1/m)×(w‑b+1/m)。(6)卷积层C4:特征图谱通过卷积操作,由k个扩展至p个;特征图谱之间采用完全连接的机制,即卷积层C4的每个特征图谱都与前一层的k个特征图谱连接,相连接的区域进行卷积操作,卷积结果加和并且加入偏置,再经过激活函数ReLU(·)得到;每个特征图谱具体计算公式为:XjC4=ReLU(ΣXiS3⊗KijC4+bjC4)=max(0,ΣXiS3⊗KijC4+bjC4),i=1,2...,k,j=1,2,...,p]]>其中代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x)。(7)池化层S5:采用最大值采样,采样尺寸为n,采样方法为取采样区域的最大值,采样区域不重叠,采样后得到的p个特征图谱的水平和垂直空间分辨率变为原来的1/n。(8)卷积层C6:特征图谱通过卷积操作,由p个扩展至q个;特征图谱之间采用完全连接的机制,每个特征图谱具体计算公式为:XjC6=ReLU(ΣXiS5⊗KijC6+bjC6)=max(0,ΣXiS5⊗KijC6+bjC6),i=1,2...,p,j=1,2,...,q]]>其中代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x)。(9)多尺度池化层S7:对卷积层C6的q个特征图谱进行三种不同尺度size和步长stride的采样,使得输出空间块大小固定为1×1×q,2×2×q,3×3×q,具体计算公式如下:其中,分别表示向上取整和向下取整,r×s为输入图像经过卷积层C6后得到的每个特征图谱的大小;按照列的顺序展开得到1×q,4×q,9×q的特征矩阵,最后依次级联,成为固定尺寸的(14×q)×1特征列向量。(10)多尺度池化层S8:类似步骤(9)对卷积层C2的k个特征图谱进行三种不同尺度和步长的采样,使得成为固定尺寸的(14×k)×1特征列向量。(11)多尺度池化层S9:类似步骤(9)对卷积层C4的p个特征图谱进行三种不同尺度和步长的采样,使得成为固定尺寸的(14×p)×1特征列向量。(12)全连接层L10:3个多尺度池化层得到的特征列向量均通过全连接方式得到输出表达列向量Xfc,大小为f×1,f<(14×k)。(13)输出层O11:全连接层L10得到的输出表达列向量Xfc,输入至t维的soft‑max分类器,得到分类结果标签向量youtput,最大值元素所在标号表示该图像属于该类别标签的人脸。(14)对于步骤(1)采集的d×t...

【技术特征摘要】
1.一种基于多尺度池化的卷积神经网络人脸识别方法,其特征在于,该方法包括以下步骤:(1)采集t个人的标准人脸灰度图,其中每个人采集d张,得到d×t张标准人脸灰度图作为训练图像;每张训练图像对应一个t×1维的二值人脸类别标记向量ylable=[y1 y2 y3 … yt]T,其中第n个人脸图像的类别标签向量ylable中元素yi应满足以下条件: y i = 1 i = n y i = 0 i ≠ n ]]>(2)卷积神经网络参数初始化:所述卷积神经网络包含输入层I1、卷积层C2、池化层S3、卷积层C4、池化层S5、卷积层C6、多尺度池化层S7、多尺度池化层S8、多尺度池化层S9、全连接层L10、输出层O11;按照0为均值,0.01为标准方差的高斯分布来随机初始化卷积层C2的k个a×a像素的小块作为卷积核模板,定义为权重此外对应位置的偏置初始化为0;类似的,随机初始化卷积层C4的p个b×b大小的卷积核模板,定义为权重和对应位置的偏置随机初始化卷积层C6的q个c×c大小的卷积核模板,定义为权重和对应位置的偏置所有的权重Kij和偏置bj都是可训练的网络参数。(3)输入层I1:对输入大小为w×h的图像X(w,h不固定)的所有像素xi进行减均值和归一化的预处理,将预处理后的图像Xin作为输入层。(4)卷积层C2:由k个不同的特征图谱组成,每个特征图谱由输入图像Xin分别与k个卷积核模板Kij进行卷积运算,卷积结果加上偏置bj,再经过一个激活函数ReLU(·)得到;每个特征图谱具体计算公式为: X j C 2 = Re L U ( X i n ⊗ K i j C 2 + b j C 2 ) = max ( 0 , X i n ⊗ K i j C 2 + b j C 2 ) , i = 1 , j = 1 , 2 , ... , k ]]>其中代表步长为1的卷积运算,激活函数ReLU(x)=max(0,x);的大小均为(h-a+1)×(w-a+1)。(5)池化层S3:采用最大值采样对卷积层C2得到的结果进行统计计算。采样尺寸为m,采样方法为取采样区域的最大值,采样区域不重叠;池化层S3的每个特征图谱由卷积层C2的每个特征图谱下采样得到。采样后的水平和垂直空间分辨率变为原来的1/m,大小为(h-a+1/m)×(w-b+1/m)。(6)卷积层C4:特征图谱通过卷积操作,由k个扩展至p个;特征图谱之间采用完全连接的机制,即卷积层C4的每个特征图谱都与前一层的k个特征图谱连接,相连接的区域进行卷积操作,卷积结果加和并且加入偏置,再经过激活函数ReLU(·)得到;每个特征图谱具体计算公式为: X j C 4 = Re L U ( ΣX i S 3 ⊗ K i j C 4 + b j C 4 ...

【专利技术属性】
技术研发人员:刘云海吴斯
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1