当前位置: 首页 > 专利查询>中北大学专利>正文

一种基于注意力机制的姿态变化人脸识别方法技术

技术编号:33534836 阅读:57 留言:0更新日期:2022-05-19 02:13
本发明专利技术公开了一种基于注意力机制的姿态变化人脸识别方法,首先对自然场景下带有人脸的图像数据进行标注,并将其分为训练集以及测试集;然后将双面注意力机制模块LA

【技术实现步骤摘要】
一种基于注意力机制的姿态变化人脸识别方法


[0001]本专利技术涉及模式识别
,具体为一种基于注意力机制的姿态变化人脸识别方法。

技术介绍

[0002]作为计算机视觉中重要的一个方向,人脸识别利用计算机技术对于图像或者视频中的人脸信息进行识别,并从中提取最为关键的视觉特征信息作为具体特征,最终由此判别身份信息。虽然目前人脸识别精度已经较高,但对于处理姿态变化较大的图像时,大多数的人脸识别算法的精度还是相对下降。这也意味着姿态变化成为了人脸识别领域的一项重要挑战,因此如何准确识别不同姿态变化影响的人脸成为了人脸识别领域的关键问题。
[0003]为了克服姿态变化对于人脸识别的影响,科研人员为此进行了不懈研究。其中最重要的方式就是收集不同姿态变化影响下的人脸数据集,比如YouTubeFace,这种使用大量数据集训练出来的人脸识别模型对于图像有着较好的自适应能力和拟合能力,但收集数据集的过程将耗费大量的物力、人力,从而造成不必要的资源浪费。另外一种重要的方式就是通过正面图像生成不同角度的人脸来解决训练样本少的人脸识别问题。比如Blanz 和Vetter提出的:三维形变模型(3DMM)建立在三维人脸数据库的基础上考虑姿态变化等影响,因而生成的三维人脸模型精度高。但这种方式对于三维模型的精度要求较高,而且三维建模的时间较长,模型优化也比较复杂。还有一个重要的方式就是为每一种不同的姿态设计相应的人脸识别网络,在测试的时候图像自适应的选择合适网络,然后将不同网络的结果整合。但是该方法存在很大的缺陷:它需要以对每个人脸的多个视角都进行采集形成多视图。而这在许多实际场合中是不可能办到的,往往仅能得到前视图或其它姿态的单视图。

技术实现思路

[0004]本专利技术的目的在于提供一种基于注意力机制的姿态变化人脸识别方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于注意力机制的姿态变化人脸识别方法,包括以下步骤:步骤一:将采集的数据集分为训练数据集以及测试数据集,并对选中的训练数据集进行数据预处理;步骤二:将步骤一中训练集的图像剪裁成112*112的图像块;步骤三:设计基于注意力机制的卷积神经网络;步骤四:训练基于注意力机制的卷积神经网络。
[0006]优选的,所述步骤三具体包括如下步骤:3.1:设计双面注意力机制模块LA

SENet:注意力机制模块包括:LANet空间注意模块以及SENet通道注意模块,用于突出在姿态变化下的人脸最具有区分性的特征信息;3.2:设计倒置残差结构:设计基于MobileNetV2的倒置残差结构的Bottleneck

attention,即先扩张通道数后压缩用于减少计算量;3.3:构建多尺度特征融合模块:多尺度特征融合模块由特征融合模块连接以及上下采样模块连接而成;3.4:构建全局平均池化模块:全局平均池化模块由由GDConv以及Linear Conv所构成;3.5:搭建基于MobileFaceNet模型为主体的注意力机制网络,基于注意力机制的姿态变化人脸识别系统的网络由六部分组成,分别是输入模块、注意力机制模块LA

SENet、倒置残差模块Bottleneck

attention、多尺度特征融合模块、全局平均池化模块以及输出模块。
[0007]优选的,所述步骤四具体包括如下步骤:4.1:设置激活函数以及损失函数,使用真实图像以及经过基于注意力机制的卷积神经网络后图像之间的差值来估计网络参数;构建SoftMax为本专利技术的损失函数,它为每一种分类都添加了一种概率,其中SoftMax 函数表达式如下所示:其中,x
i
表示第i个样本的深度特征,属于第个i类;W
j
表示权重W的第j列;b
j
是偏差项;n表示的是训练数据类别总数,N表示的是批次大小;4.2:选择优化函数对基于注意力机制的卷积神经网络进行迭代训练;4.3:设置训练参数其中包括学习率、迭代的批次、Batch值重要参数;4.4:使用lfw,cplfw,agedb_30,cfp的图像数据集作为本专利技术的测试数据集对于训练好的网络进行测试。
[0008]优选的,所述步骤3.1中:注意力机制模块LA

SENet由空间注意力机制LANet 与通道注意力机制SENet构成。其中,LANet由两个连续的1*1卷积核构成,每个卷积后分别由Relu以及Sigmod串联而成;SENet由两个连续的FC层构成,每个FC层后分别由 Relu以及Sigmod串联而成。
[0009]优选的,所述步骤3.2中:倒置残差模块由不同Stride结构组成。
[0010]优选的,所述步骤4.2中:使用SGD算法对网络进行迭代训练。
[0011]优选的,所述步骤4.3中:学习率初始值设置为0.1,迭代次数设置为25,Batch 值设置为512。
[0012]与现有技术相比,本专利技术的有益效果是:本专利技术设计了基于注意力机制的卷积神经网络模块,这种基于注意力机制的卷积神经网络模块,比一般意义上的卷积神经网路感知野的范围更大。这样不仅能够提取更多低分辨率图像的特征,而且还可以利用注意力模块提取到图像中高频信息部分;设计多尺度特征融合模块,这种多尺度特征融合模块,可以融合不同卷积层的特征;设计倒置残差模块,这种基于倒置残差模块的卷积神经网络,顺利解决了随着网络加深随之而来的训练困难的增加,并且输出不同尺度大小的特征;构建全局平均池化模块,这种全局平均池化模块,可以通过降低模型的参数数量来最小化过拟合效应。
附图说明
[0013]图1为本专利技术设计的基于注意力机制的姿态变化人脸识别系统的特征提取流程图。
[0014]图2为本专利技术设计双面注意力机制模块LA

SENet模块原理框图;图3为本专利技术设计的倒置残差结构的Bottleneck

attention模块原理框图。
具体实施方式
[0015]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]在本专利技术的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0017]在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的姿态变化人脸识别方法,其特征在于:包括以下步骤:步骤一:将采集的数据集分为训练数据集以及测试数据集,并对选中的训练数据集进行数据预处理;步骤二:将步骤一中训练集的图像剪裁成112*112的图像块;步骤三:设计基于注意力机制的卷积神经网络;步骤四:训练基于注意力机制的卷积神经网络。2.根据权利要求1所述的一种基于注意力机制的姿态变化人脸识别方法,其特征在于:所述步骤三具体包括如下步骤:2.1:设计双面注意力机制模块LA

SENet:注意力机制模块包括:LANet空间注意模块以及SENet通道注意模块,用于突出在姿态变化下的人脸最具有区分性的特征信息;2.2:设计倒置残差结构:设计基于MobileNetV2的倒置残差结构的Bottleneck

attention,即先扩张通道数后压缩用于减少计算量;2.3:构建多尺度特征融合模块:多尺度特征融合模块由特征融合模块连接以及上下采样模块连接而成;2.4:构建全局平均池化模块:全局平均池化模块由由GDConv以及Linear Conv所构成;2.5:搭建基于MobileFaceNet模型为主体的注意力机制网络,基于注意力机制的姿态变化人脸识别系统的网络由六部分组成,分别是输入模块、注意力机制模块LA

SENet、倒置残差模块Bottleneck

attention、多尺度特征融合模块、全局平均池化模块以及输出模块。3.根据权利要求1所述的一种基于注意力机制的姿态变化人脸识别方法,其特征在于:所述步骤四具体包括如下步骤:3.1:设置激活函数以及损失函数,使用真实图像以及经过基于注意力机...

【专利技术属性】
技术研发人员:张鹏赵锋张悦李孟委
申请(专利权)人:中北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1