【技术实现步骤摘要】
一种基于深度自适应度量学习的面部表情识别方法
[0001]本专利技术属于人工智能算法和计算机视觉
,尤其涉及一种基于深度自适应度量学习的面部表情识别方法。
技术介绍
[0002]随着人工智能的发展,情感计算已经成为人工智能情感化的关键一步,面部表情显然是传达人类情感最直接的方式。具体来说,这些基本情绪状态主要包括高兴、生气、悲伤、恐惧、厌恶、惊讶和中性。由于面部表情识别(FER)在医疗辅助、驾驶员监控、智能教育、电商等领域的广泛应用,已成为计算机视觉领域一个活跃的研究课题。例如,商家通过记录消费者在浏览商品时的表情预测产品销量,为下一期的产品设计做好准备。
[0003]现有的大多数面部表情识别方法主要针对受控的实验室环境,不能很好地适应复杂的自然环境。在非受控的自然环境下,面部遮挡和姿势变化是影响识别性能的两个关键问题,它们导致了显著的类间相似性和类内差异性,同时产生了类别分布不平衡的特点。在现有方案中,面部表情识别方法主要分为以下几种方式:
[0004](1)使用传统方法进行表情识别:传统的表情识别方法多为先手工设计特征或进行浅层学习,例如局部二值模式(local binary pattern,LBP)、非负矩阵分解(nonnegative matrix factorization,NMF)和稀疏学习等,而后再选择分类器进行表情分类,主要有决策树、支持向量机(SVM)、K最邻近(KNN)和Adaboost等。虽然所需数据量较小,但在实际应用中准确率不高。在传统的表情识别方法中,人工特征提取方法 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度自适应度量学习的面部表情识别方法,其特征在于,具体包括以下步骤:S1:通过摄像装置拍摄人脸图像,并使用人脸检测模型对人脸图像进行人脸检测;S2:构建表情识别主干模型,使用轻量级ResNet18作为网络的骨干网,用上下文卷积代替普通卷积,并采用协调注意模块对各个阶段获得的空间信息进行调制,经过全局平均池化层,得到嵌入特征向量,获得空间特征图;S3:构建自适应注意模块,利用自适应注意模块对骨干网提取的特征进行编码,有区分地对待不同人脸特征;S4:利用自适应注意模块生成的权值对中心损耗中每个维度的欧氏距离进行加权,过滤掉不相关的特征,提取与表情识别有关的人脸特征训练表情识别模型;S5:使用步骤S4中训练得到的表情识别模型进行面部表情检测,输出识别结果。2.根据权利要求1所述的基于深度自适应度量学习的面部表情识别方法,其特征在于,所述步骤S1的具体步骤为:S11:通过摄像装置拍摄人脸图像,获取人脸图像;S12:将人脸图像中的人脸区域使用矩形框进行框选,去除多余背景,只保留人脸区域;S13:然后对用矩形框框选的区域输入面部表情识别模型。3.根据权利要求1所述的基于深度自适应度量学习的面部表情识别方法,其特征在于,所述步骤S3的具体步骤为:S31构建自适应注意力模块:利用随机注意力构建自适应注意力模块;S32计算动态权重:将来自步骤S2中的获得的空间特征图作为输入,利用自适应注意力模块生成潜在特征表示,并使用多个二进制分类器计算每个人脸特征元素上的权重值。4.根据权利要求3所述的基于深度自适应度量学习的面部表情识别方法,其特征在于,所述步骤S31利用随机注意力构建自适应模块的具体步骤为:S311对输入特征进行分组:对于输入的空间特征图X∈R
C
×
H
×
W
,其中C、H、W分别表示通道数、空间高度和宽度,随机注意力首先将X沿通道维数划分为G组,即X=[X
l
,
…
,X
G
],X
k
∈R
C/G
×
H
×
W
,其中每个子特征X
k
在训练过程中捕捉到特定的语义响应;然后,通过注意模块为每个子特征X
k
生成相应的重要系数;S312捕获通道间的依赖关系:首先嵌入全局信息,使用全局平均池化生成通道级统计信息,即c∈R
C/2G
×1×1;再通过门控机制与sigmoid激活函数,得到通道注意的最终输出;S313获取空间位置信息:采用群范数生成空间统计量,生成通道分支的紧凑特征。5.根据权利要求4所述的基于深度自适应度量学习的面部表情识别方法,其特征在于,所述步骤S311中通过注意模块为每个子特征X
k
生成相应的重要系数具体步骤为:在每个注意单元开始时,X
k
的输入沿着通道维度被分成两个分支即X
k1
,X
k2
∈R
C/2G
×
H
×
W
;其中一个分支X
k1
来产生一个通道注意力来利用通道间的相互关系,而另一分支X
k2
用于利用空间位置间的关系特性生成一个空间注意力图。6.根据权利要求5所述的基于深度自适应度量学习的面部表情识别方法,其特征在于,在其中一个分支X
k1
上,通过使用全局平均池化来嵌入全局信息,生成所述步骤S312中的通道级统计信息c∈R
C/2G
×1×1,通过空间维数H
×
W收缩X
k1
来计算通道级统计信息c,公式为:
其中,X
k1
表示该分支上的特征,F
qp
表示全局平均池化操作;通过门控机制与sigmoid激活函数得到通道注意的最终输出表示为:X
′
k1
=σ(F
c
(s))
·
X
k1
=σ(W1+b1)
·
X
k1
ꢀꢀꢀꢀ
(2);其中,...
【专利技术属性】
技术研发人员:朱春华,李雪,李培,韩志孝,杨慧丽,范亚君,石震,陶华伟,周飞,梁家瑞,刘浩,
申请(专利权)人:河南工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。