System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于混合注意力卷积网络的面部表情识别方法技术_技高网

一种基于混合注意力卷积网络的面部表情识别方法技术

技术编号:40202555 阅读:7 留言:0更新日期:2024-02-02 22:15
本发明专利技术属于面部表情识别技术领域,尤其为一种基于混合注意力卷积网络的面部表情识别方法,该方法包括:S10:构建基于混合注意力卷积网络的面部表情识别网络模型;S11:准备数据集,采用面部表情fer2013数据集,将数据集按照9:1的比例划分为训练集和验证集两部分;S12:将所准备数据集的训练集输入至基于混合注意力卷积网络的面部表情识别网络模型中,进行模型训练。本发明专利技术针对面部表情识别深度卷积网络参数量多,计算量大的问题,本发明专利技术通过将深度可分离卷积块中的普通卷积层替换为深度可分离卷积层,来降低模型的参数量和计算量,同时进一步提升模型的深度。

【技术实现步骤摘要】

本专利技术涉及面部表情识别,具体为一种基于混合注意力卷积网络的面部表情识别方法


技术介绍

1、面部表情是人类社交活动中表达情绪的主要方式之一,与生理信号相比,具有更加直观的表达情感变化的优势。近几年,面部表情识别领域在智能驾驶,网络远程教学管理,智能监管,临床医疗,人机交互等领域都有着广泛的应用。

2、目前,关于面部表情识别的研究方法主要是基于卷积网络来进行特征提取和表情分类。为了提高特征提取对于面部表情更重要部分的关注度,研究人员通常在模型中加入注意力机制,通过注意力权重来使模型更加关注于表情识别重要的特征部分,但是注意力机制的引入会增加模型训练过程中梯度爆炸和过拟合的可能性,训练好的模型对于不同尺度和复杂度的图像识别也缺少泛化能力。

3、针对上述问题,本专利技术对于面部卷积网络所引用的注意力机制进行改进,提出了一种基于混合注意力卷积网络的面部表情识别方法,对上述问题进行有效改进。


技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足,本专利技术提供了一种基于混合注意力卷积网络的面部表情识别方法,解决了上述
技术介绍
中所提出的问题。

3、(二)技术方案

4、本专利技术为了实现上述目的具体采用以下技术方案:

5、一种基于混合注意力卷积网络的面部表情识别方法,该方法包括:

6、s10:构建基于混合注意力卷积网络的面部表情识别网络模型;

7、s11:准备数据集,采用面部表情fer2013数据集,将数据集按照9:1的比例划分为训练集和验证集两部分;

8、s12:将所准备数据集的训练集输入至基于混合注意力卷积网络的面部表情识别网络模型中,进行模型训练;

9、s13:将所准备数据集的验证集输入至训练好的网络模型对模型进一步微调,获得最优的训练参数和训练效果;

10、s14:保存训练和测试后的网络模型以及相关参数。

11、s15:输入待测人脸图片,输入至模型进行面部表情预测。

12、进一步地,所述s10中网络模型包含浅层卷积块,深度可分离卷积块,残差和输出模块;

13、所述浅层卷积块主要是用来提取面部表情的浅层纹理特征和边缘特征,通过逐层卷积等操作捕捉到面部图像中的局部和全局特征,从而帮助模型更好地理解面部表情的结构和变化;

14、所述深度可分离卷积块主要包含深度可分离卷积部分和所提出的混合注意力部分;所属深度可分离卷积部分主要是对模型进行深层次特征提取,获得更加细腻的面部表情特征,例如面部的微表情、肌肉变化等;所提出的混合注意力部分主要是针对不同的表情可能涉及到不同的面部区域和特征模式,混合注意力可以使模型更集中地关注与当前表情相关的特征;通过使用混合注意力机制来动态地调整特征的权重,使网络可以自适应地关注对于特定任务更重要的特征;

15、所述残差主要通过残差连接学习上一个模块保留的特征信息,提升特征学习能力,同时限制梯度,有利于避免梯度爆炸,使信息在网络中更容易地传播。

16、所述输出模块,通过卷积层调整输出维度,利用全局平均池化可以帮助网络汇总整个面部图像中的信息,捕捉到全局的情感特征,从而有助于更准确地进行表情分类。

17、进一步地,所述s11中,数据集为fer2013数据集,该数据集是从真实世界中收集的,fer2013数据集中的图像分辨率较低,因此可以更好地反映真实场景中的面部表情变化。

18、进一步地,所述s12中,在训练网络模型时,设置损失函数,训练批次大小,训练次数,优化器,学习率等预值。

19、进一步地,所述s12中,模型训练损失函数为多分类交叉损失函数,训练批次为300次,优化器为adam优化器,学习率为0.001。

20、进一步地,所述s12中,在训练网络模型过程中通过评价指标评估模型训练表情预测分类的准确度。

21、进一步地,所述s15中,对于待测人脸图片,需要先通过haar级联分类器从输入图像中检测出人脸信息,校正长宽尺寸,进行人脸分割,最后再输入至模型进行训练预测。

22、(三)有益效果

23、与现有技术相比,本专利技术提供了一种基于混合注意力卷积网络的面部表情识别方法,具备以下有益效果:

24、(1)针对面部表情识别深度卷积网络参数量多,计算量大的问题,本专利技术通过将深度可分离卷积块中的普通卷积层替换为深度可分离卷积层,来降低模型的参数量和计算量,同时进一步提升模型的深度。

25、(2)针对面部表情识别卷积网络引入注意力机制后会增加模型训练过程中梯度爆炸和过拟合的可能性,本专利技术设计了一种混合注意力模块,可以有效的降低引入注意力机制后带来的梯度爆炸和过拟合的可能性,而且还能有效提高模型的识别精度。

26、(3)针对面部表情识别卷积网络引入注意力机制后,训练好的模型对于不同尺度和复杂度的图像识别缺少泛化能力的问题,本专利技术设计的混合注意力机制可以在不同尺度上捕获特征,可以在不同图像场景下自适应地调整其关注度,从而提高了模型对于各种图像输入的适应性,具有更高的泛化能力和鲁棒性。

27、(4)针对目前面部表情卷积网络引入的注意力机制多数只针对通道相关性加强或者空间位置相关性加强的问题,本专利技术设计的混合注意力机制通过先加强通道相关性,再对输出进行空间位置相关性加强,使模型在特征提取时,通过通道注意力和空间注意力的联合操作,实现了通道信息和空间信息之间的交互。这有助于模型更好地捕获不同特征之间的关系,提升特征的表达能力。对于模块整体的输入部分进行自注意力加权,将其输出结果与空间位置相关性加权后的结果线性融合,使模型能够更好地进行特征的交互和融合,促使模型在多个层级上进行特征选择和整合,从而提高了模型对不同尺度和层次的信息的敏感性。

本文档来自技高网...

【技术保护点】

1.一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:该方法包括:

2.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述S10中网络模型包含浅层卷积块,深度可分离卷积块,残差和输出模块;

3.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述S11中,数据集为fer2013数据集,该数据集是从真实世界中收集的,fer2013数据集中的图像分辨率较低,因此可以更好地反映真实场景中的面部表情变化。

4.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述S12中,在训练网络模型时,设置损失函数,训练批次大小,训练次数,优化器,学习率等预值。

5.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述S12中,模型训练损失函数为多分类交叉损失函数,训练批次为300次,优化器为Adam优化器,学习率为0.001。

6.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述S12中,在训练网络模型过程中通过评价指标评估模型训练表情预测分类的准确度。

7.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述S15中,对于待测人脸图片,需要先通过Haar级联分类器从输入图像中检测出人脸信息,校正长宽尺寸,进行人脸分割,最后再输入至模型进行训练预测。

...

【技术特征摘要】

1.一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:该方法包括:

2.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述s10中网络模型包含浅层卷积块,深度可分离卷积块,残差和输出模块;

3.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述s11中,数据集为fer2013数据集,该数据集是从真实世界中收集的,fer2013数据集中的图像分辨率较低,因此可以更好地反映真实场景中的面部表情变化。

4.根据权利要求1所述的一种基于混合注意力卷积网络的面部表情识别方法,其特征在于:所述s12中,在训练网络模型时,设置损失函数,训练批次大小,训练次...

【专利技术属性】
技术研发人员:颜飞尚育杰刘云清李棋张琼
申请(专利权)人:长春理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1