【技术实现步骤摘要】
一个基于Gabor卷积和Transformer的学生表情识别模型
[0001]本专利技术属于计算机视觉领域,特别涉及一种表情识别模型方法设计,具体涉及一个基于
Gabor
卷积和
Transformer
的学生表情识别模型
。
技术介绍
[0002]随着计算机视觉技术及硬件设备的高速发展,研究人员开始研究人脸表情识别技术
Facial Expression Recognition
,
FER
,通过分析人脸面部表情蕴含的信息,以更好地理解人们的行为或给予针对性的响应
。
当前已经提出了许多方法来处理人脸表情识别问题
。
总的来说,当前的主流表情识别方法大致可以分为两大类,即传统方法和基于深度学习的方法
。
[0003]传统的
FER
任务依赖于基于几何和外观的局部特征提取
。
通过面部特征提取算法来提取局部
、
全局或混合特征作为分类器的输入,帮助分类器识别面 ...
【技术保护点】
【技术特征摘要】
1.
一个基于
Gabor
卷积和
Transformer
的学生表情识别模型,其特征在于,步骤如下:
1)GC
‑
Block
模块对输入图像进行处理;
2)
采用包括
Transformer
模块和
GC
‑
Basic
‑
Block
模块的特征提取块
GVT
‑
Block
,引入残差连接,通过
backbone
对特征图做更细粒度的特征提取和升维;
3)backbone
重复4次以构建更深的网络;
4)
接入全局平均池化和全连接层实现图像的分类
。2.
根据权利要求1所述的一个基于
Gabor
卷积和
Transformer
的学生表情识别模型,其特征在于,所述的
1)
中,具体方法为:
GC
‑
Block
模块由两个
5*5
的
Gabor
卷积层组成,每个
Gabor
卷积层后添加
BN
层进行归一化来防止过拟合,
BN
层后添加
GELU
激活函数,来对归一化后的特征图进行非线性变换;
GC
‑
Block
模块通过
Gabor
卷积生成增强的特征映射,捕捉面部表情图像纹理信息和边缘特征,提取具有先验知识的特征图作为后续
backbone
的输入;第一个
Gabor
卷积用于提取特征时,将
expand
参数设置为
true
用于将输入张量扩展为一个更大的张量以进行卷积,确保
Gabor
滤波器能够卷积整个输入;
Nscale
参数指定了每个尺度上
Gabor
滤波器的方向数,卷积过程如公式1所示:其中,
F
是输入特征图,
C
i
是第
i
个
GoF
,具体计算过程如公式2所示:其中
(n)
表示
F
和
C
i,u
的第
n
个通道,
k
代表不同方向,而
F
i,k
是
F
i
的第
k
个方向响应,表示卷积过程,通过卷积显著增强特征中的方向信息;
Gabor
卷积层后都添加了
BN
层进行归一化,
BN
层添加了
GELU
激活函数,来对归一化后的特征图进行非线性变换,计算过程如公式3和公式4所示
。f
=
GeLu(f
′
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(
公式
4)
其中,
BN
是归一化层,
GeLu()
是激活函数
GeLu
;
GeLu
激活函数的计算过程被描述成:对于每一个输入
x
都乘以一个二项式分布
φ
(x)
,即
GeLu(x)
=
x
·
φ
(x)
,因为
φ
(x)
无法直接计算,因此对于标准正态分布的
GeLu
激活函数近似计算的具体公式如公式5所示:由公式可知,
GeLu
激活函数就是双曲正切函数
tanh
与近似数值的组合
。3.
根据权利要求1所述的一个基于
Gabor
卷积和
Transformer
的学生表情识别模型,其特征在于,所述的
2)
中,具体方法为:
backbone
采用
3*3
的
Gabor
卷积对特征图做更细粒度的特征提取和升维,
GC
‑
Block
...
【专利技术属性】
技术研发人员:曲大鹏,杨天奇,郭伟嘉,吴俊,吕红,
申请(专利权)人:辽宁大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。