一种识别准确度高的人脸表情识别方法技术

技术编号：39732782 阅读：14 留言：0更新日期：2023-12-17 23:35

本发明专利技术涉及人脸表情识别技术领域，且公开了一种识别准确度高的人脸表情识别方法，包括以下步骤：

全部详细技术资料下载

【技术实现步骤摘要】
一种识别准确度高的人脸表情识别方法

[0001]本专利技术涉及人脸表情识别
，更具体的公开了一种识别准确度高的人脸表情识别方法
。

技术介绍

[0002]目前，人脸表情识别任务越来越受计算机视觉研究界的关注
。
人脸表情识别是指利用计算机对检测到的人脸进行面部表情特征提取，使计算机能够按照人的思维认识对人脸表情进行相应的理解处理，并能够根据人们的需求做出响应，建立友好的
、
智能化的人机交互环境
。
由于表情是人类最为重要的表达方式之一，面部表情也是人类表达情感状态和内涵的最自然
、
最普遍
、
最直接的方式之一，关于计算机理解并识别人类的表情是十分重要的，基于这样的现状，人脸表情识别任务在人机交互
、
医疗进展监测
、
驾驶员疲劳监测
、
虚拟现实
、
智能辅导系统和许多其它领域有着广泛应用
。
[0003]当前人脸表情识别任务基于的数据集大致分为两大类，一类是基于
lab
‑
control
，另一类是基于
wild。
基于
lab
‑
control
的人脸表情图通常是在实验室特定条件下形成的，优点是标签注释准确，缺点是数据量过于少；而基于
wild
的人脸表情图，由于是制作者在互联网上搜集的，虽然可以轻易获取大量数据，但是也意味着对应的标签是人...

【技术保护点】

【技术特征摘要】
1.
一种识别准确度高的人脸表情识别方法，其特征在于，包括以下步骤：
S1、
模型采用人脸表情识别公开数据集
RAF
‑
DB
以及辅助数据集
RAF
‑
AU
，并按
3∶1
的比例提取数据，然后进行拼接作为每轮的总数据集；
S2、
根据
IR50
模型的第四阶段输出，即7×7×
512
的特征图以及
mobilefacenet
的特征输出7×7×
512
作为双流
vit
模型的输入，将
IR50
的输出记为
x
，
mobilefacenet
的输出记为
x_landmark
；
S3、x
首先进入增强局部关系感知模块，根据
x
构建两个分支，每个分支都通过
LANet
将维度
512
降至1，得到两个7×7×1的特征图，记为
M1
与
M2
，然后将
M1
与
M2
分别经过
dropout
，再进行
max
处理，最后与
x
进行相乘融合，得到新的7×7×
512
特征图，为
xout
；
S4、xout
再进入
invariance
模块，即依次通过2个1×1卷积，每个卷积的通道维度不发生改变，且每经过1个卷积，得到的输出都与卷积的输入进行残差相加处理，最终输出结果依旧为7×7×
512
，记为
x_invariance
；
S5、x_invariance
再经过
dropout
处理，然后与
x
进行残差相加处理，
x
即进入增强局部关系感知模块的输入；
S6、
另一输入流
x_landmark
经过
dropout
处理即可；
S7、
此时
x
与
x_landmark
均为7×7×
512
，将其
reshape
成
49
×
512
，分别添加对应的
cls token
，同时
x
还需要添加
position embedding
位...

【专利技术属性】
技术研发人员：闵海，刁振宁，陈涵，谢军，郑天琦，
申请(专利权)人：合肥工业大学智能制造技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人