一种基于动态分布融合的人脸表情预测方法技术

技术编号：38087881 阅读：8 留言：0更新日期：2023-07-06 08:57

本发明专利技术公开了一种基于动态分布融合的人脸表情预测方法，包括获取人脸表情数据集，针对获取的数据集中的人脸图片进行预处理，获取预处理数据集；构造辅助枝干，并基于辅助枝干设计双分支神经网络模型；采用构造的辅助枝干针对获取的预处理数据集进行提取样本分布处理；构建类别分布，针对获取的样本分布进行挖掘情感信息处理；针对构建的类别分布和提取的样本分布进行动态分布融合处理；构建多任务学习框架，优化双分支神经网络模型；采用优化的双分支神经网络模型实现人脸表情预测；本发明专利技术引入标签分布学习，展现了相比单标签学习的优越性；提出动态分布融合，充分发挥了标签分布学习的效用；而且本发明专利技术的预测性能好、效率高、误差少。误差少。误差少。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态分布融合的人脸表情预测方法

[0001]本专利技术属于图像处理
，具体涉及一种基于动态分布融合的人脸表情预测方法。

技术介绍

[0002]人脸表情识别是计算机视觉领域的一个重要研究方向。作为情感识别的子领域，人脸表情识别可以通过对人脸图像的分析，判断出人脸的表情状态，为人机交互、情感计算、智能监控等领域提供了重要的支持。
[0003]人脸表情识别的流程主要包括人脸表情图像获取和预处理，人脸表情特征提取和人脸表情分类。人脸表情预处理是从获取的人脸表情图像，通过人脸检测和人脸对齐，得到人脸的精确位置，排除图片背景的干扰，预处理的成功率主要受图像质量、光线强弱和遮挡等因素的影响。常见的人脸表情特征提取包括几何特征、表观特征、混合特征和深度特征，前三者作为传统手工特征，在人脸表情识别研究的初期被广泛应用，但这些方法往往存在着精度不高、鲁棒性差等问题；近年来，随着深度学习技术的快速发展，通过深度卷积神经网络提取的深度特征在人脸表情识别任务上取得良好的表现。人脸表情分类是人脸表情识别的最后一步，对传统手工特征的分类常常使用K近邻法、支持向量机、随机森林、Adaboost算法、贝叶斯网络和单层感知机等；而在深度学习框架中，则可以采用端到端的形式进行表情识别，即深度神经网络在习得特征后直接对特征进行分类和优化。
[0004]人脸表达模型主要分为2D、2.5D和3D：2D人脸是通过普通相机拍摄的RGB人脸图像，或者通过红外相机拍摄的红外图像，是确定视角下表征颜色或纹理的图像，并不包含深度信息；2.5D...

【技术保护点】

【技术特征摘要】
1.一种基于动态分布融合的人脸表情预测方法，包括如下步骤：S1.获取人脸表情数据集，针对获取的数据集中的人脸图片进行预处理，获取预处理数据集；S2.构造辅助枝干，并基于辅助枝干设计双分支神经网络模型；S3.采用步骤S2构造的辅助枝干针对步骤S1获取的预处理数据集进行提取样本分布处理；S4.构建类别分布，针对步骤S3获取的样本分布进行挖掘情感信息处理；S5.针对步骤S4构建的类别分布和步骤S3获取的样本分布进行动态分布融合处理；S6.构建多任务学习框架，优化步骤S2设计的双分支神经网络模型；S7.采用步骤S6优化得到的双分支神经网络模型实现人脸表情预测。2.根据权利要求1所述的基于动态分布融合的人脸表情预测方法，其特征在于步骤S1所述的获取人脸表情数据集，针对获取的数据集中的人脸图片进行预处理，获取预处理数据集，具体包括：设定人脸表情数据集为且数据集中涵盖C类标签与N个样本，使用MTCNN算法进行人脸对齐处理，输出固定大小的人脸图片；将输出的人脸图片缩放到给定尺寸，并使用RandAugment技术进行数据增广；使用ImageNet数据集的均值与标准差进行人脸图片RGB通道的归一化处理。3.根据权利要求2所述的基于动态分布融合的人脸表情预测方法，其特征在于步骤S2所述的构造辅助枝干，并基于辅助枝干设计双分支神经网络模型，具体包括：采用ResNet18网络模型构造双分支神经网络模型。将ResNet18网络模型分为两部分：冻结ResNet18网络模型中的第1层作为特征提取器，使用ResNet18网络模型中的后3层作为特征鉴别器，将该特征鉴别器定义为目标枝干。基于目标枝干构造辅助枝干，辅助枝干的参数、结构同目标枝干一致。基于特征提取器、目标枝干和构造的辅助枝干，设计获得双分支神经网络模型。4.根据权利要求3所述的基于动态分布融合的人脸表情预测方法，其特征在于步骤S3所述的采用步骤S2构造的辅助枝干针对步骤S1获取的预处理数据集进行提取样本分布处理，具体包括：将步骤S2构造的辅助枝干输出的概率分布作为样本分布，采用下述公式表示样本分布：布：其中，为样本x
i
的样本分布，y
j
为第j类标签，为标签y
j
对于样本x
i
的描述程度，为辅助枝干对样本x
i
属于标签y
j
的预测概率；辅助枝干通过交叉熵损失进行训练，以提高并保持辅助枝干提取样本分布的能力，采用下述公式表示交叉熵损失函数：
其中，L
ce
是交叉熵损失函数，为样本x
i
的逻辑标签y
i
的第c个值，是辅助枝干对样本x
i
属于类别c的预测概率。5.根据权利要求4所述的基于动态分布融合的人脸表情预测方法，其特征在于步骤S4所述的构建类别分布，针对步骤S3获取的样本分布进行挖掘情感信息处理，具体包括：使用类别分布挖掘来找出样本分布中隐含的情感信息，消除样本分布误差对模型性能的影响，采用下述公式表示类别分布：其中，为类别c的类别分布，为属于类别c的样本x
i
的类别分布，N
c
为属于类别c的样本数量；设置阈值t来判断输出的类别分布是否满足设定的稳健性要求，如果标签y
j
对于类别c的描述程度没有达到阈值t，使用阈值分布暂时替代类别分布训练模型，采用下述公式进行描述：描述：描述：其中，是类别c的类别分布，是类别c的阈值分布，为标签y
j
对于类别c的描述程度。6.根据权利要求5所述的基于动态分布融合的人脸表情预测方法，其特征在于步骤S5所述的针对步骤S4构建的类别...

【专利技术属性】
技术研发人员：刘姝，许焱，万通明，王科选，奎晓燕，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人