一种基于注意力机制和混合网络的群体图像情绪识别方法技术

技术编号：21892803 阅读：16 留言：0更新日期：2019-08-17 14:51

本发明专利技术涉及一种基于注意力机制和混合网络的群体图像情绪识别方法，包括以下步骤：步骤1：使用卷积网络模型以检测和提取图像中人的面部信息并输入面部CNN，通过注意力机制结合图像中的面部特征获取面部特征的单个表示；步骤2：使用姿势估计方法获取图像中人体骨架信息并输入骨架CNN；步骤3：利用数据库训练各分支网络模型；步骤4：融合各个模型的预测结果，执行网络搜索以学习每个模型的权重；步骤5：通过权重得出混合网络针对图像的最终识别结果。与现有技术相比，本发明专利技术具有降低由个别面部表情混淆最终分类的概率，充分结合了图像中场景、人脸、骨架的特征信息，降低由不同特征混淆最终分类的概率，更高的识别准确率等优点。

A Mood Recognition Method for Group Images Based on Attention Mechanism and Hybrid Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制和混合网络的群体图像情绪识别方法
本专利技术涉及群体情绪识别
，尤其是涉及一种基于注意力机制和混合网络的群体图像情绪识别方法。
技术介绍
智能情感分析研究已经走过了漫长的道路，但传统上一直关注场景中的单一个体，对群体情感识别的研究相对匮乏，然而，随着城市人口的迅速增长，研究对象由个体逐渐转变为群体。群体可分为大小群体，大群体如街道的人流，此时人与人之间并没有情感的交流和统一的情绪，本专利技术是对多位个体间有情感交流的小群体进行情绪识别。并且在拥挤的环境中，由于遮挡和分辨率的问题，很难根据个人的表情去推断群体的情感。因此，基于小群体情感识别显得尤为重要，它不仅可以应用于监控视频的异常检测，预测小群体情绪变化，保证社会安全。还可以应用于智能城市的规划，以给人们提供更加人性化的服务。如何高效地识别群体情感是目前急需解决的问题。群体情绪识别最早由Dhall等人进行，该工作介绍了AFEW数据库和群体情绪识别框架，包括使用面部动作单元提取面部特征，在对齐的面上提取低级特征，使用GIST和CENTRIST描述符提取场景特征并使用多核学习融合。然而，他们提出的方法依赖于LBQ和PHOG特征和CENTRIST，其捕获面部表示和场景表示是有限的。以往的情绪识别广泛使用人体面部特征，但根据实验心理学和情感计算的研究结果，身体姿势特征也传达重要的情感信息。人脸标志可直接作为位置向量，或者通过计算它们之间的几何距离来识别情绪，身体姿势特征主要被编码为图像中身体区域的手工特征。为了保留人脸标志和身体特征关键点的相对位置，可使用骨架特征表示，对应于人脸、身体和手...

【技术保护点】
1.一种基于注意力机制和混合网络的群体图像情绪识别方法，其特征在于，包括以下步骤：步骤1：使用卷积网络模型以检测和提取图像中人的面部信息并输入面部CNN，通过注意力机制结合图像中的面部特征获取面部特征的单个表示；步骤2：使用姿势估计方法获取图像中人体骨架信息并输入骨架CNN；步骤3：利用数据库训练各分支网络模型；步骤4：融合各个模型的预测结果，执行网络搜索以学习每个模型的权重；步骤5：通过权重得出混合网络针对图像的最终识别结果。

【技术特征摘要】
1.一种基于注意力机制和混合网络的群体图像情绪识别方法，其特征在于，包括以下步骤：步骤1：使用卷积网络模型以检测和提取图像中人的面部信息并输入面部CNN，通过注意力机制结合图像中的面部特征获取面部特征的单个表示；步骤2：使用姿势估计方法获取图像中人体骨架信息并输入骨架CNN；步骤3：利用数据库训练各分支网络模型；步骤4：融合各个模型的预测结果，执行网络搜索以学习每个模型的权重；步骤5：通过权重得出混合网络针对图像的最终识别结果。2.根据权利要求1所述的一种基于注意力机制和混合网络的群体图像情绪识别方法，其特征在于，所述的步骤1包括以下分步骤：步骤11：使用多任务级联卷积网络模型获取图像中人的面部信息；步骤12：将面部信息输入面部CNN；步骤13：引入损失函数减轻过拟合；步骤14：通过注意力机制找到图像中每个面部的概率权重并获得单个面部特征向量。3.根据权利要求2所述的一种基于注意力机制和混合网络的群体图像情绪识别方法，所述步骤12中的面部CNN采用ResNet18和SphereFace模型，其输入为96×112RGB对齐的人脸图像。4.根据权利要求3所述的一种基于注意力机制和混合网络的群体图像情绪识别...

【专利技术属性】
技术研发人员：邵洁，钱勇生，季欣欣，李晓瑞，莫晨，程其玉，
申请(专利权)人：上海电力学院，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人