一种基于时序关系推理的动态表情识别方法技术

技术编号：22295876 阅读：46 留言：0更新日期：2019-10-15 04:58

本发明专利技术公开了一种基于时序关系推理的动态表情识别方法，属于图像处理和机器视觉中的动态表情识别领域，所述方法包括：对表情图像序列进行多尺度时序稀疏采样，得到多个不同尺度的表情序列片段，并将所述表情序列片段进行数据增强后转换成固定大小；构建包括多尺度区域特征提取网络和时序关系推理模块的动态表情识别模型；将得到的表情序列片段输入动态识别模型中进行训练；将待识别的表情图像序列输入训练好的动态表情识别模型，得到动态表情识别结果。本发明专利技术的方法可以适应长时序输入，且能更好地提取脸部的局部区域特征，提高识别准确度；同时本发明专利技术方法在降低计算量的同时提高了模型性能。

A dynamic expression recognition method based on temporal relation reasoning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时序关系推理的动态表情识别方法
本专利技术属于图像处理和机器视觉中的动态表情识别领域，更具体地，涉及一种基于时序关系推理的动态表情识别方法。
技术介绍
人脸表情识别作为计算机视觉领域中的一个重要研究课题，大多数的研究往往聚焦于以单帧表情图像作为研究对象的静态表情识别任务中。然而，人脸表情作为一个动态变化过程，单帧人脸表情图像无法完整地捕捉人的情感变化。与之相比，以表情视频或表情图像序列作为研究对象的动态表情识别，由于可以利用丰富地与表情变化相关的纹理信息和运动信息，可以较为完整地表达人的情绪变化过程。但由于存在表情数据集规模小且分布不平衡、数据标注偏差、姿态变化、光照变化、情感表达差异、以及表情与说话的冲突等问题，当前动态表情识别依然面临许多挑战问题。实际的动态表情识别研究工作中主要有两个部分组成：表情序列特征提取和时序关系建模，近年来，动态表情识别的研究也取得了很好的成功。目前普遍使用3D卷积神经网络识别动态表情，这种方法简单直接，但也存在如下问题与不足之处：(1)在输入方面，普遍的做法是使用密集采样视频帧的方式，以16帧连续帧图像作为输入对图像序列提取特征，这在很大程度上限制了输入序列的长度，无法应用于长时序的表情序列，而且对于长时序的表情序列，相应的计算量会急剧增加，无法应用于实时场景中；(2)在表情图像特征提取方面，现有做法通常采用权重共享的卷积核对表情图像进行全局特征提取，没有考虑到不同脸部表情运动在脸部的不同区域具有不同的结构和纹理信息，虽然单尺度区域层为了利用局部信息，对不同的局部区域采用了不同的卷积核处理，但由于设计的局部区域大小均...

【技术保护点】
1.一种基于时序关系推理的动态表情识别方法，其特征在于，包括：(1)对表情图像序列进行多尺度时序稀疏采样，得到多个不同尺度的表情序列片段，并将所述表情序列片段进行数据增强后转换成固定大小；(2)构建动态表情识别模型；所述动态表情识别模型包括依次连接的多尺度区域特征提取网络和时序关系推理模块；所述多尺度区域特征提取网络包括：依次连接的第一特征层、第二特征层、第三特征层、第四特征层，第五特征层和第六特征层；所述第一特征层，包括依次连接的挤压激励特征提取模块和多尺度区域模块；所述挤压激励特征提取模块，用于对输入图像进行特征提取，得到特征图；所述多尺度区域模块，包括卷积层和三个不同尺度的区域层；所述卷积层，用于对所述挤压激励特征提取模块输出的特征图进行卷积操作；所述区域层，用于将所述卷积层输出的特征图分成固定大小的多个区域，对每个区域采用不同的卷积核进行卷积；所述第二特征层，包括依次连接的挤压激励特征提取模块和多尺度区域模块，用于对第一特征层输出的特征图再次进行特征提取，得到包含信息更为丰富的特征图；所述第三特征层、第四特征层和第五特征层均由挤压激励特征提取模块组成，用于对当前层之前输出的特征...

【技术特征摘要】
1.一种基于时序关系推理的动态表情识别方法，其特征在于，包括：(1)对表情图像序列进行多尺度时序稀疏采样，得到多个不同尺度的表情序列片段，并将所述表情序列片段进行数据增强后转换成固定大小；(2)构建动态表情识别模型；所述动态表情识别模型包括依次连接的多尺度区域特征提取网络和时序关系推理模块；所述多尺度区域特征提取网络包括：依次连接的第一特征层、第二特征层、第三特征层、第四特征层，第五特征层和第六特征层；所述第一特征层，包括依次连接的挤压激励特征提取模块和多尺度区域模块；所述挤压激励特征提取模块，用于对输入图像进行特征提取，得到特征图；所述多尺度区域模块，包括卷积层和三个不同尺度的区域层；所述卷积层，用于对所述挤压激励特征提取模块输出的特征图进行卷积操作；所述区域层，用于将所述卷积层输出的特征图分成固定大小的多个区域，对每个区域采用不同的卷积核进行卷积；所述第二特征层，包括依次连接的挤压激励特征提取模块和多尺度区域模块，用于对第一特征层输出的特征图再次进行特征提取，得到包含信息更为丰富的特征图；所述第三特征层、第四特征层和第五特征层均由挤压激励特征提取模块组成，用于对当前层之前输出的特征图进行特征提取得到更为高层的特征；所述第六特征层为均值池化层，用于对第五特征层输出的特征进行降维，得到表情图像的语义特征；所述时序关系推理模块，用于对所述多尺度区域特征提取网络输出的表情图像的语义特征构建相邻表情图像帧之间的时序关系；(3)将步骤(1)得到的表情序列片段输入所述动态识别模型中进行训练，得到训练好的动态表情识别模型；(4)将待识别的表情图像序列输入训练好的动态表情识别模型，得到动态表情识别结果。2.根据权利...

【专利技术属性】
技术研发人员：韩守东，刘文龙，杨子清，张宏亮，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人