一种自然环境下多尺度子块聚合的表情识别方法及系统技术方案

技术编号：26599058 阅读：18 留言：0更新日期：2020-12-04 21:21

本发明专利技术公开了一种自然环境下多尺度子块聚合的表情识别方法及系统。该方法包括：预定义多尺度参数，将表情图片输入到回归卷积神经网络，获取所述表情图片的注意力区域参数；根据所述注意力区域参数对所述表情图片采样子块,为每个尺度的每个子块分别构建堆叠卷积层，利用所述堆叠卷积层提取所有子块的特征；将相同尺度下的所有子块的所述特征进行融合，获取每个尺度对应的单一尺度融合特征向量；提取所述表情图片的全局特征，将所有尺度的所述单一尺度融合特征向量以及所述全局特征进行聚合后输入到全连接层网络，获取表情识别结果。本发明专利技术的表情识别无需依赖于手工选择或人脸特征点，提升了自然条件下表情识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种自然环境下多尺度子块聚合的表情识别方法及系统
本专利技术属于计算机视觉
，更具体地，涉及一种自然环境下多尺度子块聚合的表情识别方法及系统。
技术介绍
表情是人类进行情感交流的重要方式之一。表情识别是实现自然人机交互的关键技术，在计算机视觉和情感计算领域具有广阔的应用前景。现有的表情识别方法对实验室环境下摆拍的表情具有较高的识别精度，但是对于自然环境下自发表情的识别精度仍然不高。其主要原因在于，自然环境下人脸图像的分辨率不一，头部姿态变化较大，这些因素导致特征点提取的精度不高，进而影响特征对齐，最终导致表情识别精度下降；其次，自然环境下表情信息容易受到头部姿态变化、光照变化、局部遮挡等因素的干扰，单一的特征或模型难以同时面对以上挑战。再次，自发表情的表情强度弱于摆拍的极致表情，类间距离更小，更容易被混淆。为了解决上述问题，一个有效的方法是从人脸区域中提取有表情的局部子块区域，通过局部特征和全局特征的融合来识别表情。一方面，局部子块可以很好的抑制局部遮挡问题，对头部姿态变化也具有一定的鲁棒性，并有效克服全局特征存在大量冗余信息的问题；另一方面，全局特征能弥补局部子块表征能力不足的问题，多种特征的融合有利于应对多种复合挑战。但是，现有的方法在提取局部子块时，依赖于手工选择或人脸特征点，无法从人脸图像中自适应搜寻重要的子块，当人脸特征点提取精度不高时，也影响表情识别的精度；在子块尺度的设定上，往往只考虑单一尺度的子块，并且不同子块对表情分类所起的作用相同，因此导致表情识别精度不高。<...

【技术保护点】
1.一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，包括：/nS1，预定义多尺度参数，将表情图片输入到回归卷积神经网络，获取所述表情图片的注意力区域参数，所述注意力区域参数为每个尺度的每个子块的平移参数；/nS2，根据所述注意力区域参数及所述多尺度参数对所述表情图片采样子块,为每个尺度的每个子块分别构建堆叠卷积层，利用所述堆叠卷积层提取所有子块的特征；/nS3，将相同尺度下的所有子块的所述特征进行融合，获取每个尺度对应的单一尺度融合特征向量；/nS4，提取所述表情图片的全局特征，将所有尺度的所述单一尺度融合特征向量以及所述全局特征进行聚合后输入到全连接层网络，获取表情识别结果。/n

【技术特征摘要】
1.一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，包括：
S1，预定义多尺度参数，将表情图片输入到回归卷积神经网络，获取所述表情图片的注意力区域参数，所述注意力区域参数为每个尺度的每个子块的平移参数；
S2，根据所述注意力区域参数及所述多尺度参数对所述表情图片采样子块,为每个尺度的每个子块分别构建堆叠卷积层，利用所述堆叠卷积层提取所有子块的特征；
S3，将相同尺度下的所有子块的所述特征进行融合，获取每个尺度对应的单一尺度融合特征向量；
S4，提取所述表情图片的全局特征，将所有尺度的所述单一尺度融合特征向量以及所述全局特征进行聚合后输入到全连接层网络，获取表情识别结果。

2.如权利要求1所述的一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，所述回归卷积神经网络为将VGG网络的最后一个全连接层的神经元个数修改为的卷积神经网络、或将Resnet网络中的最后一个全连接层的神经元个数修改为的卷积神经网络、或将Googlenet网络中的最后一个全连接层的神经元个数修改为的卷积神经网络，其中S表示预设的子块尺度的数量，Ni表示每个尺度下生成子块的数量，D表示生成子块的所述注意力区域参数的维度。

3.如权利要求2所述的一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，不同尺度下生成子块的数量保持一致。

4.如权利要求所述1的一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，每个尺度的每个子块对应的所述堆叠卷积层的参数独立训练得到。

5.如权利要求所述1的一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，所述融合是采用直接融合、加权融合或拼接融合中的一种，所述直接融合是指将相同尺度的所有子块的所述特征通过求和融合为一个特征向量，所述加权融合是指相同尺度的所有子块的所述特征通过注意力机制加权求和融合为一个特征向量，所述拼接融合是指将相同尺度的所有子块的所述特征首尾拼接为一个特征向量。

6.如权利要求1所述的一种自然环境下多尺度子块聚合的表情识别方法，其特征在于，所述步骤S3还包括...

【专利技术属性】
技术研发人员：陈靓影，徐如意，张坤，刘乐元，彭世新，
申请(专利权)人：武汉星未来教育科技有限公司，华中师范大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人