The invention provides a method of facial emotion recognition based on dual-stream convolution neural network, which mainly involves learning and classifying a single face image and a face sequence using a multi-scale facial expression recognition network. The method includes: building a multi-scale facial expression recognition network (including two channel networks with 224 *224 and 336 *336 resolutions), using the network to extract facial expression features at different resolutions in parallel, effectively combining static features of images and dynamic features of expression sequences for training and learning, and then fusing the two channel models to test and get face tables. The classification effect of emotion. The invention gives full play to the advantages of in-depth learning, effectively avoids the deviation and time-consuming problems of manual feature extraction, and makes the method of the invention more adaptable. In addition, a complementary architecture is formed by using the structural features of the two-stream network, parallel training and prediction, and then the training models of the two sub-networks are fused to improve the accuracy and efficiency of expression recognition.
【技术实现步骤摘要】
一种基于双流卷积神经网络的人脸情绪识别方法
本专利技术涉及深度学习领域中的情绪识别问题,尤其是涉及一种基于双流卷积神经网络的人脸情绪识别方法。
技术介绍
人脸表情作为人类情绪状态最直接、最有效的表达方式,一直具有重要的研究意义。人脸表情识别是指从给定的静态图像或者动态视频序列中分离出特定的表情状态,继而确定研究对象的情绪状态,实现计算机对人脸表情的识别与理解,达到人机交互的过程。目前,人脸表情识别技术在人机交互领域的应用主要包括疲劳驾驶检测、手机端实时表情识别以及社交机器人等等。情绪识别作为计算机视觉领域的重要研究内容,受到了国内外研究者的广泛关注。目前,对人脸表情的识别主要分为基于静态图片的表情识别和基于视频序列的表情识别。基于静态图片的人脸表情分析的重点在于提取单张人脸表情图像中的静态表情特征,而对于表情序列而言主要是将序列的静态特征与动态特征相结合用于分析视频中人的情绪状况,目前利用这两种方式进行人脸表情识别已经取得了较高的识别率和泛化能力。因此本专利利用人脸表情数据集的单帧静态图片和表情序列的信息特征进行人脸情绪识别。传统的人脸表情识别方法主要是通过人工提取面部特征,但提取的特征单一、计算过程比较复杂且模型的适用环境很有限。深度学习(DeepLearning)是近年来备受关注的研究领域,它将多个抽象的数据处理层组合构成计算模型代替传统的人工选择特征的方法,让机器自主地学习数据样本的特征,有效避免人工选择特征的缺陷。并且与人工选择特征相比,深度学习方法利用大量的数据来学习特征,能够描述数据的特征信息进行更为丰富的描述。简言之,深度学习不管在识别时间还 ...
【技术保护点】
1.一种基于双流卷积神经网络的人脸情绪识别方法,其特征在于:a.将人脸序列分别处理成两种不同分辨率的图像;b.利用不同的卷积神经网络分别训练两种分辨率的图像;c.对上述b中的两通道网络进行加权融合,得到多尺度的人脸表情识别网络模型;该方法主要包括以下步骤:(1)对人脸序列进行预处理,其中通过人脸检测跟踪等技术获取人脸表情序列,再将每个序列分别处理为224×224、336×336大小的分辨率;(2)将处理好的人脸表情数据集划分为训练集、验证集和测试集三部分,并给定每个序列的情绪类别;(3)引入基于卷积神经网络(CNN)和长短期记忆网络(LSTM)的两通道人脸表情识别网络(Channel1通道,Channel 2通道),分别对上述两种分辨率的人脸序列进行分析,其中Channel1通道(C1)输入处理为224×224分辨率的单帧人脸图像,Channel2通道(C2)输入处理为336×336分辨率的人脸序列;(4)先将训练集和验证集中两种不同分辨率的人脸图像分别输入C1和C2通道网络进行训练,然后将两通道模型进行融合,再利用融合后的模型对测试集进行测试,得到测试集上的准确度ACC(Accura ...
【技术特征摘要】
1.一种基于双流卷积神经网络的人脸情绪识别方法,其特征在于:a.将人脸序列分别处理成两种不同分辨率的图像;b.利用不同的卷积神经网络分别训练两种分辨率的图像;c.对上述b中的两通道网络进行加权融合,得到多尺度的人脸表情识别网络模型;该方法主要包括以下步骤:(1)对人脸序列进行预处理,其中通过人脸检测跟踪等技术获取人脸表情序列,再将每个序列分别处理为224×224、336×336大小的分辨率;(2)将处理好的人脸表情数据集划分为训练集、验证集和测试集三部分,并给定每个序列的情绪类别;(3)引入基于卷积神经网络(CNN)和长短期记忆网络(LSTM)的两通道人脸表情识别网络(Channel1通道,Channel2通道),分别对上述两种分辨率的人脸序列进行分析,其中Channel1通道(C1)输入处理为224×224分辨率的单帧人脸图像,Channel2通道(C2)输入处理为336×33...
【专利技术属性】
技术研发人员:卿粼波,王露,何小海,滕奇志,周文俊,熊文诗,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。