A facial expression recognition method based on Multi-task convolution neural network is proposed. Firstly, the structure of multi-task convolution neural network is designed to extract the low-level semantic features shared by all expressions and multiple discriminant features of single expression in turn in the network. Secondly, multi-task learning is adopted and multiple discriminant features of single expression are learned at the same time. The task of task and multi-expression recognition uses a joint loss to supervise all tasks of the network, and uses two loss weights to balance the loss of the network. Finally, according to the trained network model, the final result of facial expression recognition is obtained from the last flexible maximum classification layer of the model. The feature extraction and expression classification are studied in an end-to-end framework, and discriminant features are extracted from the input pictures to make reliable expression recognition for the input pictures. The experimental analysis shows that the algorithm has excellent performance, can effectively distinguish complex facial expressions, and has achieved good recognition performance on many open data sets.
【技术实现步骤摘要】
一种基于多任务卷积神经网络的人脸表情识别方法
本专利技术涉及计算机视觉技术,尤其是涉及一种基于多任务卷积神经网络的人脸表情识别方法。
技术介绍
在过去的几十年时间里,人脸表情自动识别已经吸引了越来越多计算机视觉的专家和学者广泛的关注。人脸表情识别的目标是,对给定的人脸表情图片,设计一种系统,能够自动预测其所属的人脸表情类别。人脸表情自动识别技术有着广泛的应用场景,如人机交互,安全驾驶和医疗保健等。尽管这些年来这项技术已经取得了不小的成功,但是在不可控的环境条件下进行可靠的人脸表情自动识别仍然是一个巨大的挑战。一个人脸表情识别系统包括三个模块:人脸检测、特征提取和人脸表情分类。其中,人脸检测技术已经发展得相当成熟,目前的人脸表情识别方法主要集中解决特征提取和人脸表情分类这两个模块。通常来说,这些技术可大致分为两类:基于手工设计特征的方法和基于卷积神经网络特征的方法。Zhong等人(L.Zhong,Q.Liu,P.Yang,J.Huang,D.N.Metaxas,“Learningactivefacialpatchesforexpressionanalysis”,inIEEEConferenceonComputerVisionandPatternRecognition(CVPR),2012,pp.2562–2569.)提出了一种多任务稀疏学习方法,该方法使用多任务学习从人脸表情图片中提取通用人脸区域和特定人脸区域,其中,通用人脸区域对所有表情的识别都有作用,特定人脸区域只对特定一种表情的识别有作用。然而,这种方法所提取出的通用人脸区域和特定人脸区域可能会有重合 ...
【技术保护点】
1.一种基于多任务卷积神经网络的人脸表情识别方法,其特征在于包括以下步骤:1)准备训练样本集
【技术特征摘要】
1.一种基于多任务卷积神经网络的人脸表情识别方法,其特征在于包括以下步骤:1)准备训练样本集i=1,...,N,j=1,...c,其中,N为样本的数目,c表示训练样本集包含的类别数,N和c为自然数;Pi表示第i个训练样本对应的固定大小的图像;表示第i个训练样本对于第j类表情的类别标签:2)设计多任务卷积神经网络结构,网络由两部分组成,第一部分用于提取图片的低层语义特征,第二部分用于提取图片的高层语义特征以及预测输入人脸图片所属的表情类别;3)在设计好的多任务卷积神经网络里,采用多任务学习,同时执行多个单表情判别性特征学习任务以及多表情识别任务,并使用一种联合损失来监督每个单表情判别任务,用于学习对某种表情具有判别性的特征;4)使用大的人脸识别数据集,利用反向传播算法进行预训练;5)使用给定的人脸表情训练样本集进行微调,得到训练好的模型;6)利用训练好的模型进行人脸表情识别。2.如权利要求1所述一种基于多任务卷积神经网络的人脸表情识别方法,其特征在于在步骤2)中,所述设计多任务卷积神经网络结构的具体方法为:(1)网络的第一部分为全卷积网络,用于提取输入图像的中被所有表情所共享的低层语义特征,对于网络的第一部分,采用预激活残差单元结构堆叠多个卷积层;(2)网络的第二部分由多个并行的全连接层和一个用于多表情分类的柔性最大分类层组成,多个并行的全连接层的个数与训练样本集包含的类别数一致,每个并行的全连接层接收网络的第一部分所输出的特征作为输入,获得所有并行的全连接层的输出之后,将这些输出串联起来,作为柔性最大分类层的输入。3.如权利要求1所述一种基于多任务卷积神经网络的人脸表情识别方法,其特征在于在步骤3)中,所述在设计好的多任务卷积神经网络里,采用多任务学习,同时执行多个单表情判别性特征学习任务以及多表情识别任务的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。