The invention relates to the field of biometric feature recognition, in particular to a neural network expression recognition method based on graph structure, which includes: locating multiple key points of facial expression recognition; extracting texture feature vectors of each key point by using a filter; taking each texture feature vector extracted as a node, and connecting each node to form a graph structure, and linking the key points as described above. The edge of the graph structure is represented by Euclidean distance, which is used to replace the expression image. The graph structure is input into the BRNN neural network, and the result of expression classification is output on the last time step of the BRNN neural network by multiple iterations. The method makes full use of the texture and geometric feature information of different expressions to solve the problem of reducing the accuracy of expression recognition due to the interference information existing in the images.
【技术实现步骤摘要】
基于图结构的神经网络表情识别方法
本专利技术涉及生物特征识别领域,具体为基于图结构的神经网络表情识别方法。
技术介绍
在人脸表情识别的研究中,从人脸图像中抽取有效的表达信息是关键的步骤,早期的表情识别研究主要从特征学习、特征提取和分离器的构建三个方面入手。首先,人们从图像或者视频系列中提取有关面部外观或者几何形状变化信息,代表方法如LBP-TOP,HOG3D,DTAGN和STM-ExpLet。然后,从中选取出可以有效代表面部表情的特征子集,最后,根据提取的特征,构建一个有效的分类器对面部表情进行识别。但相对来说,传统的分类学习办法难取得较好的效果。表情识别方法主要分为两大类,分别是基于单帧静止图像和基于时序多张图像的方法。在早期的表情识别中主要针对静止单帧的图片进行识别,现有的部分研究者开始尝试针对表情序列进行识别,使得传统的办法被扩展为针对表情序列识别,如3D-HOG,LBP-TOP和3D-SIFT等。这些传统方法中,研究者有采用纵向图集构建的方法在Oulu-CASIA数据库上得到了最好的结果;为了提取更加有效的时空特征,又提出了基于时域和空域的方法,并且在CK+和MMI数据库上取得了传统方法中最好的结果。所以,这三个表情数据库在表情识别实验中被广泛的使用。最近几年,由于计算机性能的大幅度提升,深度学习方法在各个领域都取得了卓越的成果。因此,越来越多的研究者尝试使用深度学习方法来进行表情识别,目前已有较好的深度学习方法被提出,其不同于早期的直接将图片输入给神经网络的办法,而是专注于如何优化神经网络的输入。由理论可知,如图1所示,面部表情的产生可以看作是面 ...
【技术保护点】
1.基于图结构的神经网络表情识别方法,其特征在于,包括:定位脸部表情识别的多个关键点;使用滤波器提取每个关键点的纹理特征向量;将提取的每个纹理特征向量作为节点,每个节点相互连接形成图结构,各关键点之间的连线作为所述图结构的边,用欧式距离表示各关键点之间的几何特征信息,所述图结构用于代替表情图像;所述图结构输入到BRNN神经网络中;使用多次迭代的方式在所述BRNN神经网络的最后一个时间步上输出表情分类的结果。
【技术特征摘要】
1.基于图结构的神经网络表情识别方法,其特征在于,包括:定位脸部表情识别的多个关键点;使用滤波器提取每个关键点的纹理特征向量;将提取的每个纹理特征向量作为节点,每个节点相互连接形成图结构,各关键点之间的连线作为所述图结构的边,用欧式距离表示各关键点之间的几何特征信息,所述图结构用于代替表情图像;所述图结构输入到BRNN神经网络中;使用多次迭代的方式在所述BRNN神经网络的最后一个时间步上输出表情分类的结果。2.根据权利要求1所述的基于图结构的神经网络表情识别方法,其特征在于,所述关键点采用DRMF方法标定出人脸的66个关键点,去除人脸外部轮廓的17个关键点,剩余49个关键点作为脸部的表情识别。3.根据权利要求2所述的基于图结构的神经网络表情识别方法,其特征在于,所述图结构的表示:所述滤波器采用Gabor滤波器,所述Gabor滤波器包含尺度λ和角度θ两个参数,尺度λ和角度θ两个参数的组合:其中,x,y分别表示所述节点坐标位置,φ表示相位偏移量,σ表示高斯函数的标准差,γ表示空间纵横比,尺度λ和角度θ参数的设置:令θ={0,π/4,π/2,3π/4,π,5π/4,3π/2,2π},产生一组共计5*8=40组的Gabor特征向量,用xi(i=1,2,...,49)来表示节点i的值;计算所述图结构中各关键点之间的欧式距离,生成一个49*49的矩阵,用eij(i,j=1,2,...,49)来表示所述图结构中各条边的值。4.根据权利要求3所述的基于图结构的神经网络表情识别方法,其特征在于,所述BRNN神经网络对所述图结构的处理方式:在将所述图结构输入BRNN神经网络之前,将各个节点信息xi和其对应的边信息eij有效组合,形成新的特征向量节点ni(i=1,2,...,49);将所述BRNN神经网络中的非线性单元替换为GRU单元;将每个ni输入到各自对应的GRU...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。