基于鉴别局部保持投影的多模态情感特征融合方法技术

技术编号:13983968 阅读:251 留言:0更新日期:2016-11-12 19:22
本发明专利技术公开了基于鉴别局部保持投影的多模态情感特征融合方法,该方法首先对多模态情感数据库中每种模态的样本数据提取情感特征,如语音特征、表情特征、姿态特征等,然后采用鉴别局部保持投影方法将各种模态的情感特征映射到统一的鉴别子空间中,最后将映射后的多组特征进行串联融合,得到融合的多模态情感特征。以融合的多模态情感特征作为输入的分类器能够有效地识别出生气、反感、害怕、高兴、悲伤和惊讶等基本情感,为开发人类情感分类识别系统以及人机交互的实现提供了一种新的方法和途径。

【技术实现步骤摘要】

本专利技术属于图像处理与模式识别领域,涉及一种应用于多模态情感识别的特征融合方法,特别涉及一种基于鉴别局部保持投影的多模态情感特征融合方法
技术介绍
情感表达一直是人类交流和互相理解的最主要方式。由于计算机技术的大力发展,人机交互能力(HCI,Human Computer Interaction)变得越来越具有研究价值和现实意义,计算机如何对人的情感进行识别也就变得至关重要。随着信息技术的不断发展,无论是在实验室还是现实生活中,人类表达的情感信息很容易被各种各样的传感器获得。其中图像和语音是最容易获得的情感信息且对于情感识别来说也是最重要的信息。计算机能识别哪些情感是一个复杂的问题,在现实生活中人所表达的情感经常只有细微的差异,而这些差异人类都很难辨别,所以目前来说计算机只能识别一些基本的情感,例如生气、反感、害怕、高兴、悲伤和惊讶等基本情感。然而对这些基本情感进行识别的情感技术已经有了广泛的应用领域,例如在教育、医疗、人机交互、影音娱乐等领域。过去几十年,已经有很多基于单模态的情感识别,最常见的是面部表情情感识别,语音情感识别和基于姿态的情感识别,然而单模态情感识别有较大的限制,因为人所表达的情感信息是是一种多模态的情感信息,例如一个人表达愤怒,他的声音、面部表情、身体姿态、心率以及体温等等都会与正常状态下有较大的不同。如果只采用一种模态的情感特征进行识别,势必不会得到较好的结果,尤其是在现实环境中。研究结果表明,相比于单模态情感识别,多模态情感识别更加可靠和准确。多模态情感识别考虑了人所表达的多种情感信息,全面的衡量人所表达的情感,在实际生活中对于不同情况的干扰(例如对于人脸的图像信息,可能会有不同的光照,角度等问题)也更具鲁棒性。对于多模态情感识别,特征融合是最重要的一环,它将不同的传感器得到的不同的情感特征进行融合从而得到融合特征送入分类器进行识别。常见的特征融合方法主要分为三类:得分层融合方法,特征层融合方法和决策层融合方法。目前这三种方法为了有利于实时性,既要保持足够的重要信息又要实现信息压缩,不可避免的会有信息损失,导致识别的精确度下降。其中特征层融合方法在语音和图像领域具有广泛的应用。目前对多模态情感识别的研究远没有单模态情感识别完善和丰富。现有技术中,公开号为CN105138991A、名称为“一种基于情感显著性特征融合的视频情感识别方法”的专利技术专利公开了一种基于情感显著性特征融合的视频情感识别方法,其缺点是:只能对视频中的图像特征和语音特征进行特征融合,可扩展性差,不能对其他更多模态的特征进行特征融合;提取的图像和语音特征均非直接的情感特征而是用颜色情感强度值和音频情感词典进行表示;融合算法过于简单,通过简单的加权融合后的情感特征可判别性较差。
技术实现思路
本专利技术要解决的技术问题是针对多模态情感识别的特征融合方法存在的融合后的情感特征判别性较差的问题,以及现有单模态情感识别技术不能获得较为准确的识别结果的问题。为解决上述问题,本专利技术针对人类情感自动评估系统以及人机交互系统的需求,提出基于鉴别局部保持投影的多模态情感特征融合方法,为人机交互问题提供了一种更为准确、可靠的途径。具体的技术方案如下:基于鉴别局部保持投影的多模态情感特征融合方法,包括以下步骤:A、首先对多模态情感数据库中每种模态的样本数据提取情感特征,然后将各种模态的情感特征向量进行降维处理,对于第j种模态的样本用dj维特征向量xijr来表示,即其中,1≤j≤m,m为模态的数目,1≤i≤c,c为情感类别的数目,1≤r≤nij,nij为属于第i类情感、第j种模态的样本数目,xijr表示属于第i类情感、第j种模态的第r个样本的特征向量;B、对降维后的不同模态的特征向量进行鉴别局部保持投影,得到最佳的投影方向α;C、分别对不同模态的特征向量进行映射,Yj=αTXj,Xj为c个Xij组成的矩阵,即Xj=[X1j,...,Xij,...,Xcj]T;D、将映射后的特征进行串联得到融合特征:Z=[αTX1,...,αTXj,...,αTXm]T。进一步,步骤B中降维后进行鉴别局部保持投影目的是求解最佳的投影矩阵α,将各种模态的情感特征向量xijr映射到统一的鉴别子空间中,得到映射后的特征向量yijr,具体步骤如下:B1:定义类内离散度矩阵 S W y = 1 2 ( Σ i = 1 c Σ j = 1 m Σ r = 1 n i j Σ l = 1 n i j ( y i j r - y i 本文档来自技高网
...

【技术保护点】
基于鉴别局部保持投影的多模态情感特征融合方法,其特征在于包括以下步骤:A、首先对多模态情感数据库中每种模态的样本数据提取情感特征,然后将各种模态的情感特征向量进行降维处理,对于第j种模态的样本用dj维特征向量xijr来表示,即其中,1≤j≤m,m为模态的数目,1≤i≤c,c为情感类别的数目,1≤r≤nij,nij为属于第i类情感、第j种模态的样本数目,xijr表示属于第i类情感、第j种模态的第r个样本的特征向量;B、对降维后的不同模态的特征向量进行鉴别局部保持投影,得到最佳的投影方向α;C、分别对不同模态的特征向量进行映射,Yj=αTXj,Xj为c个Xij组成的矩阵,即Xj=[X1j,...,Xij,...,Xcj]T;D、将映射后的特征进行串联得到融合特征:Z=[αTX1,...,αTXj,...,αTXm]T。

【技术特征摘要】
1.基于鉴别局部保持投影的多模态情感特征融合方法,其特征在于包括以下步骤:A、首先对多模态情感数据库中每种模态的样本数据提取情感特征,然后将各种模态的情感特征向量进行降维处理,对于第j种模态的样本用dj维特征向量xijr来表示,即其中,1≤j≤m,m为模态的数目,1≤i≤c,c为情感类别的数目,1≤r≤nij,nij为属于第i类情感、第j种模态的样本数目,xijr表示属于第i类情感、第j种模态的第r个样本的特征向量;B、对降维后的不同模态的特征向量进行鉴别局部保持投影,得到最佳的投影方向α;C、分别对不同模态的特征向量进行映射,Yj=αTXj,Xj为c个Xij组成的矩阵,即Xj=[X1j,...,Xij,...,Xcj]T;D、将映射后的特征进行串联得到融合特征:Z=[αTX1,...,αTXj,...,αTXm]T。2.根据权利要求1所述的基于鉴别局部保持投影的多模态情感特征融合方法,其特征在于步骤B中,所述鉴别局部保持投影目的是求解最佳的投影矩阵α,将各种模态的情感特征向量xijr映射到统一的鉴别子空间中,得到映射后的特征向量yijr,具体步骤如下:B1:定义类内离散度矩阵 S W y = 1 2 ( Σ i = 1 c Σ j = 1 m Σ r = 1 n i j Σ l = 1 n i j ( y i j r - y i j l ) ( y i j r - y i j l ) T + Σ i = 1 c Σ j = 1 m Σ k = 1 , j ≠ k m Σ r = 1 n i j Σ l = 1 n i j ( y i j r - y i k l ) ( y i j r - y i k l ) T ) W r l ]]>其中,yikl代表来自第i类情感、第k种模态的第l个样本映射后的特征向量,1≤k≤m,Wrl为来自相同情感和模态的特征向量之间的局部保持权重;B2:定义类间离散度矩阵 S B y = 1 2 ( Σ i = 1 c Σ h = 1 c ( μ i - μ h ) ( μ i - μ h ) T ) B i h ]]>其中Bih为来自相同模态的特征向量均值之间的局部保持权重,μi为第i类样本映射后的特征向量均值: μ i = 1 n i Σ j = 1 m Σ r = 1 n i j y i j r ]]>其中,ni为第i类中样本的数目,μh为第h类样本的的特征向量均值;B3:最大化类间离散度矩阵,最小化类内离散度矩阵,这一目标可以表示为如下最优化问题: ( α 1 * , α 2 * , ... , α m * ) = arg m a x α 1 , α 2 , ... , α m T r ( S B y ) T r ( S W y ) ]]>其中,Tr(·)为矩阵的迹。3.根据权利要求2所述的基于鉴别局部保持投影的多模态情感特征融合方法,其特征在于步骤B1中,所述特征向量之间的局部保持权重矩阵Wrl,具体定义如下:定义来自相同情感和模态的特征向量xijr与xijl之间的局部保持权重矩阵其中,xijl代表来自第i类情感、第j种模态的第l个样本的特征向量,1≤l≤nij,参数t可由经验进行设定,对来自不同情感或模态的特征向量不考虑它们之间的权重。4.根据权利要求2所述的基于鉴别局部保持投影的多模态情感特征融合方法,其特征在于步骤B2中,所述特征向量均值之间的局部保持权重矩阵Bih,具体步骤和定义如下:首先计算第i类情感、第j种模态的特征向量均值 μ i j ( x ) = 1 n i j Σ r = 1 n i j x i j r ]]>其中的上标(x)代表原样本空间,同样计算来自第h类情感、第j种模态的特征向量均值 μ h j ( x ) = 1 n h j Σ r = 1 n i j x h j r ]]>其中,nhj为属于第h类情感、第j种模态的样本数目,xhjr表示属于第h类情感、第j种模态的第r个样本的特征向量,1≤h≤c;定义来自相同模态的特征向量均值与之间的局部保持权重矩阵其中,参数t同样可由经验进行设定,对于对来自不同模态的特征向量均值不考虑它们之间的权重。5.根据权利要求2所述的基于鉴别局部保持投影的多模态情感特征融合方法,其特征在于步骤B3中,所述的最优化问题,将最大化类间离散度矩阵,最小化类内离散度,得到最大的投影方向具体步骤如下:B3.1:对B3中的最优化问题进行变换,得到如下最优化问题: ( α 1 * , α 2 * , ... , α m * ) = arg m a x α 1 , α 2 , ... , α m T r ( α T D α ) T r ( α T S α ) ]]>最优化式子中分母部分为类内离散度矩阵: α T S α = α 1 T α 2 T ... α m T S 11 S 12 ... S 1 m S 21 S 22 ... S 2 m . . . . . . . . . . . . S m 1 S m 2 ... S m m α 1 α 2 . . ....

【专利技术属性】
技术研发人员:徐嵚嵛卢官明闫静杰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1