一种基于模糊支持向量机的语音情感识别方法技术

技术编号:10525794 阅读:112 留言:0更新日期:2014-10-09 11:14
本发明专利技术涉及语音情感识别技术,具体的说是涉及一种基于模糊支持向量机的语音情感识别方法。本发明专利技术的方法包括:对输入的带有情感的语音信号进行预处理;所述预处理包括预加重滤波和加窗分帧;提取处理后的语音信号的特征信息梅尔倒普系数(MFCC);对所提取的梅尔倒普系数用核主成份分析(KPCA)进行降维处理;根据降维后的梅尔倒普系数特征信息进行分类识别,并输出识别结果;具体的分类识别方法为采用FSVM算法进行;本发明专利技术的有益效果为,通过MFCC情感特征,然后用KPCA对特征降维减少了冗余的信息,比直接使用MFCC特征的识别效果要好很多,其识别率更高,效果更好,且识别速度更快。本发明专利技术尤其适用于语音智能情感识别。

【技术实现步骤摘要】

本专利技术涉及语音情感识别技术,具体的说是涉及一种基于模糊支持向量机的语音 情感识别方法。
技术介绍
专家已经从生理和心理两个领域对情感研究了很长一段时间,随着人工智能的快 速发展,人机交互中的情感研究引起了广大专家的极大兴趣。在人机交互中,希望人类跟机 器能更自然的进行交流,这就需要机器能够理解人类的情感,所以机器对情感的分类识别 显得尤其重要了。在人类交流中,语音包含了丰富的信息,所以机器可以通过语音对情感进 行分类识别。专家们对语音情感分类识别已经进行了大量的研究和分析,一般包括语音情 感库的建立、情感特征提取、分类识别方法的研究。前人为了提高语音情感的识别率,对每 一个环节都进行了改进研究,但没有形成一个统一的系统,识别率也不是很高。前人用梅尔 倒谱系数(MFCC)作为识别特征,但在识别之前没有对此特征做进一步处理,这就会出现很 多冗余的信息影响识别效果。前人在使用分类器的时候发现噪声或孤立点对识别率影响特 别大,为了消除这种影响提高识别率,选择一个合适的分类器成了研究的重点。为了提高语 音情感识别率,对情感特征作适当处理和选择合适的分类方法尤其重要。
技术实现思路
本专利技术所要解决的,就是针对传统技术存在的问题,提出一种基于模糊支持向量 机的语音情感识别方法。 本专利技术解决上述技术问题所采用的技术方案是:一种基于模糊支持向量机的语音 情感识别方法,其特征在于,包括以下步骤: a.对输入的语音信号预处理;所述预处理包括预加重滤波和加窗分帧,其中预加 重滤波的预加重系数α为0. 97,加窗分帧的帧长为30ms ; b.提取处理后的语音信号的特征信息;所述特征信息为梅尔倒普系数(MFCC);其 中,特征信息为26维,包括13维梅尔倒普系数以及13维由梅尔倒普系数推导出的一阶差 分倒普系数; c.对提取的梅尔倒普系数进行降维处理;所述降维处理具体为采用核主成份分 析(KPCA)进行降维;KPCA的处理过程如下: cl.将所获得的η个指标(每一指标有m个样品)的一批数据写成一个(mXn)维 数据矩阵本文档来自技高网...

【技术保护点】
一种基于模糊支持向量机的语音情感识别方法,其特征在于,包括以下步骤:a.对输入的语音信号预处理;所述预处理包括预加重滤波和加窗分帧;b.提取处理后的语音信号的特征信息;所述特征信息为梅尔倒普系数;c.对提取的梅尔倒普系数进行降维处理;所述降维处理具体为采用核主成份分析进行降维;d.将降维处理后的梅尔倒普系数特征信息输入模糊支持向量机分类器,模糊支持向量机分类器输出分类识别结果;所述模糊支持向量机分类器采用模糊支持向量算法对语音训练样本进行训练,具备语音情感分类识别能力;所述语音训练样本经过上述步骤a~c处理后,再用于训练模糊支持向量机分类器;所述模糊支持向量算法的具体步骤为:d1.假设训练样本S0={(x1,y1,s1)(x2,y2,s2),…,(xl,yl,sl)},其中(xl,yl,sl)中的xl为输入样本,yl为输入样本所对应的输出类别值,sl为输入样本的隶属度值,下标l为样本数;d2.在约束条件下求解使目标函数0≤μi≤siC0,i=1,…,l.U=min12Σi=1lΣj=1lμiμjyiyjk(xi,xj)-Σi=1lμi]]>最小的其中μi为Lagrange乘子,C0为惩罚因子,k(xi,xj)=exp(-||xi-xj||2σ2);]]>d3.计算最优权值Y0为隐层输出向量;d4.对于待分类样本X0,计算分类判别函数b是一个常数,j为类别编号,根据判别函数的取值,决定X0的归属类别,其具体方法为:d41.设语音情感有四类,包括高兴、生气、悲伤和平静,先分别对情感类别进行编号,具体为:高兴类别编号为1、生气类别编号为2、悲伤类别编号为3、平静类别编号为4;d42.对于输入向量x,如果fj(x)>0,则将x划分到第j类;如果fj(x)>0满足不止一个类别j(j=1,2,3,4),则将x划分到fj(x)(j∈(1,2,3,4))取最大值的那一类;如果fj(x)≤0,则将数据划分到fj(x)绝对值最小的那个类。...

【技术特征摘要】
1. 一种基于模糊支持向量机的语音情感识别方法,其特征在于,包括以下步骤: a. 对输入的语音信号预处理;所述预处理包括预加重滤波和加窗分帧; b. 提取处理后的语音信号的特征信息;所述特征信息为梅尔倒普系数; c. 对提取的梅尔倒普系数进行降维处理;所述降维处理具体为采用核主成份分析进 行降维; d...

【专利技术属性】
技术研发人员:周代英谭发曾贾继超田兵兵寥阔
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1