一种用于语音情感识别的语音情感特征提取方法技术

技术编号：4089825 阅读：256 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种用于语音情感识别的语音情感特征提取方法，包括下列步骤：１）对语音信号进行ＦＦＴ计算得到均匀的通带能量；２）以通带能量为特征，计算各频点处的语音情感信息的Ｆ－Ｒａｔｉｏ值，得出语音情感信息的Ｆ－Ｒａｔｉｏ值在各个频带上的分布图；３）根据所述语音情感信息的Ｆ－Ｒａｔｉｏ值在各个频带上的分布图得出非均匀美尔子带滤波器，所述非均匀美尔子带滤波器各个通带的带宽和其所对应的Ｆ－Ｒａｔｉｏ值成反比关系；４）用所述非均匀美尔子带滤波器得到待识别语音信号各子带的能量输出，进而得出待识别语音信号的语音情感特征。本发明专利技术能够加大各类情感之间的鉴别性，相比于传统的ＭＦＣＣ特征，提高了情感识别的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音情感识别
，具体地说，本专利技术涉及一种应用于语音情感识别系统的特征提取方法。
技术介绍
随着计算机网络通信技术和多媒体技术的飞速发展，新型的人机交互技术已成为当前计算机科学领域一个十分活跃的研究课题。语音情感识别的研究对于增强计算机的智能化和人性化，开发新型人机环境，以及推动心理学等学科的发展，有着重要的现实意义，并最终产生很大经济效益和社会效益。语音情感识别，对于语音识别整体技术的提高也是很有好处的。一般说来，语音中包含了说话内容、说话人、情感、语气、语义等丰富信息。其中对于说话内容的识别，也就是常规的语音识别，以及说话人识别等，业界进行了长期的持续的研究，也取得了不错的成果。近来，以NIST (美国标准技术研究所)主导的丰富标注评测项目，引起来越来越多的人的关注。语音识别不再是单独对内容的识别，而是更加注重对含义、情感等信息的提取。另一方面，情感信息的提取，还能为语音识别提供信息和补偿作用，推动语音识别稳健性的提升。关于语音情感识别的研究，可以采用的分类器都已近很成熟了，如混合高斯模型分类器(参见黄锋，尹俊勋，“一种基于GMM模型的语音情感识别方法”，《微计算机信息》， 2009 25(10))。而如何从语音信号中提取出更加适合于语音情感识别的特征成为了提高识别率的最关键问题。之前的很多研究，大多数采用了基于韵律的特征，不过单独使用韵律特征的系统，其识别率是不理想的，原因之一就是很多情感的韵律特征有相同的特性，导致分类器不能很好的将它们分开。而传统的应用于说话人识别和语音识别里面的基于频谱的特征...

【技术保护点】
一种用于语音情感识别的语音情感特征提取方法，包括下列步骤：１）对已知情感的标准预料库中的语音信号进行ＦＦＴ计算、并通过均匀带通滤波器得到均匀的通带能量；２）以步骤１）所得到的通带能量为特征，计算各频点处的语音情感信息的Ｆ－Ｒａｔｉｏ值，得出语音情感信息的Ｆ－Ｒａｔｉｏ值在各个频带上的分布图；３）根据所述语音情感信息的Ｆ－Ｒａｔｉｏ值在各个频带上的分布图得出非均匀美尔子带滤波器，所述非均匀美尔子带滤波器各个通带的带宽和其所对应的Ｆ－Ｒａｔｉｏ值成反比关系；４）对待识别语音信号，进行ＦＦＴ计算得到能量频谱，然后用所述非均匀美尔子带滤波器进行滤波，得到所述待识别语音信号各非均匀美尔子带的能量输出，进而得出所述待识别语音信号的语音情感特征。

【技术特征摘要】
一种用于语音情感识别的语音情感特征提取方法，包括下列步骤1)对已知情感的标准预料库中的语音信号进行FFT计算、并通过均匀带通滤波器得到均匀的通带能量；2)以步骤1)所得到的通带能量为特征，计算各频点处的语音情感信息的F Ratio值，得出语音情感信息的F Ratio值在各个频带上的分布图；3)根据所述语音情感信息的F Ratio值在各个频带上的分布图得出非均匀美尔子带滤波器，所述非均匀美尔子带滤波器各个通带的带宽和其所对应的F Ratio值成反比关系；4)对待识别语音信号，进行FFT计算得到能量频谱，然后用所述非均匀美尔子带滤波器进行滤波，得到所述待识别语音信号各非均匀美尔子带的能量输出，进而得出所述待识别语音信号的语音情感特征。2.根据权利要求1所述的语音情感特征提取方法，其特征在于，所述步骤1)还包括在进行FFT计算前，首先对语音信号进行预处理和加窗；所述预处理包括去掉所述语音信号中的静音和噪声。3.根据权利要求1所述的语音情感特征提取方法，其特征在于，所述步骤2)中，F — Ratio = -fi=1 ^ - f ~-Q Σ =1 Sj = I — eO2其中，^ =悬Σ =1=忐Ef=I Σ =1 ^是第i种情感...

【专利技术属性】
技术研发人员：颜永红，周瑜，孙艳庆，李军锋，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人