一种情感特征提取方法技术

技术编号：21717165 阅读：19 留言：0更新日期：2019-07-27 20:25

本发明专利技术公开了一种情感特征提取方法，包括：对语音中的一帧采样，对语音序列s(n)实行预加重然后做离散FFT变换，再逐步计算得到MFCC参数。本发明专利技术在任何条件下都可以使用MFCC参数，在抗噪能力上MFCC参数具有很强的处理能力，增强了抗噪能力。

A Method of Emotional Feature Extraction

全部详细技术资料下载

【技术实现步骤摘要】
一种情感特征提取方法
本专利技术涉及情感分析
，更为具体地，涉及一种情感特征提取方法。
技术介绍
特征参数提取是为了对语音信号进行分析处理，语音情感识别系统主要提取以短时谱为基础的各种表征，反映人耳听觉特性的MEL频率倒谱系数(MFCC)。Mel频率倒谱系数(MFCC)表示的核心思想是把人的听觉系统对频率感知的非线性特征用于语音识别特征中，具体地说，在50Hz以下的低频段，人耳对频率感知是线性的；在50Hz以上频段，人耳对频率感知呈现对数非线性。Mel频率倒谱参数(MFCC)就是充分利用了人耳对这种频段的感知特性的参数。通过临界带宽的度量方法可以采用Mel刻度，MFCC是将信号频谱的频率轴转换换为Mel刻度，所谓的Mel频率尺度，它的值大体上对应于实际频率的对数分布关系。Mel频率与实际频率的关系式，倒谱系数是通过倒谱域的转换得到的。现有的特征提取技术，存在抗噪特性差等问题。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种情感特征提取方法，在任何条件下都可以使用提取的MFCC参数，在抗噪能力上MFCC参数具有很强的处理能力，因此增强了特质提取过程中的抗噪能力。本专利技术的目的是通过以下技术方案来实现的：一种情感特征提取方法，包括：(1)对语音序列s(n)实行预加重然后做离散FFT变换；(2)对语音中的一帧采样{xi}i＝1,2,…,M，M是帧长，对{xi}i＝1,2,…,M加汉明窗后作M点的FFT，频域分量{Xi}i＝1,2,…,M通过时域信号进行转化，离散功率谱S(n)通过取模的平方得到；(3)计算S(n)通过传递函数Hm(n)求得功率...

【技术保护点】
1.一种情感特征提取方法，其特征在于，包括：(1)对语音序列s(n)实行预加重然后做离散FFT变换；(2)对语音中的一帧采样{xi}i＝1,2,…,M，M是帧长，对{xi}i＝1,2,…,M加汉明窗后作M点的FFT，频域分量{Xi}i＝1,2,…,M通过时域信号进行转化，离散功率谱S(n)通过取模的平方得到；(3)计算S(n)通过传递函数Hm(n)求得功率值，即计算S(n)和Hm(n)的乘积再求和，求得M个参数Pm；(4)计算Pm的自然对数，求得Lm；(5)计算Lm的离散余弦变换，求得Dm；(6)去除直流成分的D0，取D1,D2,…,Dk作为MFCC参数。

【技术特征摘要】
1.一种情感特征提取方法，其特征在于，包括：(1)对语音序列s(n)实行预加重然后做离散FFT变换；(2)对语音中的一帧采样{xi}i＝1,2,…,M，M是帧长，对{xi}i＝1,2,…,M加汉明窗后作M点的FFT，频域分量{Xi}i＝1,2,…,M通过时域信号进行转化，离散功率谱S(n)通过取模的平方得到；(3)计算S(n)通过传递函数Hm(n)求得功率值，即计算S(n)和Hm(n)的乘积再求和，求得M个参数Pm；(4)计算Pm的自然对数，求得Lm；(5)计算Lm的离散余弦变换，求得Dm；(6)去除直流成分的D0，取D1,...

【专利技术属性】
技术研发人员：李剑峰，
申请(专利权)人：湖南检信智能科技有限公司，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人