一种情感特征提取方法技术

技术编号:21717165 阅读:19 留言:0更新日期:2019-07-27 20:25
本发明专利技术公开了一种情感特征提取方法,包括:对语音中的一帧采样,对语音序列s(n)实行预加重然后做离散FFT变换,再逐步计算得到MFCC参数。本发明专利技术在任何条件下都可以使用MFCC参数,在抗噪能力上MFCC参数具有很强的处理能力,增强了抗噪能力。

A Method of Emotional Feature Extraction

【技术实现步骤摘要】
一种情感特征提取方法
本专利技术涉及情感分析
,更为具体地,涉及一种情感特征提取方法。
技术介绍
特征参数提取是为了对语音信号进行分析处理,语音情感识别系统主要提取以短时谱为基础的各种表征,反映人耳听觉特性的MEL频率倒谱系数(MFCC)。Mel频率倒谱系数(MFCC)表示的核心思想是把人的听觉系统对频率感知的非线性特征用于语音识别特征中,具体地说,在50Hz以下的低频段,人耳对频率感知是线性的;在50Hz以上频段,人耳对频率感知呈现对数非线性。Mel频率倒谱参数(MFCC)就是充分利用了人耳对这种频段的感知特性的参数。通过临界带宽的度量方法可以采用Mel刻度,MFCC是将信号频谱的频率轴转换换为Mel刻度,所谓的Mel频率尺度,它的值大体上对应于实际频率的对数分布关系。Mel频率与实际频率的关系式,倒谱系数是通过倒谱域的转换得到的。现有的特征提取技术,存在抗噪特性差等问题。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种情感特征提取方法,在任何条件下都可以使用提取的MFCC参数,在抗噪能力上MFCC参数具有很强的处理能力,因此增强了特质提取过程中的抗噪能力。本专利技术的目的是通过以下技术方案来实现的:一种情感特征提取方法,包括:(1)对语音序列s(n)实行预加重然后做离散FFT变换;(2)对语音中的一帧采样{xi}i=1,2,…,M,M是帧长,对{xi}i=1,2,…,M加汉明窗后作M点的FFT,频域分量{Xi}i=1,2,…,M通过时域信号进行转化,离散功率谱S(n)通过取模的平方得到;(3)计算S(n)通过传递函数Hm(n)求得功率值,即计算S(n)和Hm(n)的乘积再求和,求得M个参数Pm;(4)计算Pm的自然对数,求得Lm;(5)计算Lm的离散余弦变换,求得Dm;(6)去除直流成分的D0,取D1,D2,…,Dk作为MFCC参数。进一步的,在步骤(1)中,通过传递函数为H(Z)=1-αZ-1的滤波器对其加以滤波,其中α为预加重系数且0.9<α<10,设n时刻的语音采样值为X(n),经过预加重处理后的结果为Y(n)=X(n)-αX(n-1),0.9<α<1.0。进一步的,在步骤(1)中,k=12。进一步的,在步骤(1)中,语音中的一帧采样,为了计算FFT方便,取n=256点。本专利技术的有益效果是:(1)本专利技术在任何条件下都可以使用MFCC参数,在抗噪能力上MFCC参数具有很强的处理能力,增强了抗噪能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的步骤流程示意图。具体实施方式下面结合附图进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。本说明书中公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。下面将详细描述本专利技术的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本专利技术。在以下描述中,为了提供对本专利技术的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本专利技术。在其他实例中,为了避免混淆本专利技术,未具体描述公知的电路,软件或方法。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在对实施例进行描述之前,需要对一些必要的术语进行解释。例如:若本申请中出现使用“第一”、“第二”等术语来描述各种元件,但是这些元件不应当由这些术语所限制。这些术语仅用来区分一个元件和另一个元件。因此,下文所讨论的“第一”元件也可以被称为“第二”元件而不偏离本专利技术的教导。应当理解的是,若提及一元件“连接”或者“联接”到另一元件时,其可以直接地连接或直接地联接到另一元件或者也可以存在中间元件。相反地,当提及一元件“直接地连接”或“直接地联接”到另一元件时,则不存在中间元件。在本申请中出现的各种术语仅仅用于描述具体的实施方式的目的而无意作为对本专利技术的限定,除非上下文另外清楚地指出,否则单数形式意图也包括复数形式。当在本说明书中使用术语“包括”和/或“包括有”时,这些术语指明了所述特征、整体、步骤、操作、元件和/或部件的存在,但是也不排除一个以上其他特征、整体、步骤、操作、元件、部件和/或其群组的存在和/或附加。如图1所示,一种情感特征提取方法,包括:(1)对语音序列s(n)实行预加重然后做离散FFT变换;(2)对语音中的一帧采样{xi}i=1,2,…,M,M是帧长,对{xi}i=1,2,…,M加汉明窗后作M点的FFT,频域分量{Xi}i=1,2,…,M通过时域信号进行转化,离散功率谱S(n)通过取模的平方得到;(3)计算S(n)通过传递函数Hm(n)求得功率值,即计算S(n)和Hm(n)的乘积再求和,求得M个参数Pm;(4)计算Pm的自然对数,求得Lm;(5)计算Lm的离散余弦变换,求得Dm;(6)去除直流成分的D0,取D1,D2,…,Dk作为MFCC参数。进一步的,在步骤(1)中,通过传递函数为H(Z)=1-αZ-1的滤波器对其加以滤波,其中α为预加重系数且0.9<α<10,设n时刻的语音采样值为X(n),经过预加重处理后的结果为Y(n)=X(n)-αX(n-1),0.9<α<1.0。进一步的,在步骤(1)中,k=12。进一步的,在步骤(1)中,语音中的一帧采样,为了计算FFT方便,取n=256点。实施例1一种情感特征提取方法,包括:(1)对语音序列s(n)实行预加重然后做离散FFT变换;(2)对语音中的一帧采样{xi}i=1,2,…,M,M是帧长,对{xi}i=1,2,…,M加汉明窗后作M点的FFT,频域分量{Xi}i=1,2,…,M通过时域信号进行转化,离散功率谱S(n)通过取模的平方得到;(3)计算S(n)通过传递函数Hm(n)求得功率值,即计算S(n)和Hm(n)的乘积再求和,求得M个参数Pm;(4)计算Pm的自然对数,求得Lm;(5)计算Lm的离散余弦变换,求得Dm;(6)去除直流成分的D0,取D1,D2,…,Dk作为MFCC参数。特征参数提取是为了对语音信号进行分析处理。语音情感识别系统主要提取以短时谱为基础的各种表征,反映人耳听觉特性的MEL频率倒谱系数(MFCC)。Mel频率倒谱系数(MFCC)表示的核心思想是把人的听觉系统对频率感知的非线性特征用于语音识别特征中,具体地说,在50Hz以下的低频段,人耳对频率感知是线性的;在50Hz以上频段,人耳对频率感知呈现对数非线性。Mel频率倒谱本文档来自技高网...

【技术保护点】
1.一种情感特征提取方法,其特征在于,包括:(1)对语音序列s(n)实行预加重然后做离散FFT变换;(2)对语音中的一帧采样{xi}i=1,2,…,M,M是帧长,对{xi}i=1,2,…,M加汉明窗后作M点的FFT,频域分量{Xi}i=1,2,…,M通过时域信号进行转化,离散功率谱S(n)通过取模的平方得到;(3)计算S(n)通过传递函数Hm(n)求得功率值,即计算S(n)和Hm(n)的乘积再求和,求得M个参数Pm;(4)计算Pm的自然对数,求得Lm;(5)计算Lm的离散余弦变换,求得Dm;(6)去除直流成分的D0,取D1,D2,…,Dk作为MFCC参数。

【技术特征摘要】
1.一种情感特征提取方法,其特征在于,包括:(1)对语音序列s(n)实行预加重然后做离散FFT变换;(2)对语音中的一帧采样{xi}i=1,2,…,M,M是帧长,对{xi}i=1,2,…,M加汉明窗后作M点的FFT,频域分量{Xi}i=1,2,…,M通过时域信号进行转化,离散功率谱S(n)通过取模的平方得到;(3)计算S(n)通过传递函数Hm(n)求得功率值,即计算S(n)和Hm(n)的乘积再求和,求得M个参数Pm;(4)计算Pm的自然对数,求得Lm;(5)计算Lm的离散余弦变换,求得Dm;(6)去除直流成分的D0,取D1,...

【专利技术属性】
技术研发人员:李剑峰
申请(专利权)人:湖南检信智能科技有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1