共振峰析取方法技术

技术编号:3046423 阅读:199 留言:0更新日期:2012-04-11 18:40
在用较少计算复杂性、能够精确地按话音的谐振频率获得共振峰的共振峰析取法中,所述方法包括通过谱峰值采集法搜索最大值,判断符合获得的最大点处的零点的共振峰数目是否为两个,并且当共振峰数目判断为两个时,通过根精加工分析相关根。通过应用柯西积分公式判断共振峰的数目,其中不重复应用柯西积分公式,而仅在z域内的最大值的周围部分中应用。

【技术实现步骤摘要】

本专利技术涉及按话音谐振频率识别共振峰,尤其涉及一种能够以较少计算复杂性精确地识别共振峰的。
技术介绍
一般地,为了按话音谐振频率识别共振峰,已广泛地使用了一种用于搜索线性预测谱或平稳倒谱(cepstrally smoothed spectrum)中的最大值点的谱峰值采集方法。然而,因为在多数情况下,两个共振峰彼此接近,所以它们在谱中显示为一个最大值。在谱峰值采集方法中,尽管已向FFT(快速傅立叶变换)给出了足够大的等级(degree)以获得谱,但难以在频率范围内精确地析取共振峰。为了解决这个问题,已提出了通过使用线性预测系数在预测误差滤波器中计算根的方法。在这些方法之中,一种通过使用根析取方法及由R.C.Snell提出的柯西积分公式而获得根的方法是具有代表性的。在根析取方法中,通过按时机需要(occasion demand)将汉明(Hamming)窗、凯瑟(Kaiser)窗等乘以适当的语音信号段(约20ms~40ms)获得短时信号,从该短时信号中获得线性预测系数及预测误差滤波器,从该预测误差滤波器中获得零点,并通过使用等式F=fs2πθ0]]>获得共振峰。其中,θ0是零点的相位,fs是信号的采样率,F是要获得的共振峰。在分析能力方面,根析取法优于谱峰值采集法;然而,不可能设置确定的基准以判断实际上获得的根是否直接与共振峰有关。另外,由于根析取法具有高计算复杂性和低精度,所以已不被广泛使用。由R.C.Snell提出的方法用于通过使用柯西积分公式反复地搜索一个区域,在所述区域中零点存在于z域中。与根析取法相比,使用这种方法,计算复杂性及精度提高。然而,因为用于判断实际上获得的根是否直接与共振峰有关的基准没有给出,因此可靠性低。因此,由于用于获得共振峰的传统方法具有低分析能力、可靠性、精度及/或较大的计算复杂性,所以难以精确地分析共振峰。
技术实现思路
为了解决上面提及的问题,本专利技术的目的是提供可以精确地、用较少计算复杂性识别共振峰的。本专利技术的其它特征和优点将在随后的描述中阐明,并且从所述描述中部分是显而易见的,或可通过本专利技术的实践认识到。特别地,本专利技术的目的和优点将通过在后面的描述及附图中指出的结构实现。为了实现这些和其它优点,并且根据本专利技术的目的,如实施例和广泛地描述那样,在中实施本专利技术,该方法包括获得谱中的最大值,判断对应于最大点处的零点的共振峰的数目是否为两个,以及当判断共振峰的数目为两个时,通过根精加工分析根。在一方面,可以功过谱峰值采集法获得最大值。而且,可以通过应用柯西积分公式获得共振峰的数目。在详细的方面,可以将柯西积分公式应用于在特定区域内具有最大值的点的周围区域,其中特定区域为z域。在进一步方面,根可以是对应于判断为两个的共振峰数目的零点。更进一步地,在根精加工中可以使用Bairstow算法或逼近方法。在另一方面,可以使用析取的共振峰作为话音识别的特征向量或用于共振峰声码器。在更详细的方面,在接收话音信号并分析该信号时,使用一种,该方法包括接收新的话音信号帧,预处理所述接收的话音信号,将预处理的话音信号的适当范围乘以一窗函数来析取短时信号,从析取的短时信号中获得线性预测系数并从中获得特定谱,在特定谱中搜索最大点并判断最大点是否可能与至少两个共振峰有关,鉴别最大点实际上与至少两个共振峰有关,并且当最大点实际上与至少两个共振峰有关时,通过根精加工分析相关根。在一个方面,预处理接收的话音信号包括对接收的话音信号进行滤波,增强接收的话音信号或使接收的话音信号通过预增强滤波器。在进一步方面,语音信号的适当范围为约20ms~40ms。在另一个方面,窗函数可能为汉明窗函数、凯塞窗函数或布莱克曼窗函数。在进一步方面,特定谱是线性预测谱或经倒谱均衡的谱。在另一个方面,使用柯西积分公式以判断最大点是否实际上与至少两个共振峰有关,其中柯西积分公式应用于特定区域内的最大值的周围部分,其中特定区域为z域。在更详细的方面,在根精加工中使用Bairstow算法或根逼近方法。在一方面,根是对应于判断为两个的共振峰数目的零点。在另一个方面,可以使用析取的共振峰作为话音识别的特征向量或用于共振峰声码器。要理解到,本专利技术的上述一般的说明及下列详细的说明是示例性和说明性的,并且如所要求的那样,将要提供各方面的更进一步的解释。附图说明所包含的用以提供对本专利技术的进一步理解、并接合在本说明书中以构成其一部分的附图,显示出本专利技术的实施例,并且连同说明书一起用以解释本专利技术的原理。不同的附图中以相同的参考标号表示的本专利技术的特征、要素及方面代表了一个或多个实施例中相同、相当、或类似的特征、要素或方面。图1是说明根据本专利技术的一个实施例的的流程图。图2是说明根据本专利技术的一个实施例的的更详细的流程图。图3是说明根据本专利技术的一个实施例的z域的最大值的相位及其周围的共振峰的组合范围的图。具体实施例方式本专利技术涉及。在下文中,将参考附图描述本专利技术的较佳实施例。图1是说明本专利技术的一个实施例的的流程图。如图1的步骤S10所示,包括搜索谱中的最大值及获得与共振峰有关的最大点。在步骤S20中,该方法判断在最大点处从零点获得的共振峰的数目是否为两个。在步骤S30中,当判断共振峰的数目为两个时,该方法通过根精加工(root polishing)来分析根。较佳地使用谱峰值采集方法,在谱中搜索可能与至少两个共振峰有关的最大值和最大点,如步骤S10所示。然后,较佳地通过使用柯西积分公式,检验最大点是否与一个共振峰或至少两个共振峰有关,如步骤S20所示。在此,不重复应用柯西积分公式;相反地,柯西积分公式应用于具有z域中的最大值的点的周围区域,其中,可以通过下列公式描述柯西积分公式。n(Γ)=12πj∫ΓA′(z)A(z)dz]]>在检验结果中,当判断到两个共振峰叠加为一个时,用根精加工方法分析相关的零点,如步骤S30所示。在此,可以使用诸如Bairstow算法之类的根精加工方法。图2是说明本专利技术的一个实施例的的更详细的流程图。参考图2,在如步骤S100所示接收到初始话音信号后,话音信号随后经过预处理步骤,其中接收的信号被滤波、增强,或通过预增强滤波器,如步骤S110所示。在话音信号经过预处理步骤后,将适当的信号段(约20ms~40ms)乘以一窗函数,以析取一短时信号,如步骤S120所示。窗函数用于通过减少截短信号的尾部大小降低由不连续点产生的频率失真。一般地,使用汉明窗函数。然而,也可以使用汉宁(Hanning)窗函数、凯塞窗函数或布莱克曼(Blackmann)窗函数。随后,如步骤S130所示,从析取的短时信号中获得线性预测系数,并且如步骤S140所示,从线性预测系数中获得线性预测谱或经倒谱均衡的谱。随后,如步骤S150所示,在获得的谱中搜索对应于最大值的点。在步骤S160,判断对应于最大值的最大点是否可能与至少两个重叠的共振峰有关。因为没有必要检验所有最大值,当在检查共振峰的可能分布后,在谱中两个共振峰不可能显示为一个共振峰时,省略后处理。通过检查在“Discrete-Time Processing of Speec本文档来自技高网
...

【技术保护点】
一种共振峰析取方法,其特征在于,包括:获得谱中的最大值;判断对应于最大点处的零点的共振峰的数目是否为两个;以及当判断共振峰的数目为两个时,通过根精加工分析根。

【技术特征摘要】
KR 2003-10-6 10-2003-00691751.一种共振峰析取方法,其特征在于,包括获得谱中的最大值;判断对应于最大点处的零点的共振峰的数目是否为两个;以及当判断共振峰的数目为两个时,通过根精加工分析根。2.根据权利要求1所述的方法,其特征在于,通过谱峰值采集方法获得最大值。3.根据权利要求1所述的方法,其特征在于,通过应用柯西积分公式获得共振峰的数目。4.根据权利要求3所示的方法,其特征在于,将柯西积分公式应用于在特定区域内具有最大值的点的周围区域。5.根据权利要求4所述的方法,其特征在于,所述特定区域为z域。6.根据权利要求1所述的方法,其特征在于,根是对应于判断为两个的共振峰数目的零点。7.根据权利要求1所述的方法,其特征在于,在根精加工中使用Bairstow算法。8.根据权利要求1所述的方法,其特征在于,在根精加工中使用逼近方法。9.根据权利要求1所述的方法,其特征在于,使用析取的共振峰作为话音识别的特征向量。10.根据权利要求1所述的方法,其特征在于,析取的共振峰用于共振峰声码器。11.一种接收语音信号并分析该信号的共振峰析取方法,其特征在于,包括接收新的话音信号帧;预处理所述接收的话音信号;通过将预处理的话音信号的适当范围乘以一窗函数来析取短时信号;从析取的短时信号中获得线性预测系数,并从中获得特定谱;在特定谱中搜索最大点,并判断最大点是否可能与至少两个共振峰有关;鉴别最大点实际上与至少两个共振峰有关;以及当最大点实际上与至少两个共振峰有关时,通过根精加工分析相关根。12....

【专利技术属性】
技术研发人员:金燦佑
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1