跟踪音调信号的方法技术

技术编号:3046045 阅读:247 留言:0更新日期:2012-04-11 18:40
一种跟踪音调信号的方法,该方法包括:    (i)接收由一系列音调值组成的检测到的音调信号,和对于检测到的信号中的每个当前音调值,至少执行如下(ii)到(iv):    (ii)从相邻音调值中构造相容音调值的至少一个子序列;    (iii)计算所述至少一个子序列的重要度,并选择相容子序列当中重要度最高的一个子序列或一个集合;和    (iv)如果当前音调值与重要度最高的所述子序列不相容,通过将它除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述子序列相容。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及平滑音调信号的音调跟踪。
技术介绍
音调检测器用于各种各样的应用中,这些应用包括例如语音压缩(编码)、像基于语音识别特征的语音重构那样的语音合成等。在现有技术中已知各种各样的、有关音调检测器的技术,例如Y.Medan、E.Yair和D.Chazan发表的“语音信号的超分辨率音调确定”(Y.Medan,E.Yair,D.Chazan,Super Resolution Pitch Determination forSpeech Signals,IEEE ASSP vol 39pp 40-48,1991)。在某些场合音调检测器往往找出音调的整数倍或整数分之一。导致这种结果的原因多数是由于音调的迅速变化或两种声音之间的变调,以及刺耳或嘶哑声的存在,所有这些都损坏声谱的规则结构。这种损坏的结果造成附加谱线,这些附加谱线常常处在半音调频率的倍数上,但也可以出现三分之一和四分之一频率。当这样的附加谱线被遗漏时,只能找到音调频率的倍数。当它们被不正确计数时,只能检测到音调频率的一小部分。诸如语音压缩之类的、使用特定损坏音调信号的应用将表现出变差的性能。因此,在技术上需要提供平滑检测音调信号中的损坏音调值的技术。相关技术包括利用基于事件自适应高斯微分滤波器的健壮音调估计(Robust pitchestimation using an event based adaptive Gaussian derivative filter,Shah,A.;Ramachandran,R.P.;Lewis,M.A.,Circuits and Systems,2002.ISCAS 2002.IEEE International Symposium on,2002.Page(s)II-843-II-846 vol.2),这篇文献的目的在于找出杂乱语音中的音调。
技术实现思路
本专利技术提供了,该方法包括(i)接收由一系列音调值组成的检测到的音调信号,和对于检测到的信号中的每个当前音调值,至少执行如下(ii)到(iv)(ii)从相邻音调值中构造相容音调值的至少一个子序列;(iii)计算所述至少一个子序列的重要度,并选择相容子序列当中重要度最高的一个子序列或一个集合;和(iv)如果当前音调值与重要度最高的所述子序列不相容,通过将它除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述子序列相容。本专利技术进一步提供了,该方法包括(i)接收由一系列音调值组成的检测到的音调信号,并对于检测到的信号中的每个当前音调值以及它的任何整数倍和倒整数倍,至少执行如下(ii)到(iii),其中,所述整数<预定值(ii)从相邻音调值中构造相容音调值的至少一个子序列;如果检测到的音调值与所述子序列不相容,将它除以或乘以大于1的整数值,以便使它与所述子序列相容;和(iii)计算所述至少一个子序列的重要度,并选择重要度最高的子序列,从而使当前音调值变平滑。并且,本专利技术提供了跟踪音调信号的系统,该系统包括接收由一系列音调值组成的检测到的音调信号的接收器,和对于检测到的信号中的每个当前音调值,由处理器至少执行如下(ii)到(iv)(ii)从相邻音调值中构造相容音调值的至少一个子序列;(iii)计算所述至少一个子序列的重要度,并选择相容子序列当中重要度最高的一个子序列或一个集合;和(iv)如果当前音调值与重要度最高的所述子序列不相容,通过将它除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述子序列相容。此外,本专利技术进一步提供了跟踪音调信号的系统,该系统包括接收由一系列音调值组成的检测到的音调信号的接收器,并对于检测到的信号中的每个当前音调值以及它的任何整数倍和倒整数倍,其中,所述整数<预定值,由处理器至少执行如下(ii)到(iii)(ii)从相邻音调值中构造相容音调值的至少一个子序列;如果检测到的音调值与所述子序列不相容,将它除以或乘以大于1的整数值,以便使它与所述子序列相容;和(iii)计算所述至少一个子序列的重要度,并选择重要度最高的子序列,从而使当前音调值变平滑。本专利技术提供了包含执行跟踪音调信号步骤的计算机代码的计算机产品,该计算机产品包括接收由一系列音调值组成的检测到的音调信号的接收器,和对于检测到的信号中的每个当前音调值,至少执行如下(i)到(iii)(i)从相邻音调值中构造相容音调值的至少一个子序列;(ii)计算所述至少一个子序列的重要度,并选择相容子序列当中重要度最高的一个子序列或一个集合;和(iii)如果当前音调值与重要度最高的所述子序列不相容,通过将它除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述子序列相容。本专利技术进一步提供了包含执行跟踪音调信号步骤的计算机代码的计算机产品,该计算机产品包括(i)接收由一系列音调值组成的检测到的音调信号,并对于检测到的信号中的每个当前音调值以及它的任何整数倍和倒整数倍,至少执行如下(ii)到(iii),其中,所述整数<预定值(ii)从相邻音调值中构造相容音调值的至少一个子序列;如果检测到的音调值与所述子序列不相容,将它除以或乘以大于1的整数值,以便使它与所述子序列相容;和(iii)计算所述至少一个子序列的重要度,并选择重要度最高的子序列,从而使当前音调值变平滑。附图说明为了理解本专利技术和了解它实际上是如何实现的,现在参照附图,只举非限制性例子来描述本专利技术的优选实施例,在附图中图1是示出按照本专利技术一个实施例应用音调平滑算法的系统的方块图; 图2例示了一系列帧的取样音调值的图形;图3例示了按照本专利技术一个实施例的音调跟踪的流程图;图4例示了按照本专利技术一个实施例、识别音调的子序列、一系列帧的取样音调值的图形;和图5例示了按照本专利技术另一个实施例的音调跟踪的流程图。具体实施例方式首先转到图1,图1示出了按照本专利技术一个实施例、应用音调跟踪的系统的概括性方块图。如图所示,原始语音信号通过输入装置(比方说,麦克风12)接收,被馈送到(在转换成数字信号之后)处理器(在用户PC 14和相关存储器16中),其中,为了检测音调(在图1中未明确示出),处理器运行(比方说,软件实现的)本身已知的适当工具。除了音调信号之外,音调检测器可以生成帧能量,帧能量是计算音调的帧中信号强度的某种量度和音调质量的某种量度,音调质量是可以将信号描述成具有检测音调频率的周期信号的程度。然后,如此检测到的音调信号、可能还有能量和匹配度被馈送到平滑音调信号的音调跟踪模块(在图1中未明确示出),所有这些都将在下面得到更详细描述。在比方说语音压缩的情况下,接着将本身已知的编码算法(例如,谱编码)应用于语音信号,和通过比方说网络18远程传送编码信号。当然,本专利技术不受图1的特定结构和/或实现和/或应用(语音编码)限制,因此,在需要的时候和在适当的时候,其它变种也是可应用的。举非限制性的例子来说,不仅可以在独立PC(个人计算机)环境下实现,而且可以在分布式环境下实现。现在简要回顾一下音调信号的特性,这有助于理解按照本专利技术各种各样的实施例的音调跟踪的结构和操作。因此,假设声带产生频率随时间连续变化的激发,那么,相继正确(真)音调值的序列总是连续的,即,相继值在数值上相互接近。考虑通常包含正确和损坏音调值的检测到的音调信号。设p1和p2是两本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种跟踪音调信号的方法,该方法包括(i)接收由一系列音调值组成的检测到的音调信号,和对于检测到的信号中的每个当前音调值,至少执行如下(ii)到(iv)(ii)从相邻音调值中构造相容音调值的至少一个子序列;(iii)计算所述至少一个子序列的重要度,并选择相容子序列当中重要度最高的一个子序列或一个集合;和(iv)如果当前音调值与重要度最高的所述子序列不相容,通过将它除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述子序列相容。2.根据权利要求1所述的方法,其中,所述(ii)包括来自所述子序列的至少一个子序列由落在[Tcurrent-Tpast,Tcurrent]的时间范围内的计算得出的音调值组成,其中,Tcurrent是与当前音调值对应的时刻,而Tpast是H个以前音调值;以及子序列中每两个相继音调值相隔一个因子,其中,1.5>因子>1,并且范围[Tcurrent-Tpast,Tcurrent]中的每个音调值属于一个子序列。3.根据权利要求1所述的方法,其中,所述(ii)包括来自所述子序列的至少一个子序列由落在[Tcurrent,Tfuture+Tcurrent]的范围内的音调值组成,其中,Tcurrent是当前音调值,和Tfuture是D个未来音调值;以及子序列中每两个相继音调值相隔一个因子,其中,1.5>因子>1,并且范围[Tcurrent,Tfuture+Tcurrent]中的每个音调值属于一个子序列。4.根据权利要求2所述的方法,其中,所述(ii)包括来自所述子序列的至少一个子序列由落在[Tcurrent,Tfuture+Tcurrent]的范围内的音调值组成,其中,Tcurrent是当前音调值,和Tfuture是D个未来音调值;以及子序列中每两个相继音调值相隔一个因子,其中,1.5>因子>1,并且范围[Tcurrent,Tfuture+Tcurrent]中的每个音调值属于一个子序列。5.根据权利要求2所述的方法,其中,所述因子=1.28。6.根据权利要求3所述的方法,其中,所述因子=1.28。7.根据权利要求4所述的方法,其中,所述因子=1.28。8.根据权利要求1所述的方法,其中,子序列中的每个音调值与能量值相关联,并且在(iii)中规定的所述重要度依赖于子序列的能量,后者是子序列的音调值的能量值的函数。9.根据权利要求8所述的方法,其中,子序列的所述能量是子序列的音调值的能量值之和。10.根据权利要求1所述的方法,其中,每个子序列含有尾部音调值,并且所述(iv)包括通过将当前音调值除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述子序列的尾部音调值相容。11.根据权利要求1所述的方法,其中,所述(iii)包括分类所述子序列的尾部音调值,并根据所述分类尾部音调值分组所述子序列,以便尾部音调值接近的子序列位于同一组中,并且重要度的所述计算包括计算每个组中所有子序列的重要度,并选择重要度最高的组;以及所述(iv)包括如果当前音调值与重要度最高的组中的所述子序列不相容,通过将当前音调值除以或乘以大于1的整数值来平滑它,以便使它与重要度最高的所述组相容。12.根据权利要求11所述的方法,其中,对重要度最高的组中子序列的尾部音调值求平均,得出平均尾部音调值,并且所述(iv)包括如果当前音调值与所述平均尾部音调值不相容,通过将当前音调值除以或乘以大于1的整数值来平滑它,以便使它与所述平均尾部音调值相容。13.根据权利要求11所述的方法,其中,子序列中的每个音调值与能量值相关联,并且在(iii)中规定的所述重要度依赖于子序列的能量,后者是子序列的音调值的能量值的函数。14.根据权利要求13所述的方法,其中,子序列的所述能量是所述子序列的音调值的能量值之和。15.一种跟踪音调信号的方法,该方法包括(i)接收由一系列音调值组成的检测到的音调信号,并对于检测到的信号中的每个当前音调值以及它的任何整数倍和倒整数倍,至少执行如下(ii)到(iii),其中,所述整数<预定值(ii)从相邻音调值中构造相容音调值的至少一个子序列;如果检测到的音调值与所述子序列不相容,将它除以或乘以大于1的整数值,以便使它与...

【专利技术属性】
技术研发人员:丹·查赞
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1