跟踪音调信号的方法技术

技术编号：3046045 阅读：247 留言：0更新日期：2012-04-11 18:40

一种跟踪音调信号的方法，该方法包括：　　　　（ｉ）接收由一系列音调值组成的检测到的音调信号，和对于检测到的信号中的每个当前音调值，至少执行如下（ｉｉ）到（ｉｖ）：　　　　（ｉｉ）从相邻音调值中构造相容音调值的至少一个子序列；　　　　（ｉｉｉ）计算所述至少一个子序列的重要度，并选择相容子序列当中重要度最高的一个子序列或一个集合；和　　　　（ｉｖ）如果当前音调值与重要度最高的所述子序列不相容，通过将它除以或乘以大于１的整数值来平滑它，以便使它与重要度最高的所述子序列相容。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及平滑音调信号的音调跟踪。
技术介绍
音调检测器用于各种各样的应用中，这些应用包括例如语音压缩(编码)、像基于语音识别特征的语音重构那样的语音合成等。在现有技术中已知各种各样的、有关音调检测器的技术，例如Y.Medan、E.Yair和D.Chazan发表的“语音信号的超分辨率音调确定”(Y.Medan，E.Yair，D.Chazan，Super Resolution Pitch Determination forSpeech Signals，IEEE ASSP vol 39pp 40-48，1991)。在某些场合音调检测器往往找出音调的整数倍或整数分之一。导致这种结果的原因多数是由于音调的迅速变化或两种声音之间的变调，以及刺耳或嘶哑声的存在，所有这些都损坏声谱的规则结构。这种损坏的结果造成附加谱线，这些附加谱线常常处在半音调频率的倍数上，但也可以出现三分之一和四分之一频率。当这样的附加谱线被遗漏时，只能找到音调频率的倍数。当它们被不正确计数时，只能检测到音调频率的一小部分。诸如语音压缩之类的、使用特定损坏音调信号的应用将表现出变差的性能。因此，在技术上需要提供平滑检测音调信号中的损坏音调值的技术。相关技术包括利用基于事件自适应高斯微分滤波器的健壮音调估计(Robust pitchestimation using an event based adaptive Gaussian derivative filter，Shah，A.；Ramachandran，R.P.；Lewis，M.A.，Circuits and Systems，2002.IS...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种跟踪音调信号的方法，该方法包括(i)接收由一系列音调值组成的检测到的音调信号，和对于检测到的信号中的每个当前音调值，至少执行如下(ii)到(iv)(ii)从相邻音调值中构造相容音调值的至少一个子序列；(iii)计算所述至少一个子序列的重要度，并选择相容子序列当中重要度最高的一个子序列或一个集合；和(iv)如果当前音调值与重要度最高的所述子序列不相容，通过将它除以或乘以大于1的整数值来平滑它，以便使它与重要度最高的所述子序列相容。2.根据权利要求1所述的方法，其中，所述(ii)包括来自所述子序列的至少一个子序列由落在[Tcurrent-Tpast，Tcurrent]的时间范围内的计算得出的音调值组成，其中，Tcurrent是与当前音调值对应的时刻，而Tpast是H个以前音调值；以及子序列中每两个相继音调值相隔一个因子，其中，1.5＞因子＞1，并且范围[Tcurrent-Tpast，Tcurrent]中的每个音调值属于一个子序列。3.根据权利要求1所述的方法，其中，所述(ii)包括来自所述子序列的至少一个子序列由落在[Tcurrent，Tfuture+Tcurrent]的范围内的音调值组成，其中，Tcurrent是当前音调值，和Tfuture是D个未来音调值；以及子序列中每两个相继音调值相隔一个因子，其中，1.5＞因子＞1，并且范围[Tcurrent，Tfuture+Tcurrent]中的每个音调值属于一个子序列。4.根据权利要求2所述的方法，其中，所述(ii)包括来自所述子序列的至少一个子序列由落在[Tcurrent，Tfuture+Tcurrent]的范围内的音调值组成，其中，Tcurrent是当前音调值，和Tfuture是D个未来音调值；以及子序列中每两个相继音调值相隔一个因子，其中，1.5＞因子＞1，并且范围[Tcurrent，Tfuture+Tcurrent]中的每个音调值属于一个子序列。5.根据权利要求2所述的方法，其中，所述因子＝1.28。6.根据权利要求3所述的方法，其中，所述因子＝1.28。7.根据权利要求4所述的方法，其中，所述因子＝1.28。8.根据权利要求1所述的方法，其中，子序列中的每个音调值与能量值相关联，并且在(iii)中规定的所述重要度依赖于子序列的能量，后者是子序列的音调值的能量值的函数。9.根据权利要求8所述的方法，其中，子序列的所述能量是子序列的音调值的能量值之和。10.根据权利要求1所述的方法，其中，每个子序列含有尾部音调值，并且所述(iv)包括通过将当前音调值除以或乘以大于1的整数值来平滑它，以便使它与重要度最高的所述子序列的尾部音调值相容。11.根据权利要求1所述的方法，其中，所述(iii)包括分类所述子序列的尾部音调值，并根据所述分类尾部音调值分组所述子序列，以便尾部音调值接近的子序列位于同一组中，并且重要度的所述计算包括计算每个组中所有子序列的重要度，并选择重要度最高的组；以及所述(iv)包括如果当前音调值与重要度最高的组中的所述子序列不相容，通过将当前音调值除以或乘以大于1的整数值来平滑它，以便使它与重要度最高的所述组相容。12.根据权利要求11所述的方法，其中，对重要度最高的组中子序列的尾部音调值求平均，得出平均尾部音调值，并且所述(iv)包括如果当前音调值与所述平均尾部音调值不相容，通过将当前音调值除以或乘以大于1的整数值来平滑它，以便使它与所述平均尾部音调值相容。13.根据权利要求11所述的方法，其中，子序列中的每个音调值与能量值相关联，并且在(iii)中规定的所述重要度依赖于子序列的能量，后者是子序列的音调值的能量值的函数。14.根据权利要求13所述的方法，其中，子序列的所述能量是所述子序列的音调值的能量值之和。15.一种跟踪音调信号的方法，该方法包括(i)接收由一系列音调值组成的检测到的音调信号，并对于检测到的信号中的每个当前音调值以及它的任何整数倍和倒整数倍，至少执行如下(ii)到(iii)，其中，所述整数＜预定值(ii)从相邻音调值中构造相容音调值的至少一个子序列；如果检测到的音调值与所述子序列不相容，将它除以或乘以大于1的整数值，以便使它与...

【专利技术属性】
技术研发人员：丹·查赞，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人