综合分析语音编码方法技术

技术编号：3047712 阅读：204 留言：0更新日期：2012-04-11 18:40

一种综合分析语音编码方法，用于已数据化成分为ｌｓｔ取样的ｎｓｔ子帧的连续子帧的语音信号Ｓ的包括以下步骤：－为确定一个短期综合过滤器（６０）的参数的语音信号的线性预测分析；－为检验信号的语音帧以及为每个语音帧，确定信号的话音等级（ＭＶ）和查寻一个长期预测延迟的一个间隔的语音信号的开环分析；－为了对至少话音帧的子帧的一些，选择包含在查寻间隔内并且构成长期综合过滤器（６６）的一个参数的一个长期预测延迟，进行语音的闭环预测分析；－对每个子帧确定一个随机激发，以便最小化在语音信号和由长期及短期综合滤波器的随机激发之间的感知加权差别，其特征在于，在开环分析步骤中，确定与每个话音帧有关的查寻间隔，以使它包含依靠上述帧的话音等级的延迟的一个量（Ｎ↓［１］，Ｎ↓［３］）。（*该技术在2016年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及综合分析语音编码。申请公司已经在欧洲专利应用0195487，0347307和0469997中，特别描述了这个已开发出来的语言编码器。在综合分析语音编码器中，为了获得模型化元音区的变换函数的一个短期综合滤波器的系数，执行语音信号的线性预测。这个系数与表示一个激发的特性用于短期综合滤波器的参数一起送到译码器。在大多数目前的编码器中，为了表示考虑到语音的音调的一个长期综合滤波器的特性，也查找语音信号的长期自相关数。当这个信号是语音时，这个激发实际上包含可以由过去激发表示，通过语言信号的TP取样延迟并录属于一个增益gP的一个可预测成份。在译码器还要重新构成这个具有一个形式为1/B(z)的转换函数的长期综合滤波器，其中B(z)＝1-gPz-TP个激发的剩余不可预测部分称为随机激发。在已知的CELP(“激发编码线性预测”)编码器中，随机激发包括一个预定字典中查找的一个矢量。在已知的MPLPC(“多脉冲线性预测编码”)编码器中，随机激发包括数量的位置由编码器查找由的脉冲。通常，CECP编码器对低数据传输速率更适用，但它们比MPLPC编码器执行起来更复杂。为了确定长期预测延迟，用到一个闭环分析，一个开环分析或者这两者的组合。在计算总量的项目中不需要开环分析，但是限制了它的精确度。相反地，闭环分析要求更多的计算，当它直接用于减小语音信号和综合信号间感知加权差值时变得更可靠，在某些情况下，为了限制在闭环分析器内部将要查寻预测延迟的间隔，首先，执行一个开环分析。然而，由于考虑到这个延迟可能会很陡的，实际情况这个查寻间隔必须保持相对宽度。本专利技术特别是针对在...

【技术保护点】

【技术特征摘要】
1.一种综合分析语音编码方法，用于已数据化成分为Ist取样的nst子帧的连续子帧的语音信号S的包括以下步骤-为确定一个短期综合过滤器(60)的参数的语音信号的线性预测分析；-为检验信号的语音帧以及为每个语音帧，确定信号的话音等级(MV)和查寻一个长期预测延迟的一个间隔的语音信号的开环分析；-为了对至少话音帧的子帧的一些，选择包含在查寻间隔内并且构成长期综合过滤器(66)的一个参数的一个长期预测延迟，进行语音的闭环预测分析；-对每个子帧确定一个随机激发，以便最小化在语音信号和由长期及短期综合滤波器的随机激发之间的感知加权差别，其特征在于，在开环分析步骤中，确定与每个话音帧有关的查寻间隔，以使它包含依靠上述帧的话音等级的延迟的一个量(N1，N3)。2.根据权利要求1的方法，其特征在于对长期预测延迟包含少数延迟比其他话音帧具有最大话音等级的那些帧的查寻间隔。3.根据权利要求1或2的方法，其特征在于与帧有关的开环分析包括每个使在各自独立的上述帧的子帧上取长期预测增益的开环估计值的最大nst基本延迟(Kst)的确定，然后，比较第一预定门限(S0)与在相应子帧有关的nst的基本延迟的基础上，获得的帧上的长期预测增益的第一开环估计值，以检验此帧是否是话音，并且，在于若此帧被检验为话音，则开环分析还包括对每个子帧侯选延迟的一个表(Ist)的确定，对于这些侯选延迟，在子帧上的预测增益的开环估计值比与用于子帧的基本延迟有关的估计值的一个定义值比例(β)大，这因为在帧上的长期预测增益的第二开环估计值是一个最大值用到的侯选延迟是从上述表中选出来的，在对应在nst最佳延迟的基础上获得的一个侯选延迟的帧上的第二开环，它们位于中心在上述的侯选延迟的N1延迟的间隔内，上述延迟分别在上述间隔上取nst子帧上的预测增益的开环估计值的最大值，因为帧的话音等级的确定包括在帧上的预测增益在第二最大估计值和至少一个其它的预定门限(S1，S2)之间的一个比较，并且因为在完成开环分析时确定的查寻间隔在上述选择延迟的中心上。4.根据权利要求1或2的方法，其特征在于与帧有关的开环分析包括在上述帧上取长期预测增益的第一开环估计值的最大值的一个基本延迟(k)的确定，还包括为确定检验帧是否为话音，进行在第一预定门限(S0)和在此帧上的长期预测增益的第一最大化估计值之间的比较；其中，若帧被检验为话音，开环分析还包括在帧上的预测增益的开环/估计值比与基本延迟有关的估计值的定义的分数(β)高的侯选延迟的表(I)的确定；在此帧上的长期预测增益的一个第二开环估计值为一个最大值的侯选延迟是从上述表中选出来的，在此帧上的第二开环估计值分配了一个在nst最优延迟的基础上获得，并位于中心在上述侯选延迟的N1延迟的一个间隔内的一个侯选延迟，上述估计值是分别在上述间隔的取在nst子帧上的预测增益的开环估计值的...

【专利技术属性】
技术研发人员：威廉姆纳瓦罗，米歇尔莫克，
申请(专利权)人：马特瑞通讯法国公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人