当前位置: 首页 > 专利查询>法国电信局专利>正文

广义综合分析语音编码方法和实施该方法的编码器技术

技术编号:3046670 阅读:189 留言:0更新日期:2012-04-11 18:40
一种语音编码方法,包括以下步骤:    分析输入音频信号从而为该音频信号的每个连续块确定一组相应的滤波器参数;    对用所确定的滤波器参数组为每个块定义的感觉加权滤波器中的输入信号进行滤波以产生感觉加权的信号;    根据间距信息修改感觉加权信号的时间刻度以产生经修改的滤波信号;    在经修改的滤波信号内定义块边界;以及    处理经修改的滤波信号以获得编码参数,    其特征在于所述处理包括对应于感觉加权滤波器的反向滤波操作,且其中反向滤波操作由已在所定位的块边界处更新的连续滤波器参数组所定义。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及使用广义综合分析语音编码技术的编码方法,尤其涉及称为非严格编码激励线性预测(RCELP)及类似的技术。
技术介绍
很大一类的语音编码范例是建立在预测编码的概念之上。预测语音编码器被中低比特速率的通信和存储系统广泛使用。最通用和实际的预测语音编码方法是线性预测(LP)方法,其中当前信号值由先前传输并解码的信号样本的线性组合所估计。短期(ST)线性预测,与输入信号的频谱形状密切相关,起初被用来进行语音编码。长期(LT)线性预测进一步被引入,以取得语音信号的统一结构,尤其是有声语音片断。综合分析(AbS)方法提供了一种对短期LP余项进行优化分析和编码的有效手段,它使用长期线性预测和编码本激励搜索。Abs方法是一大系列语音编码器的基础,包括编码激励线性预测(CELP)编码器和自激励声码器(A.Gersho撰写的“语音和音频压缩中的先进技术”(Advances in Speech and Audio Compression),IEEE会刊,第82册,第6号,900-918页,1994年6月)。随着语音编码技术的进步,编码器处长期LP分析(也称为“间距预测”)和解码器处的长期LP综合已有了发展,起初的方法是用单抽头滤波器,长期LP扩充后包括多抽头滤波器(R.P.Ramachandran and P.Kabal,“语音编码器中的间距滤波器的稳定性和性能分析”(“Stability and Performance Analysis of PitchFilters in Speech Coders”)ASSP上的IEEE学报,第35册,第7号,937-948页,1987年6月)。接下来,引入部分延迟,使用内插滤波器进行过取样和次取样(P.Kroon和B.S.Atal,“高时间分辨率的间距预测”(“Pitch Predictors with HighTemporal Resolution”)ICASSP会刊,第二册,1990年4月,661-664页)。那些对于起初的单抽头滤波器的扩充是设计为改善对声音语音中声门源产生的LT冗余的获取。LT匹配的越好,LP激励编码就越好,整体性能也越好。匹配精度也可以通过经常刷新LT参数来改善。然而,多抽头LT预测器或LT滤波器的高更新速率要求传输大量的位来表现它们,并会较大地增加位速率。这种开销在低比特速率编码器中是禁止的,于是就需要其它的解决方案。为了克服上面描述的LT预测方法的一些局限性,引入了广义综合分析编码的概念(W.E.Kleijn等,“广义综合分析编码及将其应用于间距预测”(“GeneralizedAnalysis-by-Synthesis Coding anf its Application to PitchPrediction”)ICASSP会刊,第1册,1992年,337-340页)。在该方法中,源信号在进行编码前先作修改,要求修改后的信号感觉上接近源信号或与源信号相同。对于诸如编码器参数,更精确地说是间距预测参数的修改,要求与指定的间距周期轮廓相匹配。间距轮廓通过基于帧到帧的间距预测参数的内插获得,使用低分辨率来表现间距时滞,间距时滞限制了表现LT预测参数所需要的比特速率。为了匹配间距轮廓而进行的修改称为时间刻度修改或“时间弯曲”(W.E.Kleijn等,“综合分析语音编码器中的间距预测参数的内插”(“Interpolation ofthe Pitch Predictor Parameters in Analysis-by-Synthesis Speech Coders”),SAP上的IEEE学报,第2册,第1号,第1部分,1994年1月,42-54页)。时间刻度修改过程的目的是使源信号的主要特征对准那些LT预测贡献的激励信号。RCELP编码器衍生自传统的CELP编码器,通过将上面描述的广义综合分析概念应用到间距参数上而得,这在W.B.Kleijn等的,“RCELP语音编码算法”无线通信欧洲学报,第4册,第5号,1994年9月到10月,第573-582页有描述。RCELP编码器的主要特征如下所述,类似CELP编码器,短期LP系数首先被估计(一般每帧一次,有时会有中间更新)。帧长度是可变的,典型的,在10ms到30ms之间。在RECLP编码器中,间距周期在帧到帧的基础上被估计,使用一个健壮的间距检测算法。接下来通过帧到帧间距周期的内插获得间距周期轮廓。源信号进行修改以匹配该轮廓。在早先的实施方式中(美国专利号5704003),这种时间刻度修改处理是在短期LP余项信号上进行的,然而,一个较佳的解决方式是使用感觉加权输入信号,将输入信号通过一个感觉加权滤波器进行滤波而获得,就如J.Thyssen等在“ITU-T 4kbits/s语音编码标准候选方案”(“A candidate fpr the ITU-T4kbits/s Speech Coding Standard”),ICASSP会刊第2册,美国犹他洲盐湖城,2001年5月,第681-684页或Yang Gao在“EX-CELP一种语音编码范例”(“EX-CELPA Speech Coding Paradigm”),ICASSP会刊第2册,美国犹他洲盐湖城,2001年5月,第689-693页中所做的。修改后的语音信号接下来被使用反向预处理滤波器的反向滤波所获得,接下来的编码操作和那些在传统CELP编码中进行的操作相同。需要注意的是,修改的输入信号可以精确地计算,这取决于进行时间刻度修改之前进行的滤波的种类,以及按照时间修改模块适合于CELP编码器的结构。当用于CELP编码器的固定编码本查找的感觉加权滤波器采用A(z)/A(z/γ)的形式时,其中A(z)是LP滤波器而γ是加权因子,则在目标计算中仅包括一个递归滤波器。仅仅余项信号才是编码本查询所需要的。在RCELP编码的情况下,如果时间刻度修改是在该余项信号上进行的,就可能不需要对修改的源信号的计算。具有A(z/γ1)/A(z/γ2)形式的感觉加权滤波器,其加权因子为γ1和γ2,可以提供较好的性能,尤其是自适应感觉滤波器,例如,具有γ1和γ2变量,如美国专利号5845244中所公开的。当这种加权滤波器使用在CELP处理中时,目标估计引入了两个递归滤波器。在很多CELP结构(比如,R.Salami等人,“CS-ACELP设计和描述通行质量8kb/s语音编码器”(“Design and description of CS-ACELPa toll quality 8kb/sspeech coder”)语音和音频处理的IEEE学报,第6册,第2号,1998年3月),中间滤波器处理向LP综合滤波器提供当前余项信号和存储的过去的加权错误信号。输入信号包括在余项计算和帧处理的结尾处的错误信号更新。在RCELP的情况下,该方法的直接实施方式提出了计算修改的源输入的需要。然而,也可以衍生出等价的方法,就不需要修改的输入信号。如果时间刻度修改应用于余项信号,则基于使用修改的余项信号,或者如果时间刻度修改应用于加权语音,则基于修改的加权输入。实践中,大多数RCELP编码器并不真正使用上面表现的结构来计算修改的源信号。图1示出已知的RCELP编码器的框图。线性预测编码本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音编码方法,包括以下步骤分析输入音频信号从而为该音频信号的每个连续块确定一组相应的滤波器参数;对用所确定的滤波器参数组为每个块定义的感觉加权滤波器中的输入信号进行滤波以产生感觉加权的信号;根据间距信息修改感觉加权信号的时间刻度以产生经修改的滤波信号;在经修改的滤波信号内定义块边界;以及处理经修改的滤波信号以获得编码参数,其特征在于所述处理包括对应于感觉加权滤波器的反向滤波操作,且其中反向滤波操作由已在所定位的块边界处更新的连续滤波器参数组所定义。2.如权利要求1所述的方法,其特征在于,所述感觉加权滤波器是自适应的感觉加权滤波器。3.如权利要求2所述的方法,其特征在于,所述感觉加权滤波器的传递函数形式为A(z/γ1)/A(z/γ2),其中A(z)是在分析输入信号的所述步骤中估计的线性预测滤波器的传递函数,而γ1和γ2是用于控制感觉加权数量的自适应系数。4.如权利要求1所述的方法,其特征在于,定位块边界的所述步骤包括累积来自应用于感觉加权信号的每个块的样本的时间刻度修改的时延,以及在该块的结尾处保存累积时延值从而在经修改的滤波信号内定位块边界。5.如权利要求1所述的方法,其特征在于,分析输入信号的所述步骤包括在连续信号帧进行线性预测分析,每个帧由p个连续子帧组成,其中p是不小于1的整数,每个所述块就包括所述子帧之一,且其中定位块边界的所述步骤包括,对于每个帧,确定具有p+1个值的数组,用于在经修改的滤波信号内定位所述帧的p个子帧的边界。6.如权利要求5所述的方法,其特征在于,所述线性预测方法通过以所述子帧为中心的分析窗函数应用于每个子帧,其中,所述分析输入信号的步骤还包括,对于当前帧,通过非对称前向分析窗函数进行前向线性预测分析,该非对称前向分析窗函数的支持不会相对于另一分析窗函数的支持预先扩展,该另一分析窗函数以当前帧中最后一子帧为中心,且最大值与位于所述最后一子帧中心前的时间位置处对齐,且其中根据为缺少帧结尾的当前帧而确定的数组的第(p+1)个值,反向滤波操作在由所述第(p+1)个值定位的块边界上进行更新,所述第(p+1)个值要由从前向分析确定的一组滤波器系数来定义。7.如权利要求6所述的方法,其特征在于,所述前向分析窗函数的最大值与当前帧后面一帧的第一子帧的中心对齐。8.如权利要求1所述的方法,其特征在于,在处理经修改的滤波信号的步骤中获得的编码参数包括CELP编码参数。9.一种语音编码器,包括分析输入音频信号从而为音频信号的每...

【专利技术属性】
技术研发人员:B·柯弗希D·马萨洛克斯C·拉姆伯林高扬
申请(专利权)人:法国电信局迈恩斯比德技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1