在数字语音编码器中执行谐波噪声加权的方法和装置制造方法及图纸

技术编号:3045611 阅读:257 留言:0更新日期:2012-04-11 18:40
为了满足选择谐波噪声加权(HNW)系数(ε↓[p])值以优化谐波噪声加权量的需要,此处提供一种用于在数字语音编码器中执行谐波噪声加权的方法和装置。在操作过程中,分析接收的语音(503)以确定基音周期。然后基于该基音周期选择HNW系数(505),并且基于谐波噪声加权(HNW)系数(ε↓[p])确定感知噪声加权滤波器(C(z))(507)。(*该技术在2024年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术主要涉及信号压缩系统,更具体地,涉及码激励线性预测(CELP)型语音编码系统。
技术介绍
数字语音与音频信号的压缩是公知的。为了在通信信道上高效地发送信号或者在诸如固态存储器件或计算机硬盘的数字媒体设备上存储压缩信号,通常需要进行压缩。尽管存在许多压缩(或者“编码”)方法,但其中一种非常流行的数字语音压缩编码方法称为码激励线性预测(CELP),该方法为“分析-合成”编码算法系列中的一员。分析-合成法通常指利用数字模型的参数合成一组候选信号,将这些候选信号与输入信号做比较,并分析失真的编码过程。然后发送或存储产生最小失真或误差分量的参数集。该参数集最后用于重建原始输入信号的估计。CELP是一种特殊的分析-合成法,其利用一个或多个激励码本,这些码本主要包括从对应于码本索引的码本得到的码矢量集。这些码矢量在“试错”(trial and error)过程中用作语音合成器的激励,在该过程中,为每一候选码矢量计算误差指标,并且选择产生最小误差的候选码矢量。例如,图1是现有CELP编码器100的框图。在CELP编码器100中,包含语音采样n(s(n))的输入信号被施加至线性预测编码(LPC)分析框101,在此处利用线性预测编码估计短时谱包络。得到的谱参数(或LP参数)由传输函数A(z)表示。这些谱参数被施加至LPC量化框102,量化框102对这些谱参数进行量化以产生适用于复用器108的量化谱参数Aq。量化谱参数Aq然后被传递至复用器108,并且该复用器基于该量化谱参数和由平方差最小化/参数量化框107确定的一组参数τ、β、k和γ产生编码比特流。如同本领域的普通技术人员所知,τ、β、k和γ分别定义为闭环基音延迟、自适应码本增益、固定码本矢量索引和固定码本增益。量化谱(或LP)参数还可被本地传递至具有对应传输函数1/Aq(z)的LPC合成滤波器105。LPC合成滤波器105还从第一组合器110接收合并的激励信号u(n),并且基于量化谱参数Aq和该合并的激励信号u(n)产生输入信号的估计 如下产生合并的激励信号u(n)。基于索引参数τ从自适应码本(ACB)103选择自适应码本码矢量cτ。然后基于增益参数β对于该自适应码本码矢量cτ加权,并将该加权的自适应码本码矢量传递至第一组合器110。基于索引参数k从固定码本(FCB)104选择固定码本码矢量ck。然后基于增益参数γ对于该固定码本码矢量ck加权,并且也将该加权的固定码本码矢量传递至第一组合器110。第一组合器110然后通过合并自适应码本码矢量cτ的加权值和固定码本码矢量ck的加权值,产生合并的激励信号u(n)。(为了方便读者,还以它们的z变换形式给出了这些变量。变量的z变换由相应的大写字母表示,例如,e(n)的z变换表示为E(z))。LPC合成滤波器105将输入信号的估计 传递至第二组合器112。第二组合器112还接收输入信号s(n)并用输入信号s(n)中减去输入信号的估计 输入信号s(n)与输入信号估计 间的差值被施加至感知误差加权滤波器106,该滤波器基于s(n)和 之间的差值和加权函数w(n)产生感知加权误差信号e(n),如下 E(z)=W(z)(S(z)-S^(z))---(1)]]>感知加权误差信号e(n)然后被传递至平方差最小化/参数量化框107。平方差最小化/参数量化框107使用误差信号e(n)确定产生输入信号s(n)的最佳估计 的优化参数集τ、β、k和γ。图2是从编码器100接收传输的现有解码器200的框图。如本领域的普通技术人员所知,解码器200中的解复用器在与由编码器100执行的完全相同的合成过程中利用由编码器100产生的编码比特流解码优化参数集,即τ、β、k和γ。从而,如果编码器100产生的编码比特流由解码器200无差错地接收,则可重建解码器200输出的语音 作为编码器100产生的输入语音估计 的精确副本。回到图1,加权滤波器W(z)利用人耳的频率遮蔽特性,使得如果信号和噪声的频率接近,则同时出现的噪声被较强的信号遮蔽。如Salami R.,Laflamme C.,Adoul J-P,Massaloux D.,“A toll quality 8Kb/sspeech coder for personal communications system,”IEEE Trans.OnVehicular Technology,pp.808-816,Aug.1994中所述,从LPC系数ai得到W(z),并由下式给出W(z)=A(z/γ1)A(z/γ2)0<γ2<γ1≤1,---(2)]]>其中,A(z)=1+Σi=1paiz-i,---(3)]]>并且p为LPC的阶数。由于加权滤波器由LPC谱得到,其也被称为“谱加权”。上述过程并没有考虑这样的事实,即信号周期性也促成了基频处和基频的倍频处的频谱峰。已经提出了各种技术利用这些基频谐波的噪声遮蔽。例如,在专利No.5,528,723“Digital speech coder and methodutilizing harmonic noise weighting”Gerson and Jasiuk,和在Gerson I.A.,Jasiuk M.A.,“Techniques for improving the performance of CELP typespeech coders,”Proc.IEEE ICASSP,pp.205-208,1993中,提出了一种在加权滤波器中包括谐波噪声遮蔽的方法。如以上参考文献所述,通过用谐波噪声加权滤波器C(z)修改该谱加权滤波器可包括谐波噪声加权,并且谐波噪声加权滤波器由下式给出C(z)=1-ϵpΣi=-M1M2Biz-(D+i),---(4)]]>其中,D对应于基音周期或基音迟滞或延迟,bi是滤波器系数,并且0≤εp<1是谐波噪声加权系数。包括谐波噪声加权的加权滤波器由下式给出WH(z)=W(z)C(z). (5)谐波噪声加权量通常由乘积∈pbi决定。由于bi由延迟决定,则谐波噪声加权量是延迟的函数。上述现有技术参考文献已经表明,可在不同的预定时间使用不同的谐波噪声加权系数(∈p)值,即∈p可以是时变参数(例如允许其在各个子帧间变化),然而,现有技术并没有提供选择∈p的方法。因此,需要一种方法和装置,用于在数字语音编码器中执行谐波噪声加权,优化地并且动态地确定∈p的适当值,因此可以优化谐波噪声加权量。尽管上述现有技术参考文献已经表明,可在不同的时间使用不同的谐波噪声加权系数(∈p)值(例如∈p可在各个子帧间变化),然而,现有技术并没有提供改变∈p的方法或者表明这种方法何时是有益的或有多少益处。附图说明图1是现有技术的码激励线性预测(CELP)编码器的框图。图2是现有技术的现有CELP解码器的框图。图3是根据本专利技术优选实施例的CELP编码器的框图。图4是∈p对于基音迟滞(D)的图示。图5是表示由CELP编码器执行,以包括本专利技术的谐波噪声加权方法本文档来自技高网...

【技术保护点】
一种用于在数字语音编码器中执行谐波噪声加权的方法,该方法包括以下步骤:接收语音输入s(n);根据所述语音输入确定基音周期(D);基于所述基音周期确定谐波噪声加权系数∈↓[p];以及基于所述谐波噪声加权系数确定感知噪声加权函数W↓[H](z)。

【技术特征摘要】
【国外来华专利技术】US 2003-10-30 60/515,581;US 2004-10-14 10/965,4621.一种用于在数字语音编码器中执行谐波噪声加权的方法,该方法包括以下步骤接收语音输入s(n);根据所述语音输入确定基音周期(D);基于所述基音周期确定谐波噪声加权系数∈p;以及基于所述谐波噪声加权系数确定感知噪声加权函数WH(z)。2.权利要求1所述的方法,其中∈p是D的减函数。3.权利要求2所述的方法,其中 其中∈max是所述谐波噪声加权系数的最大允许值;∈min是所述谐波噪声加权系数的最小允许值;Dmax是最大基音周期,在该值之上,谐波噪声加权系数被设置为∈min;以及Δ是所述谐波噪声加权系数的斜率。4.一种用于在数字语音编码器中执行谐波噪声加权的方法,该方法包括以下步骤接收语音输入s(n);根据所述语音输入确定闭环基音延迟(τ);基于所述闭环基音延迟确定谐波噪声...

【专利技术属性】
技术研发人员:乌达米塔尔詹姆斯P阿什利
申请(专利权)人:摩托罗拉公司在特拉华州注册的公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1