音频编码器和解码器及用于音频信号的编码和解码的方法技术

技术编号:8456899 阅读:212 留言:0更新日期:2013-03-22 09:43
本发明专利技术涉及将音频信号编码和解码的基于频率域的方法,其中,使用时间域信号段的合成频率域表示,更新自适应谱码本。执行收到时间域信号段的频率分析以便获得频率域表示,并且搜索自适应谱码本以查找频率域表示的第一近似。搜索固定谱码本以查找残差频率表示的近似值。从这两个近似可生成合成频率域表示。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号编码和解码领域。
技术介绍
移动通信系统呈现了用于话音传送服务的挑战性环境。话音呼叫实际上能够在任何地方进行,并且周围背景噪声和声学条件将对传送的语音的质量和可理解性有影响。同时,存在用于限制每个通信装置消耗的传送资源的强烈的动机。移动通信服务因此采用压缩技术以便降低话音信号消耗的传送带宽。低带宽消耗在移动装置和基站中均产生了低功耗。这转化成了移动运营商的能量和成本节约,同时最终用户将体验到延长的电源寿命和 增大的通话时间。此外,通过每用户更少消耗的带宽,移动网络能够同时服务于更大数量的用户。今天,用于移动话音服务的主导压缩技术是例如在“极低比特率的码激励线性预测(CELP)高质量语音’’("Code-Excited Linear Prediction (CELP) high-quality speechat very low bit rates", M. R. Schroeder and B. Atal, IEEE ICASSP 1985)中所述的码激励线性预测(CELP)。CELP是根据合成式分析过程操作的编码方法。在用于话音编码的CELP中,使用了线性预测分析以便基于要编码的音频信号确定表示人声道的慢速变化线性预测(LP)滤波器A(z)。将音频信号分割成信号段,并且使用确定的A(Z)过滤信号段,过滤产生过滤的信号段,经常称为LP残差。随后,形成目标信号x(n),一般是通过加权合成滤波器 过滤LP残差以形成在加权域中的目标信号x(n)。目标信号X (η)用作用于合成式分析过程的参考信号,其中,搜索自适应码本以查找在通过加权合成滤波器过滤时将提供目标信号的良好近似的过去激励样本的序列。随后,通过从过滤的信号段减去所选择的自适应码本信号,推导次要目标信号χ2 (η)。次要目标信号又用作用于又一合成式分析过程的参考信号,其中,搜索固定码本以查找脉冲的向量,脉冲的向量通过加权合成滤波器过滤时将提供次要目标信号的良好近似。随后,通过所选择的自适应码本向量和所选择的固定码本向量的线性组合更新自适应码本。通过使用CELP,良好的语音质量一般在适度低带宽得以实现,并且该方法在诸如GSM-EFR、AMR和AMR-WB等部署的编解码器中广泛使用。然而,对于极低比特率,CELP编码技术的限制开始显现。虽然有声语音的段仍表现良好,但诸如摩擦音等更多噪声类辅音开始听起来更差。在背景噪声中也能够感觉到质量下降。如上所看到的一样,CELP技术使用基于脉冲的激励信号。对于有声信号段,过滤的信号段(目标激励信号)集中在对应于语音段的基频的定期间隔出现的所谓喉脉冲周围。此结构能够通过脉冲的向量很好地建模。另一方面,对于噪声类段,目标激励信号结构更松散,表现在能量在整个向量内更分散。此类能量分布未通过脉冲的向量很好地捕捉,并且尤其在低比特率未很好地捕捉。在比特率低时,脉冲只是变得太少而不能适当地捕捉噪声类信号的能量分布,并且结果合成语音将具有经常称为CELP编解码器的稀疏假象的杂音失真。因此,对于例如在传送信道条件差时能够有利的极低比特率,要求使用CELP的备选以便获得声音良好的合成信号。几个技术已开发以便处理在低比特率的CELP稀疏假象。W099/12156公开了一种解码已编码信号的方法,其中,防稀疏滤波器应用为在语音信号的解码中的后处理步骤。此类防稀疏处理降低了稀疏假象,但最后结果仍能够听起来有点不自然。
熟知的减轻稀疏假象的另一种方法经常称为噪声激励线性预测(NELP)。在NELP中,使用噪声信号作为激励信号来处理信号段。噪声激励只适用于噪声类声音的表示。因此,使用NELP的系统经常将例如CELP等不同激励方法用于声调或有声段。因此,NELP技术依赖为音频信号的无声和有声部分使用不同编码策略的语音段的分类。这些编码策略之间的差别在有声与无声切换策略之间切换时引发切换假象。此外,噪声激励一般将不能成功地为复杂的噪声类信号的激励建模,并且防稀疏假象的部分因此一般将保持不变。如从上面所述能够看到的一样,需要改进的编解码器,由此即使在为低比特率传送将编码的信号编码时,也能够获得高质量合成音频信号。
技术实现思路
本专利技术的目的涉及在以低比特率传送编码信号时改进合成音频信号的质量。此目的通过编码方法、解码方法、音频编码器、音频解码器及用于音频信号的编码和解码的计算机程序而得以解决。提供了一种将音频信号编码和解码的方法,其中,通过编码时间域信号段的频率域表示,更新编码器及解码器的自适应谱码本。编码器分析收到的时间域信号段以产生频率域表示,并且搜索编码器中的自适应谱码本以查找提供获得的频率域表示的第一近似的ASCB向量。选择此ASCB向量。从频率域表示与所选择的ASCB向量之间的差生成残差频率表示。随后,搜索编码器中的固定谱码本以查找提供残差频率表示的近似的FSCB向量。也选择此FSCB向量。从两个所选择的向量可生成合成频率域表示。编码器还生成信号表示,信号表示指示引用所选择的ASCB向量的索引和引用所选择的FSCB向量的索引。线性组合的增益也能够有利地在信号表示中指示。通过使用从信号表示取回的ASCB索引和FSCB索引,识别ASCB向量和FSCB向量,能够解码如上所述由编码器生成的信号表示。在信号表示的解码中,识别的ASCB向量和识别的FSCB向量的线性组合提供要合成的时间域信号段的合成频率域表示。从合成频率域表不生成合成时间域信号。通过在音频信号的编码中使用时间域信号段的频率域表示,也能够在低比特率有效获得噪声类声音的谱分布的控制,并且在编码器与解码器之间的传送信道提供低比特率时,也能够改进此类声音的合成。由于为语音信号的编码考虑的时间域信号段的长度较短,因此,对应频率域表示将可能显示在时间邻近帧之间的大变化。通过提供经常更新的自适应谱码本,确保能够找到频率域表示的适合近似,而不管在时间域信号段的时间邻近频率域表示之间的预期差相关。在一个实施例中,通过执行时间域信号段的时间到频率域变换分析,由此获得段谱,来获得频率域表示。频率域表示作为段谱的至少一部分获得。时间到频率域变换例如能够是离散傅立叶变换(DFT),其中,获得的段谱包括幅度谱和相位谱。频率域表示随后能够对应于段谱的幅度谱部分。时间到频率域变换分析的另一示例是修改的离散余弦变换分析,该分析生成单个实值MDCT谱。在此情况下,频率域表示能够对应于MDCT谱。备选,可使用其它分析。在另一实施例中,通过执行时间域信号段的线性预测分析,获得频率域表示。在一个实施例中,应用到时间域信号段的编码/解码方法取决于段携带的声音信息的相位灵敏度。在此实施例中,应将段作为相位不灵敏还是相位灵敏处理的指示能够例如作为信号表示的一部分发送到解码器。对于携带相位不灵敎信息的段,从合成频率域表示的合成时间域信号的生成能够包括能够在解码器中有利地生成的随机分量。例如,在编码器中执行的频率分析是DFT时,相位谱能够在解码器中随机生成,或者在频率分析是LP分析时,时间域激励信号能够在解码器中随机生成。对于携带相位灵敎信息的段的编码,将使用诸如CELP等基于时间域的编码方法。备选,使用自适应谱码本的基于频率域的编码方法也能够用于相位灵敎信号段的编码,其中,信号表示包括用于相位灵敏信号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:E诺韦尔S布鲁恩H波布洛特
申请(专利权)人:瑞典爱立信有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1