用于低比特率音频编码应用的高效可标度参数立体声编码制造技术

技术编号:3688888 阅读:141 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了对现有技术的音频编解码器的改进,所述音频编解码器通过对所接收到的单声道信号的后处理生成一个立体声幻觉。通过在编码器一侧上提取立体声图像描述参数,将其发送和随后用于在解码器一侧上控制立体声生成器,实现了这些改进。此外,通过使用一种新形式的参数立体声编码,本发明专利技术弥补了简单的伪立体声方法和当前的真实立体声编码方法之间的差距。引入了一个立体声平衡参数,使得能够实现更先进的立体声模式,此外,构建了频谱包络立体声编码的新方法的基础,尤其是在使用引导HFR(高频重建)的系统中使用。作为一种特殊的情况,描述了这种立体声编码方案在可标度的基于HFR的编解码器内的应用。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及低比特率音频源编码系统。介绍了输入信号的立体声特性的不同参数表示,解释了它们在解码器一侧上的应用,从频谱包络的伪立体声到完全的立体声编码,后者尤其适合于基于HFR(高频重建)的编解码器。
技术介绍
音频源编码技术可以分成两类自然音频编码和语音编码。在中到高的比特率上,通常将自然音频编码用于语音和音乐信号,并能进行立体声传输和再现。在仅能获得低比特率的应用中,例如目标为具有慢速电话调制解调器连接的用户的互联网流式音频,或者在新兴的数字调幅广播系统中,不可避免地需要进行音频节目资料的单声道编码。然而,依然希望有立体声印象,尤其当使用耳机收听时,在这种情况下,纯单声道信号给人的感觉像是从“头内”产生的,这可能是一种很不舒服的感觉。解决这个问题的一种方法是在解码器一侧上利用所接收的纯单声道信号合成出一个立体声信号。近年来,已经推荐了几种不同的“伪立体声”生成器。例如在美国专利US5,883,962中,描述了通过向未处理的信号添加一个延迟/相移形式的信号来增强单声道信号,从而建立一种立体声幻觉。在这种方法中,以电平相等但是符号相反,对于两个输出中的每个输出将处理后信号添加给原始信号,保证了如果两个声道随后在信号路径中叠加则消除增强信号。在PCTWO98/57436中,描述了一种类似的系统,尽管没有上述增强信号的单声道的兼容性。现有技术方法的共同点在于将它们作为纯粹的后处理来使用。换句话说,解码器不能获知立体声宽度的信息,更不用说在立体声录音室内的位置。因此,伪立体声信号可能有也可能没有原信号的立体声特性的类似之处。现有技术系统不适用的一种具体的情况是当原信号是一个纯单声道信号时,这通常是在语音录音的情况下。在解码器上将这个单声道信号盲目地转换成一个合成立体声信号,在语音情况下这通常将导致令人不舒服的人为加工感觉,并可能降低清晰度和语音可理解性。目的在于在低比特率上的真实立体声传输的其它现有技术系统通常使用一种求和和差值编码方案。因此,将原始的左(L)和右(R)信号转换成一个求和信号S=(L+R)/2和一个差值信号D=(L-R)/2,随后编码和传输。接收机解码S和D信号,在此基础上通过操作L=S+D和R=S-D重新建立原始的L/R信号。这种方法的优点在于随时可以使用L和R之间的冗余,因此与S相比,需要编码的D内的信息更少,需要更少的比特。显然,极端情况是纯单声道信号,即L和R相等。传统的L/R编解码器两次编码这个单声道信号,而一个S/D编解码器检测这个冗余,D信号(理想上)不需要任何比特。另一种极端情况用与“异相”信号对应的R=-L的情况来表示。现在,S信号为零,而D信号计算为L。同样,S/D方案与标准的L/R编码相比具有明显的优点。然而,考虑例如在信号通路中R=0的情况,这在早期的立体声录音中是很常见的。S和D都等于L/2,S/D方案并不提供任何优点。相反,L/R编码方法将这种情况处理得很好R信号并不需要任何比特。因此,现有技术的编解码器根据在给定瞬间哪种方法最有益而在这两种编码方案之间自适应地切换。上面的例子仅是理论性的(除了双单声道的情况之外,双单声道的情况在纯语音的节目中很普遍)。因此,实际的立体声节目资料包含大量的立体声信息,即使执行上述切换,所获得的比特率对于许多应用来说通常依然太高。此外,如从上面的重新合成关系可以看出的,为了进一步降低比特率而非常粗糙地量化D信号也是不可行的,因为量化误差将转换成在L和R信号中不可忽略的电平误差。专利技术概述本专利技术在编码和传输之前使用信号立体声特性的检测。在最简单的形式中,检测器测量在输入的立体声信号中出现的立体声感觉的量值。然后,将这个量值作为立体声宽度参数和原始信号的编码单声道之和一起传输。接收机使用受所述参数控制的伪立体声生成器解码这个单声道信号,并应用适当的立体声宽度量值。作为一种特殊的情况,作为一个零立体声宽度来传输一个单声道输入信号,并相应地在解码器中不使用立体声合成。根据本专利技术,例如,可以根据原始左右声道的差值信号或互相关来确定立体声宽度的有用测量值。可以将如此计算出的量值映射成少量的状态,实时地或者根据需要地在合适的固定速率上传输这些状态。本专利技术还教导了如何滤波合成的立体声分量,从而降低不能掩蔽通常与低比特率编码信号有关的编码人工噪声的风险。可选择地,在编码器内检测立体声域内的整体立体声平衡或定位。这个信息可选地与上述宽度参数一起作为一个平衡参数与编码的单声道信号一起有效地传输。因而,通过相应地改变两个输出声道的增益,可以在解码器上重建相对于录音室两侧的位置偏移。根据本专利技术,可以根据左右信号功率的商来获得这个立体声平衡参数。与整体立体声编码相比,这两种参数的传输需要很少的比特,因此总的比特率需求很低。在本专利技术的一种更好的提供更准确的参数立体声描述的设计中,使用若干平衡和立体声宽度参数,分别代表各个频带。推广到每频带操作的平衡参数和计算为左右信号功率之和的电平参数的相应每频带操作一起实现了立体声信号功率谱密度的一种新的任意详细的表示。除了S/D系统也利用的立体声冗余的优点之外,这种表示的一种具体的优点是与同样的电平信号相比,可以用更低的精确度来量化平衡信号,因为当转换回立体声频谱包络时量化误差将导致“空间上的误差”,即在立体声全景中可感知的位置,而不是在电平上的误差。类似于传统的切换L/R和S/D系统,有利于电平L/电平R信号,可以自适应地关闭电平/平衡方案,当整体信号向任一声道严重偏置时这更加有效。无论何时需要一种功率谱包络的有效编码方法,都可以使用上述的频谱包络编码方案,并可以作为一种工具结合在新的立体声源编解码器内。一个特别感兴趣的应用是在受原始信号高频带包络的相关信息引导的HFR系统内。在这样一个系统中,使用任意一个编解码器来编码和解码低频带,在解码器上使用解码的低频带信号和所发送的高频带包络信息重新生成高频带(PCTWO 98/57436)。此外,通过将包络编码锁定到电平/平衡操作,提供了建立一个可标度(scalable)的基于HFR的立体声编解码器的可能性。在此,将电平值馈送给主比特流,根据实现方式,该主比特流通常解码成一个单声道信号。将平衡值馈送给次比特流,该次比特流是除了主比特流之外靠近发射机的接收机可以获得的,例如一个IBOC(带内信道上)数字调幅广播系统。当组合这两个比特流时,解码器生成一个立体声输出信号。除了电平值之外,主比特流还可以包含立体声参数,例如宽度参数。因此,单独解码这个比特流已经生成了一个立体声输出,当两个比特流都可用时改善了这个立体声输出。附图说明现在,参考附图,通过并非限制本专利技术范围或精神的说明性例子来描述本专利技术,在附图中图1图示一个音源编码系统,其中包括一个由参数立体声编码器模块增强的编码器和一个由参数立体声解码器模块增强的解码器;图2a是一个参数立体声解码器模块的模块示意图;图2b是一个带有控制参数输入的伪立体声生成器的模块示意图;图2c是一个带有控制参数输入的平衡调整器的模块示意图;图3是使用与多频段平衡调整相组合的多频段伪立体声生成的参数立体声解码器模块的模块示意图;图4a是一个可标度的基于HFR的立体声编解码器的编码器一侧的模块示意图,它使用频谱包络的电平/平衡编码;图4b是相应本文档来自技高网...

【技术保护点】
一种输入信号的立体声特性的编码方法,其特征在于:    在编码器上,计算一个代表所述输入信号的立体声宽度的宽度参数;和    在解码器上,生成一个立体声输出信号,使用所述宽度参数控制所述输出信号的立体声宽度。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:弗雷德里克海恩克里斯托弗克约尔林拉尔斯古斯塔夫里尔耶尔德乔纳斯罗丹乔纳斯英哥德加德
申请(专利权)人:编码技术股份公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利