多通道音频编码器制造技术

技术编号:3046792 阅读:173 留言:0更新日期:2012-04-11 18:40
多通道声码器,包括:    取帧器(64),其向以某一采样速率采样的多通道声信号的每个通道提供声频窗口以产生各个声帧序列;    多个滤波器(34),其在基带频率范围内把通道的声帧分成多个独立的频率子带,所说的频率子带中的每一个子带包括子带帧序列,在每个子带帧中具有至少一个声数据子帧;    多个子带编码器(26),其以一次一个子帧的形式对各频率子带中的声数据进行编码使之成为编码的子带信号;    多路转换器(32),其把编码的子带信号压缩和多路转换成适合每个序列数据帧的输出帧由此形成具有某一传输速率的数据流;和     控制器(19),其根据采样速率和传输速率设定声窗的尺寸以便将所说输出帧的尺寸限定在所需的范围内。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及高质量多通道声信号的编码和解码,更确切地说,涉及一种子带编码器,其在整个时间内利用完全/不完全重构滤波器、预测/非预测子带编码、瞬态分析、和心理声学/最小均方差(mmse)的位分配、频率和多声道产生限定解码计算载荷的数据流。
技术介绍
可以将公知的高质量声音和音乐编码器分成两大类模式。第一类是,用于高频分辨子带的媒体/变换编码器,该编码器能根据心理声学的掩蔽计算结果在分析窗内自适应地量化子带或系数样本。第二类是,低频分辨子带编码器,这种编码器通过用ADPCM对子带样本进行处理来补偿其低下的频率分辨率。第一类编码器通过使位分配适应于信号的谱能从而利用了普通音乐信号中的大量短程频谱变化。借助这些编码器的高分辨率可以把频率转换信号直接应用到心理声学模型上,这主要基于听觉的临界频带理论。托德(Todd)等人的Dolby的AC-3声学编码器“AC-3声音传播和存储的柔感编码”声学工程协会大会,1994年2月一般性地计算了各个PCM信号上的1024-ffts并在每个通道中建立了针对1024个频率系数的心理声学模型以便确定每个系数的位速率。Dolby系统使用了瞬态分析,这样能把窗口尺寸减小到256个样本从而达到隔离这些瞬态的目的。AC-3编码器采用了专用的反向自适应算法以便对位分配进行解码。这样便减少了沿编码声数据一侧发射的位分配信息量。结果,在正向自适应系统的范围内增加了适合声学要求的频带宽度从而改善了音质。在第二类编码器中,在不明显涉及任何心理声学掩蔽理论的情况下,差值子带信号的量化或者是固定的或者可用于最大限度地减小穿越所有或部分子带的量化噪声能量。由于很难估计位分配处理之前的预测特性,所以通常不能把心理声学的失真直接加到预测/差值子带信号上。由于量化噪声在预测量处理时的相互作用而使问题进一步复杂化。由于感性临界声信号通常是周期性的,所以这些编码器可在较长的时间周期内工作。这种周期性是通过预测差分量化而得到的。把信号分成少量子带的结果降低了噪声调制的听觉效果并且可利用声信号的长程频谱变化。如果子带的数量增加,那么每个子带中的预测增益将降低而且在某些点上的预测增益将趋于零。数字式影院系统,L.P.(DTS)采用了一种声码器,其中将每个PCM声道滤成四个子带而且用反向ADPCM编码器对每个子带进行编码,所述反向ADPCM编码器使预测系数适应于子带数据。使位分配固定且使每个通道也同样固定,赋予低频子带的位多于高频子带。位分配提供了固定的压缩率,例如4∶1。迈克·史密斯(MikeSmyth)和斯蒂芬·史密斯(Stephen Smyth)在“APT-X100广播中使用的低滞后、低位速率、子带ADPCM声码器”第十次国际AES会议汇编,1991年,第41-56页中描述了DTS编码器。两种声码器还具有其它共同的局限性。首先,公知的声码器用固定的帧尺寸进行编码/解码,即,样本的数量或用帧表示的时间周期是固定的。结果,当编码的传输率相对于样本率增加时,帧内的数据量也增加。因此,必须把解码器中缓冲器的尺寸设计得能适应最糟的情况以避免数据溢出。这样将会增加作为解码器主要成本因素的RAM之数量。其次,公知的声码器不易扩大到使采样频率大于48kHz。由此使得现有解码器与新解码器所需的格式不兼容。对未来的产品不能兼容导致了严重的局限性。此外,对PCM进行编码所用的公知格式要求在播放之前启动由解码器读入的全部帧。这就需要把缓冲器的尺寸限制在接近100ms数据块从而使滞后或等待时间不会干扰听者。此外,虽然这些编码器的编码能力达24kHz,但却常常丢失更高频的子带。这样会降低高频保真度或重构信号的背景。公知编码器通常使用两种误差检测系统中的一种。最常用的是读所罗门编码(Read Solomon coding),其中编码器把误差检测位加到数据流中的边(side)信息上。这有利于检测和校正边信息中的任何误差。然而,无法测出声数据中的误差。另一种方法是检验无效码状态的帧和声标题。例如,个别的3位参数可能只具有3种有效状态。如果只鉴别出其它五种状态中的一种那么肯定出现了误差。这只是显示了检测能力而并不检测声数据中的误差。
技术实现思路
从上述问题出发,本专利技术提供了一种具有柔性的多通道声码器,其在高位速率下以比CD更好的质量灵活调整压缩能级的宽度范围和通过降低播放等待时间、简化误差检测改善了低位速率的感性质量、改善了前回波的失真以及对较高采样率的进一步扩展性。这是用子带编码器实现的,子带编码器把每个声道划为声帧序列,把帧滤成基带和高频区,把每个基带信号分解成多个子带。子带编码器在位速率较低时一般选择非完全滤波器以便分解基带信号,而在位速率足够高时选择完全滤波器。高频编码层对与基带信号无关的高频信号进行编码。基带编码层包括分别对高频和低频子带进行编码的VQ和ADPCM编码器。每个子带帧包括至少一个子帧,每个子帧进一步细分为多个子子帧。对每个子帧进行分析以便估计ADPCM编码器的预测增益和检测瞬变状态以调节前后瞬变状态SFs,在所述ADPCM编码器中,当预测增益较低时其预测能力将丧失。全位管理(GBM)系统利用多个声道、多个子带和当前帧中的子帧之间的差把各位分配到每个子帧。GBM系统最初通过计算被预测增益改变的SMR而将各位分配到每个子帧以满足心理声学模型。然后,GBM系统按照MMSE分配的瞬间转换、降低所有噪声或MMSE的渐变变换等方法分配所有剩余位。多路转换器产生包括同步字、帧标题、声标题和至少一个子帧的输出帧并以传输速率把输出帧多路转换成数据流。帧标题包括窗口尺寸和当前输出帧的尺寸。声标题表示声帧的压缩装置和编码格式。每个声频子帧包括在与任何其它子帧无关的情况下对声频子帧进行解码的边信息、高频VQ编码、多个用于压缩各通道低频子带声数据并将其与其它通道进行多路转换的基带声频子子帧、在每个通道的高频范围内将声频数据压缩并将其与其它通道进行多路转换从而在多种解码采样速率下对多通道声信号进行解码和解压缩同步确定子帧端部的高频声信息块。选择窗口尺寸作为传输速率与编码采样速率之比的函数从而把输出帧的尺寸限制在要求的范围内。当压缩量较低时,窗口尺寸减小从而使帧尺寸不会超过上限最大值。结果,解码器可以采用具有固定和较少RAM数量的输入缓冲器。当压缩量相对高时,窗口尺寸增加。结果,GBM系统需将各位分布到大的时间窗内由此改善编码特性。通过以下结合附图对优选实施例所作的详细说明将更有助于熟悉本领域的技术人员理解本专利技术的这些和其它特征和优点,其中附图说明图1是按照本专利技术所述5通道声码器的方框图;图2是多通道编码器的方框图;图3是基带编码器和解码器的方框图;图4a和图4b分别是高采样速率编码器和解码器的方框图;图5是单通道编码器的方框图;图6是相对于可变传输速率的每帧字节与帧尺寸之间关系的曲线图;图7是NPR和PR重构滤波器的幅值响应曲线图;图8是重构滤波器的子带混叠曲线图; 图9是NPR和PR滤波器的失真曲线图;图10是单个子带碥码器的示意图;图11A和11B分别表示子帧的瞬态检测和比例因数计算;图12表示对量化TMODES的熵(entropy)编码过程;图13表示比例因数量化过程;图14表示信号掩蔽响应所产生的SMRs随信号频率产生的旋转;图1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.多通道声码器,包括取帧器(64),其向以某一采样速率采样的多通道声信号的每个通道提供声频窗口以产生各个声帧序列;多个滤波器(34),其在基带频率范围内把通道的声帧分成多个独立的频率子带,所说的频率子带中的每一个子带包括子带帧序列,在每个子带帧中具有至少一个声数据子帧;多个子带编码器(26),其以一次一个子帧的形式对各频率子带中的声数据进行编码使之成为编码的子带信号;多路转换器(32),其把编码的子带信号压缩和多路转换成适合每个序列数据帧的输出帧由此形成具有某一传输速率的数据流;和控制器(19),其根据采样速率和传输速率设定声窗的尺寸以便将所说输出帧的尺寸限定在所需的范围内。2.根据权利要求1所述的多通道声码器,其中控制器按照两个小于 值的最大乘积设定声窗尺寸,其中帧尺寸是输出帧的最大尺寸,Fsamp是采样速率,和Trate是传输速率。3.根据权利要求1所述的多通道声码器,其中在目标位速率下对多通道声信号进行编码并且子带编码器包括预测编码器,所述多通道声码器进一步包括全位管理器(GBM)(30),其计算心理声学信号与掩蔽比(SMR)和每个子帧的估计预测增益(Pgain),通过把SMRs减小到与其相关之预测增益的各比值来计算掩蔽与噪声比(MNRs),分配各位使之满足每个MNR,计算所有子带上的分配位速率,和调节...

【专利技术属性】
技术研发人员:斯蒂芬·M·史密斯迈克尔·H·史密斯威廉·保罗·史密斯
申请(专利权)人:数字剧场系统股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利