通过降低前噪声改善音频编码系统的瞬时性能的方法技术方案

技术编号:3046565 阅读:187 留言:0更新日期:2012-04-11 18:40
本发明专利技术通过检测音频信号流中的瞬时信号并改变瞬时信号相对于编码块的时域关系来减小音频信号流中瞬时信号之前的失真成分,所述的音频信号流经过一个使用编码块的基于变换的低比特率音频编码系统处理,而所述的改变瞬时信号的时域位置可以缩短失真成分的持续时间。对音频数据的时间缩放应该能在基于变换的低比特率音频编码器进行量化处理之前将瞬时信号重新定位,以便减小解码音频信号中的前噪声总量。作为替代、或是额外的处理技术,在一个基于变换的低比特率音频编码系统中,检测音频信号流中的瞬时信号,并对失真成分的一部分进行时间压缩,从而缩短失真成分的持续时间。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术主要涉及信息的高质量、低比特率数字变换编码与解码,所述的信息代表了音乐之类的音频信号或是语音信号。更具体的说,本专利技术涉及消除由这样一种编解码系统所产生的音频信号流中的瞬时信号之前的失真分量(“前噪声”)。
技术介绍
时间缩放时间缩放指的是改变一个音频信号的时间进度或持续时间,同时又不改变其频谱内容(感知到的音色)或感知到的音调(其中音调是与周期音频信号相关的特性)。音调缩放指的是修改一个音频信号的频谱内容或感知到的音调,同时又不影响其时间进度或持续时间。时间缩放与音调缩放彼此互为对偶的方法。例如,将一个数字化音频信号的音调提高5%,再对其进行5%的时间缩放(也就是延长信号的持续时间),接着以高出5%的采样率读出采样值(比如,通过重新采样),就可以不影响信号的持续时间,从而维持其最初的持续时间。结果得到的信号与原始信号具有相同的持续时间,但却有着经过修改的音调或频谱特性。重新采样并不是时间缩放或音调缩放所必需的步骤,除非要通过重新采样来保持固定的输出采样率或维持输入和输出采样率相同。在本专利技术的各方面内容中,都使用了音频流的时间缩放处理。但是,正如上面所提到的那样,也可以用音调缩放技术来实现时间缩放, 因为它们彼此互为对偶方法。因此,尽管这里用了“时间缩放”这种说法,但使用音调缩放来实现时间缩放的技术也可以被采用。低比特率音频编码信号处理领域内的人们都很希望将表示一个信号所需的信息量最小化,而又不对信号质量造成可感知的损失。通过减少信息量需求,信号就能对通信信道及存储媒质提出较低的信息容量需求。对于数字编码技术来说,最小信息量需求等价于最小二进制比特需求。某些用于编码音频信号以便为人类听觉服务的现有技术尝试通过充分利用心理声学的影响来减少信息量需求,同时又不造成任何能听见的质量退化。人耳所表现出的频率分析特性类似于具有可变中心频率的高度非对称可调谐滤波器。人耳检测不同音调的能力会随着音调间频率差别的增大而提高;但是,耳朵的分辨能力对小于上述滤波器带宽的频率差会大致保持固定。因此,人耳的频率分辨能力会随着这些滤波器的带宽在整个音频频谱上变化。这样一种听觉滤波器的有效带宽被称为关键频带。关键频带内的优势信号比关键频带之外频率上的其他信号更可能掩盖掉那个关键频带内任何位置上的其他信号的可听性。优势信号不但能掩盖与掩盖信号同时出现的信号,还能掩盖掉出现在掩盖信号之前或之后的信号。关键频带内的前掩盖与后掩盖效应的持续时间取决于掩盖信号的幅度,但是前掩盖效应的持续时间往往远短于后掩盖效应的持续时间。请参见“the Audio EngieeringHandbook,K.Blair Benson ed.,McGraw-Hill,San Francisco,1988,pages 1.40-1.42 and 4.8-4.10”。将有用信号带宽分割成具有接近耳朵的关键频带带宽的频率带的信号记录与传输技术比更宽频带的技术更能充分利用心理声学效应。充分利用了心理声学掩盖效应的技术能够使用低于PCM编码所需比特速率编码并再生一个信号,该信号与原始输入信号没有区别。关键频带技术包括将信号带宽划分成多个频带、处理各个频带内的信号,并由各个频带内经过处理的信号重建原始信号的复本。有两种这样的技术分别是子带编码和变换编码。子带和变换编码能减少特定频带内的传输信息量需求,而结果产生的编码不准确度(噪声)会在心理听觉上被临近的频谱成分掩盖,从而不会降低编码信号的主观质量。用一组数字带通滤波器即可实现子带编码。变换编码可以由若干种时域到频域的离散变换中的任何一种来实现,所述的这些变换就能实现一组数字带通滤波器。余下的讨论更主要地涉及变换编码器,因此这里所说的“子带”是用来表示总信号带宽中被选取的部分,而不论是用子带编码器还是变换编码器实现的。由变换编码器实现的子带是由一组一个或多个相近的变换系数定义的;因此,子带带宽是变换系数带宽的倍数。变换系数的带宽与输入信号采样率成正比,而与变换所产生的代表输入信号的系数数量成反比。如果整个可听见的频谱上的子带带宽大致为人耳在频谱同样部分中的临界带宽的一半,那么心理声学掩盖就更容易由变换编码器实现。这是因为人耳的临界带宽具有可变的中心频率,该中心频率能自行调整以适应听觉激励,而子带和变换编码器通常都具有固定的子带中心频率。为了最好的利用心理声学掩盖效应,由于优势信号的存在而引起的任何失真分量都应被限制在包含了优势信号的子带中。如果子带带宽大致为关键频带的一半或小于关键频带的一半,而且滤波器的选择性足够高,那么对于频率处在子带通带带宽边沿附近的信号都有可能对其中不需要的失真成分产生有效的掩盖。如果子带带宽大于关键频带的一半,那么优势信号就有可能使耳朵的关键频带偏离编码器的子带,从而某些偏出耳朵的关键频带之外的失真分量就不会被掩盖掉。这种效应在低频中是非常有害的,因为在低频中耳朵的关键频带相对较窄。优势信号可能导致耳朵的关键频带偏离编码器子带、从而不能掩盖同一个编码器子带中的其他信号,这种情况的发生概率通常在低频上更大,因为在低频上耳朵的关键频带更窄。在变换编码器中,可能出现的最窄子带是一个变换系数,因此当变换系数带宽不超过耳朵的最窄临近频带的一半时,心理听觉遮蔽会更容易实现。提高变换的长度可以降低变换系数带宽。提高变换长度的一个缺点是会提高计算变换的处理复杂度,而且需要对更大数量的较窄子带进行编码。下面讨论了其他的缺点。当然,如果这些子带的中心频率能够像耳朵的关键频带中心频率那样跟随优势信号分量移动的话,也可以使用较宽的子带来实现心理声学掩盖。变换编码器利用心理声学掩盖效应的能力还取决于该变换所实现的滤波器组的选择性。这里所用的滤波器“选择性”这种说法,指的是子带带通滤波器的两种特性。第一种特性是滤波器通带和阻带之间区域的带宽(过渡带的宽度)。第二种特性是阻带内的衰减水平。因此,滤波器选择性表示了滤波器响应曲线在过渡带内的陡度(过渡带下降陡度),以及阻带内的衰减水平(阻带抑制深度)。滤波器选择性受到许多因素的直接影响,其中包括下面所要讨论的三种因素块长度、窗加权函数和变换。一般的说,块长度影响编码器的时域和频域分辨率,而加窗和变换则影响编码增益。低比特率音频编码/块长度在子带滤波之前,有待编码的输入信号被采样并划分成“信号采样块”。信号采样块中采样值的数目称为信号采样块长度。变换滤波器组所产生的系数数量(变换长度)与信号采样块长度相等是很正常的情况,但是这并非必要。也可以使用重叠块变换,这种变换在本
中有时会被描述成长度为N的变换,该变换对具有2N采样值的信号采样块进行变换。这种变换也可以被描述为2N长度的只产生N个不同的系数的变换。因为这里所讨论的所有变换都可以被认为具有与信号采样块长度相等的长度,因此这里一般会将两种长度作为同义词使用。信号采样块长度影响变换编码器的时域和频域分辨率。使用较短块长度的变换编码器的频域分辨率较差,因为离散变换系数带宽较宽而滤波器选择性则较差(减小的过渡带下降速率和减弱的阻带抑制水平)。滤波器性能的退化会导致单频谱成分的能量扩散到相邻的变换系数中。这种频谱能量的扩散是退化的滤波器性能造成的结果,称为“旁瓣泄漏”。使用较长块长度的变换编码器具有较本文档来自技高网
...

【技术保护点】
一种用来降低音频信号流中一个瞬时信号之前的失真成分的方法,所述的音频信号流由一种使用编码块技术的基于变换的低比特率音频编码系统处理,所述的方法包括:在所述的编码系统进行处理前检测音频信号流中的一个瞬时信号,以及移动所述瞬时信 号相对于所述编码块的时域关系,从而缩短所述失真成分的持续时间。

【技术特征摘要】
【国外来华专利技术】US 2001-5-10 60/290,2861.一种用来降低音频信号流中一个瞬时信号之前的失真成分的方法,所述的音频信号流由一种使用编码块技术的基于变换的低比特率音频编码系统处理,所述的方法包括在所述的编码系统进行处理前检测音频信号流中的一个瞬时信号,以及移动所述瞬时信号相对于所述编码块的时域关系,从而缩短所述失真成分的持续时间。2.根据权利要求1所述的方法,其中所述的移动步骤在所述编码系统的编码器进行前向变换之前移动所述瞬时信号相对于所述编码块的时域关系。3.根据权利要求2所述的方法,其中所述的瞬时信号被移动到紧接着下一个块一端或紧接着上一个块一端的时域位置上。4.根据权利要求3所述的方法,其中所述的瞬时信号被移动到紧接着下一个块一端或紧接着上一个块一端的时域位置上,从而导致较短的时间位置移动。5.根据权利要求1或权利要求3所述的方法,还包括在所述编码系统的解码器进行反变换之后,将剩下的失真成分至少消除一部分。6.根据权利要求5所述的方法,其中所述的部分剩余失真成分至少部分地是由元数据信息决定的,该元数据信息在所述的编码系统中传送。7.根据权利要求5所述的方法,其中所述的部分剩余失真成分至少部分地是由一个缺省参数决定的。8.根据权利要求5所述的方法,其中所述的部分剩余失真成分至少部分地是通过测量所述音频信号流中的高频音频分量而决定的。9.根据权利要求2或权利要求3所述的方法,其中所述瞬时信号相对于所述编码块的时域关系是通过对所述瞬时信号之前的一段所述音频信号流进行时间缩放而移动的。10.根据权利要求9所述的方法,还包括在所述编码系统的解码器完成反变换之后对音频信号流进行补偿时间缩放,从而使得经过处理的音频信号流的时间进度基本与进行所述移动之前的音频信号流的时间进度相同。11.根据权利要求10所述的方法,其中所述的补偿时间缩放是对所述瞬时信号之前的一段所述音频信号流进行的。12.根据权利要求10所述的方法,其中所述的编码系统包括一个编码器和一个解码器,所述的编码器将元数据连同所述音频信号流的编码版本一起发送给所述的解码器,所述的元数据中包括可用于进行所述的补偿时间缩放的信息。13.根据权利要求9所述的方法,其中所述的时间缩放是对紧靠所述瞬时信号之前的一段所述音频流执行的。14.根据权利要求13所述的方法,其中被执行了所述的时间缩放的一段所述音频流至少部分地被瞬时信号在时域上前掩盖。15.根据权利要求9所述的方法,其中所述的时间缩放具有从音频信号流中删除信号分量或者向音频信号流中添加信号分量的效果,所述的音频信号流是被输入到编码系统中的。16.根据权利要求15所述的方法,其中在所述的瞬时信号之后又执行了另一次时间缩放,所述的另一次时间缩放的作用方式与所述的第一次时间缩放相反。17.根据权利要求16所述的方法,其中所述的另一次时间缩放是在所述编码系统的编码器进行前向变换之前完成的。18.根据权利要求16所述的方法,其中所述的另一次时间缩放是在所述编码系统的解码器进行反变换之后完成的。19.根据权利要求16所述的方法,其中所述的另一次时间缩放所添加或删除的信号分量的持续时间基本分别与所述的第一次时间缩放所删除或添加的信号分量的持续时间相同,从而使所述音频信号流的持续时间基本保持不变。20.根据权利要求15所述的方法,还包括对所述失真成分之前的音频信号流,其中所述的失真成分位于所述瞬时信号之前,在所述编码系统的解码器完成反变换之后进行补偿时间缩放,从而使经过处理的音频信号流的时间进度基本与进行所述移动前的音频信号流的时间进度相同,并且所述音频信号流的持续时间基本保持不变。21.根据权利要求20所述的方法,其中所述的编码系...

【专利技术属性】
技术研发人员:布莱特克罗克特
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1