音频处理制造技术

技术编号:3688804 阅读:150 留言:0更新日期:2012-04-11 18:40
一种音频系统,包括后处理器(12),用于对经解码的音频信号(14)的连续片段进行改变,以提供经后处理的音频信号(16)的连续片段。掩蔽阈值生成器(20),针对经后处理的音频信号(16)的连续片段给出掩蔽阈值估测值()。噪声电平发生器(17),针对经后处理的音频信号(16)的连续片段给出噪声电平的估测值();失真生成器(17),针对经后处理的音频信号(16)的连续片段确定噪声电平超过掩蔽阈值的程度(D)。调节器(18),依照噪声电平超过掩蔽阈值的程度来控制后处理器。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及对音频信号进行处理。
技术介绍
现在参照附图1,在传统的音频系统中,解码器10接收音频流AS,音频信号(未示出)被编码在该音频流AS中。解码器10产生与音频信号的连续片段相应的时域信号14。对于立体声编码的音频信号而言,解码器产生一对,例如,中/侧或差动立体声通道信号14。我们都知道,对这些通道信号应用后处理来提高信号的形态。所以,例如,后处理器12可以对通道信号14进行立体声展宽,来产生变化后的通道信号16。然后将通道信号16馈送给音频输出系统15,通过该音频输出系统,将这些信号为聆听者播放出来,或者按照另外的可选方案,对这些信号进行保存或发送出去。在很多编码器中,包括例如MPEG编码器,音频信号是采用有损处理编码为位流的。我们已经发现,将用于这样的位流的解码器和后处理组件级联是存在着问题的。这是因为对有损编码的音频片段进行后处理能够造成不该出现的可听见的人为噪声,这种人为噪声是在对原始的音频片段进行编码的过程中产生的量化噪声造成的。为了防止降低后处理之后的编码片段的音频质量,可以对编码器、解码器或后处理器进行调整。不过,这样可能会涉及现有系统的重大重新设计。因为对上述问题的解决方案需要在对已经进行了编码的片段应用后处理的系统中进行实施,所以应当注意,产生位流的原始音频片段一般来说是不可利用的。同时,在对信号进行任何的后处理变化之前,后处理之后的音频信号质量应当是已知的。虽然可以在针对客观音频质量测量的文献中找到一些技术,但是它们通常假设原始音频片段是可以利用的。传统的方法,例如互相关,并不会指明量子噪声可听见与否。简单的实验已经表明,针对后处理过的中/侧编码和差动编码立体声片段的左右通道间的互相关是类似的,然而这两种模式的后处理片段的音频质量可能是完全不同的。
技术实现思路
按照本专利技术,给出了一种按照权利要求1的音频系统。本专利技术给出了一种在无需使得原始音频片段可以得到利用的情况下检测后处理之后可听见的量化噪声并且通过调节后处理的程度来防止量化噪声变得可听见的系统和方法。本专利技术给出了一种“盲目的”客观信号测量方法,即,只利用可获得的经解码的音频片段来进行质量测量。本专利技术以这样的方式对信号路径进行改变这意谓着不需要对现有的组件进行改变来实现本专利技术。附图说明现在将参照附图借助实例对本专利技术的实施方式进行介绍,其中附图1表示现有技术的音频系统;附图2表示按照本专利技术的第一实施方式的音频系统;附图3(a)和(b)说明分别针对原始信号和经后处理的信号的量化噪声的可听见程度;和附图4和5图解说明按照本专利技术的另一种可选实施方式的另外的音频系统。具体实施例方式附图2表示一种按照本专利技术的第一实施方式的用于对经编码的音频片段进行后处理的音频系统。首先,在解码器10中对经编码的音频位流AS进行解码,并且然后由后处理器12对其进行后处理。优选实施方式是参照与不可思议声音(Incredible Sound)后处理器(在例如PCT申请第WO98/21915号和美国专利第5742687号中进行了介绍)结合在一起的MPEG-1层次I解码器加以介绍的,不过显然可以看出,总地来说,本专利技术可以应用于编码器和后处理器。这样,解码器10产生一对输出通道14,这一对输出通道14具有,例如,和/差或中/侧PCM(脉冲码调制)形式,并且后处理器12对信道14进行立体声展宽,以产生输出通道16。检测器17针对音频流的每一帧或片段计算失真量D并且将这一测量结果馈送给调节器18,调节器18确定所允许的后处理的最大量。在不可思议声音的情况下,由后处理器12进行的立体声展宽的程度是由调节器18给出的参数α决定的。这样,如果需要的话,通过调节器18来降低供应给后处理单元12的α的值,可以使得后处理的量得到降低。按照第一实施方式,后处理之后的量化噪声的可听度或失真度是在假设只有用于经编码的片段的位流可用的情况下检测到的。这种检测方法基于心理声学模型和在位分配处理期间编码器中使用的位分配方法。心理声学模型基于这样的知识由于内耳的特殊的生理习性,人类听觉系统仅能觉察到合成声谱的一小部分。只有那些位于给定声音的掩蔽阈值之上的声谱部分对其收听有贡献。这样,与给定声音发生在同一时刻但具有较低强度并且因此位于掩蔽阈值之下的任何声学行为都将无法听到,因为它被主要的声源屏蔽掉了。编码器的目的是在将量化噪声保持在掩蔽阈值之下的同时,尽可能地降低音频流的位速率。在MPEG编码器中,音频信号的可察觉部分是通过将频谱分割成32个等间距的子频段来提取的。在每个子频段中,信号是以这样的方式进行量化的量化噪声与掩蔽阈值匹配或恰好低于掩蔽阈值。不过,在后处理之后,噪声电平可能会超过掩蔽阈值,造成了可听见的量化噪声。这样,优选实施方式的检测方法要确定噪声电平超出掩蔽阈值到了什么样的程度。按照第一实施方式,做出下述假设●原始的音频信号片段不可利用,●针对音频信号的编码片段的位流(AS)是可以利用的,●所使用的后处理技术的类型是已知的,和●经编码的片段与原始的片段在感觉上是相等的,即,听起来是一样的。因为原始的音频片段是不可利用的,所以由量化造成的实际误差信号(噪声)(经编码的片段减去原始的片段)也是不可利用的。不过,可以从位流中提取出信息来确定,例如,在编码器中使用了何种编解码器、(多个)位速率和设置来产生位流。虽然在优选实施方式中假设了原始的片段是不可利用的,但是在论证优选实施方式中采用的评估质量的过程中,原始片段是很有用的。所以,参照附图3(a),以22标示原始音频片段的频谱。线24表示针对以传统的方式由频谱22求得的信号的掩蔽阈值。MPEG-1层次I使用均匀对称的中点水平量化器。如果量化器的输入范围是,那么步长大小Δ是在两个连续的量化等级之间的差并且是由下式给出的Δ=2M-1]]>其中M是所使用的量化等级的数量。总的来说,如果输入信号处于量化器输入范围之内并且如果M足够大,那么对于非常大的信号类而言,会表现出,量化误差ε接近于具有下列方差的均匀分布σs2=Δ212]]>对于音频片段的每一帧并且对于每一个子频段,首先将12个子频段采样的组归一化到中,得到了32个缩放系数scfi,每个子频段i一个。每个子频段i的噪声电平的能量现在可以估算为σs,i2=Δ212scfi2]]>等式1这可以针对左右通道和所有的子频段进行计算。这样,片段22(如果是在比方说MPEG-1层次I编码器中进行编码的)的噪声电平是由线26表示的。可以看出,对于频率范围28、28’和28”,这些噪声电平超过了掩蔽阈值24,所以可以设想可能会发生一定的失真,甚至在原始编码的音频片段中也会发生一定的失真。不过,在对这样的有损编码音频片段进行后处理时,经过后处理的量化噪声可能会进一步超过经后处理的片段的掩蔽阈值。从附图3(b)中的范围30可以看出,由线26’表示的噪声电平在很大的频率范围内超过了由线22’表示的后处理信号的掩蔽阈值24’,并且超出了很大的量。这样,附图3(b)表示介于接近巴克(Bark)之间的可听见噪声电平的明显升高-与附图3(a)的编码片段相比,巴克近似等于Hz。如前面所提到的本文档来自技高网
...

【技术保护点】
一种音频系统,包括:后处理器,用于对经解码的音频信号的连续片段进行改变,以提供经后处理的音频信号的连续片段;失真检测器,用于确定在对所述音频信号的连续片段进行编码过程中引入的量化噪声由于所述后处理的作用变得可听见的程度;和调节器,用于按照所述程度控制所述后处理器。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:RM阿尔特斯DWE肖本F希克索伊坦
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1