正弦波音频编码制造技术

技术编号:3046075 阅读:247 留言:0更新日期:2012-04-11 18:40
一种对音频信号进行编码的方法,该方法包括步骤:   为多个连续段中的每一个段提供各自的采样信号值的组;    对采样信号值进行分析,以为多个连续段中的每一个段确定零个或多个正弦波分量;    从所述采样信号值中减去所述正弦波分量,以给出代表所述音频信号的第一剩余分量的一组值;    对所述音频信号的所述第一剩余分量进行修整,以从所述第一剩余分量中除掉选定的音调分量,并且给出代表所述音频信号的第二剩余分量的一组值;    通过确定逼近第二剩余分量的噪声参数来模拟第二噪声分量;和    产生包含所述噪声参数和代表所述正弦波分量的编码的编码音频流。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对音频信号进行编码。
技术介绍
现在参照附图1,在PCT专利申请第WO01/69593号中介绍了一种参数编码方案,具体来说是一种正弦波编码器。在这种编码器中,将输入音频信号x(t)分割成多个(重叠的)段,一般来说具有20ms的长度。再将每个段分解为瞬变、正弦波和噪声分量。这个分解过程是相继完成的,即,首先根据是否应用了增益控制在瞬变编码器11中从输入信号x(t)中提取出瞬变,剩下第一剩余信号下x1/x2;使用正弦波编码器13对第一剩余信号进行编码;然后从第一剩余信号中提取出经过编码的正弦波,以剩下第二剩余信号x3;使用噪声编码器14顺次对这个第二剩余信号进行编码。在正弦波分析器130中,使用多个由幅度、频率和相位参数代表的正弦波模拟每个段的第一剩余信号x2。一旦估算了每个段的正弦波,则开始跟踪算法。这个算法在段到段的基础上将正弦波连接起来,以获得所谓的轨迹。跟踪算法这样得到了正弦波编码Cs,该正弦波编码包括正弦波轨迹,该正弦波轨迹在特定的时刻开始,在多个时间段上持续一定量的时间展开,然后终止。在噪声编码器中可以采用多种编码方法来模拟第二剩余信号x3。为了明晰的音频质量,噪声编码器可以是滤波器组形式的波形编码器。按照另外一种可选方案,为了实现良好的质量和低的位速率,噪声编码器可以采用合成噪声模型来产生,例如,自回归移动平均(ARMA)或线性预测编码(LPC)滤波器参数。还可以得出输入音频信号的其它分量,比如调和线丛。本说明书仅涉及正弦波和噪声分量,但是扩展到调和线丛不会以任何方式影响本专利技术。从音频信号段中提取正弦波可以会引发问题。在这些段中,正弦波的幅度和频率可能会变化并且这称为非平稳态。而且,在正弦波的估算过程中可能会发生错误。结果,使用经过编码的正弦波实现的频谱抑制不总是合乎要求或理想的。这造成了似正弦波分量的存在,尤其是在第二剩余信号中的经过编码的正弦波的位置上或附近。此外,在低位速率下,只有足够编码少量正弦波的比特位,正弦波分量将依旧存在于第二剩余信号中。噪声编码器一般来说模拟剩余信号x3的时域和频域包络相当粗糙,即,它们具有有限的频谱分辨率,并且在噪声编码器模拟正弦波分量的时候,可能会出现人为干扰。即使屏蔽了保留在剩余信号中的音调分量,由于噪声模型的有限频谱分辨率,也可能出现听得见的人为干扰。这种情形尤其可能在低频下发生,此时听觉系统具有良好的频谱分辨率而噪声编码器的频谱分辨率通常较差。而且,与平稳态不同,音调信号、噪声分量的能量会总是随着时间波动。这些波动可能使得预先进行了屏蔽的音调分量能够听见。能量波动在频谱分辨率应当很好(即,低频)的区域中最大。这样,除了试图模拟剩余信号x3中的似正弦波分量这一既有事实之外,噪声编码器需要用于噪声编码CN的额外数据位,将这些分量模拟为噪声可能造成听得见的人为干扰,尤其是在低频下更是如此。本专利技术致力于缓解这一问题。
技术实现思路
按照本专利技术,提供了一种按照权利要求1的方法。本专利技术包括处于噪声编码器之前的再分析级。按照一种实施方式,通过,例如,匹配追踪结合确定何时终止提取音调分量的基于能量的终止标准,从剩余信号中除掉音调分量。按照另一种实施方式,在编码正弦波及其周围的频率上对剩余信号进行额外的抑制。周围频率的数量可以是固定的或者取决于频率。也可以使用心理声学频率分割(例如,Bark/Erb频带)。抑制量可以例如取决于正弦波的数量或者正弦波的能量。结果,噪声编码器不再需要模拟这些正弦波区域。附图说明附图1表示包括音频编码器的现有音频记录器; 附图2表示按照本专利技术的音频编码器的实施方式;附图3表示包括可与本专利技术的编码器一同工作的解码器的音频播放器的实施方式;附图4说明由本专利技术的实施方式的再分析器所执行的处理;和附图5表示包括按照本专利技术的音频编码器和音频播放器的系统。具体实施例方式现在将参照附图对本专利技术的优选实施方式加以介绍,其中为相似的组成部分标注了相似的附图标记,并且除非另有说明,相似的组成部分具有相似的功能。按照本专利技术的优选实施方式,附图2,编码器1’是PCT专利申请第WO01/69593号中介绍的那种类型的正弦波编码器。这一现有编码器的操作及其相应的解码器已经得到了很好的介绍,并且本文仅给出与本专利技术相关的部分的说明。在现有技术和本专利技术中,音频编码器1’以某种采样频率对输入音频信号进行采样,得到音频信号的数字表示x(t)。然后编码器1’将经采样的输入信号分成三个分量瞬变信号分量、不变的确定分量和不变的随机分量。音频编码器1’包括瞬变编码器11、正弦波编码器13和噪声编码器14。瞬变编码器11包括瞬变检测器(TD)110、瞬变分析器(TA)111和瞬变合成器(TS)112。首先,信号x(t)进入瞬变检测器110。这一检测器110估算是否有瞬变信号分量及其位置。这一信息被馈送给瞬变分析器111。如果瞬变信号分量的位置得到了确定,则瞬变分析器111尝试提取瞬变信号分量(的主要部分)。它将形状函数与最好在估算的开始位置上开始的信号段进行匹配,并且通过采用例如一定量(少量)的正弦波分量,确定形状函数之下的内容。这一信息被包含在瞬变编码CT中,在PCT专利申请第WO01/69593中给出了有关产生瞬变编码CT的更加详尽的信息。将瞬变编码CT提供给瞬变合成器112。在减法器16中,从输入信号x(t)中减掉经合成的瞬变信号分量,得到了信号x2。将信号x2提供给正弦波编码器13,在这里,在正弦波分析器(SA)130中对该信号进行分析,该正弦波分析器(SA)确定(确定的)正弦波分量。因此可以看出,虽然希望存在瞬变分析器,但是并非必须有,本专利技术可以在没有这样一个分析器的情况下实现。按照另外一种可选方案,如上所述,本专利技术可以采用例如调和线丛分析器来实现。在任何一种情况下,正弦波编码的最终结果都是正弦波代码CS,在PCT专利申请第WO00/79519号中给出了说明传统地产生示范性正弦波代码CS的更加详细的例子。不过,简要地说,这样的正弦波编码器将输入信号x2编码为从一个帧段到下一个帧段连接起来的正弦波分量的轨迹。通过正弦波合成器(SS)131由使用正弦波编码器产生的正弦波代码CS来重构正弦波信号分量。在减法器17中将这一信号从输入给正弦波编码器13的x2中减掉,得到了剩余信号x3。按照本专利技术,设置了再分析器18,该再分析器18在噪声编码器14对剩余信号x3进行编码之前修整剩余信号x3。在本专利技术的各个实施方式中,再分析器18从剩余信号x3中选择性地除掉或抑制在音调分量的位置上或附近的频谱区域,并且将经过修整的剩余信号x3’提供给噪声编码器14。现在参照附图4,如上所述,在这些实施方式中,提供给再分析器18的剩余信号x3包括在连续时间帧t(n-1),t(n),t(n+1)内重叠的段s1,s2,...。一般来说正弦波是以10ms的速率更新的,并且每个段s1,s2,...的长度两倍于更新速率,即,20ms。按照每种实施方式,再分析器18提供要使用汉宁窗函数(Hanning window function)进行再分析的重叠时间窗t(n-1),t(n),t(n+1),以将来自重叠段s1,s2,...的信号合成为表示时间窗的单独一个信号,步骤42。对经过窗口操作的信号进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对音频信号进行编码的方法,该方法包括步骤为多个连续段中的每一个段提供各自的采样信号值的组;对采样信号值进行分析,以为多个连续段中的每一个段确定零个或多个正弦波分量;从所述采样信号值中减去所述正弦波分量,以给出代表所述音频信号的第一剩余分量的一组值;对所述音频信号的所述第一剩余分量进行修整,以从所述第一剩余分量中除掉选定的音调分量,并且给出代表所述音频信号的第二剩余分量的一组值;通过确定逼近第二剩余分量的噪声参数来模拟第二噪声分量;和产生包含所述噪声参数和代表所述正弦波分量的编码的编码音频流。2.按照权利要求1所述的方法,其中所述修整步骤包括为所述代表所述音频信号的所述第一剩余分量的所述一组值的连续段给出频谱表示;衰减每个频谱表示内的选定频率;和为已经衰减了所述选定频率的所述频谱表示的连续段给出时域表示。3.按照权利要求2所述的方法,其中所述衰减步骤包括迭代地从所述频谱表示中除掉最大能量的峰值。4.按照权利要求3所述的方法,其中当所除掉的峰值的能量小于从中除掉峰值的频谱表示的总能量的给定百分比时终止所述迭代。5.按照权利要求4所述的方法,其中所述能量等级反比于所述连续段的长度。6.按照权利要求3所述的方法,其中所述迭代在固定次数的迭代之后终止。7.按照权利要求2所述的方法,其中所述衰减步骤包括从所述频谱表示中除掉固定数量的最大能量的峰值。8.按照权利要求2所述的方法,其中所述衰减步骤包括为各个代表与频谱表示之连续段相对应的连续段的正弦分量确定频率值;和衰减各个正弦波分量的所述频率值的区域内的所述频谱表示的频率值。9.按照权利要求2所述的方法,其中所述衰减步骤包括为各个代表与频谱表示之连续段相对应的连续段的正弦分量确定第一能量值;为与频谱表示之连续段相对应的所述连续段内的采样信号值确定第二能量值;和按照心理声学模型将所述频谱表示分成频带;将其第一和第二能量值相同的频带的值置零。10.按照权利要求9所述的方法,其中所述编码音频流是采用行程编码表示已经被置零的频带序列来产...

【专利技术属性】
技术研发人员:N·H·范施恩德M·戈梅滋富恩特斯S·L·J·D·E·范德帕A·J·戈里特斯V·科特
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1