在音频编码中正弦波选择制造技术

技术编号:3046042 阅读:208 留言:0更新日期:2012-04-11 18:40
一种通过由多个正弦波表示至少部分音频信号来编码音频信号的方法,该方法包含以下步骤:    -在所述音频信号的第一段上执行分析;    -基于所述分析选择候选正弦波;    -为候选正弦波的至少其中一个定义在所述候选正弦波的频率周围的一个本振频率带;    -在所述本振频率带内组合多个频率成分的振幅,由此排除在所述本振频率带内的候选正弦波的至少之一;以及    -依赖振幅的组合,选择所述候选正弦波作为选择正弦波。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号的编码,其中选择与再现音频信号相关的正弦波并且编码其参数。在正弦波音频编码器中,至少部分音频信号由多个正弦波表示,正弦波通常由其频率、振幅和任选的相位来描述。在编码过程中,以时间段分割音频信号,在它们的频率内容方面分析时间段。典型地,在音频编码器中使用的段大小是在5-60毫秒范围内。对于每一段,选择若干正弦波,随后编码正弦波的参数。为了最小化给定音频质量的比特率,仅仅需要选择和编码相关的正弦波,即仅仅需要在可接受的感知质量中再现编码音频信号的那些正弦波。R.McAulay和T.Quartieri在1986年声学、语音和信号处理的IEEE学报43期第744-754页《基于正弦波表示的语音分析/合成》公开了选择正弦波的方法,该方法称为峰值检出法(Peak Picking)。峰值检出法(Peak Picking)包含选择具有振幅谱峰值的那些频率。选择正弦波的另一个方法是迭代过程,称为匹配跟踪法(matchingpursuit),该方法在2002年Orlando(美国)的声学、语音和信号处理的Proc.IEEE Int.Conf.R.Heusdens和S.van de Par的文章“使用心理声学匹配跟踪的音频和语音的速率失真最佳正弦波模型”公开。每次迭代,含有振幅谱最高峰值的频率被选择并且随后从信号中减去该频率。在接下来的迭代中使用剩余的信号。当选择固定数目的正弦波时,通常停止该过程。由峰值检出法产生的问题是因为选择了所有的峰值所以预先不知道要估计多少正弦波。特别是,当振幅谱是噪声时,则选择了太多的正弦波。与峰值检出法相反,在匹配跟踪法中选择的正弦波的数目是固定的。结果,为了保证选择所有相关的正弦波,这个固定数应该设置的高。将再次选择太多的正弦波。太多的正弦波的选择导致高的比特率,因为所有这些正弦波必须被编码。另一个缺点是在处理时间上有额外的花费。例如感知模拟是在许多音频编码器中使用的过程,以便仅仅编码人耳朵可以听到的部分音频信号。这个模拟是一个昂贵的过程。结果,不希望必须分析的正弦波数目巨大。本专利技术的目的是提供音频编码,该音频编码在给定音频质量的比特率方面是有优势的。为此,本专利技术提供一种编码方法、音频编码器和音频系统,如在所附权利要求中所定义的。在所附的权利要求中定义了有利的实施例。本专利技术的第一方面是提供一种通过由多个正弦波表示至少部分音频信号来编码所述音频信号的方法。该方法包含以下步骤在音频信号的第一段执行分析;基于所述分析选择候选正弦波;为候选正弦波的至少其中一个定义在所述候选正弦波的频率周围的本振频率带;在所述本振频率带内组合频率成分的振幅,其中排除在所述本振频率带内的候选正弦波的至少其中一个;依赖于振幅的组合,选择所述候选正弦波作为选择的正弦波。用于选择候选正弦波的所述分析通常是频率分析。这样的频率分析例如在传统的正弦波选择技术中使用,例如峰值检出法或匹配跟踪法。对于在所述候选正弦波应用的选择程序,在音频信号的第二段执行分析。通常,第二段等于在候选正弦波的选择中使用的第一段,但这不是必需的情况。通过在所述本振频率带内组合频率成分的振幅,其中排除在所述本振频率带内的候选正弦波的至少其中一个,获得用于在所述候选正弦波的本振频率带内的背景频率成分的一个量度(measure)。通过使用这个量度,做出较好的选择。仅仅编码选择的正弦波。结果,选择程序将导致对于给定音频质量编码较小数目的正弦波,这在给定音频质量的比特率方面是有优势的。根据本专利技术的另一个方面,依赖于所述候选正弦波的频率,定义在所述候选正弦波的频率周围的所述本振频率带的带宽。因为依赖于所述候选正弦波的频率,所以可以调整选择程序以适合于不同的频率。根据本专利技术的再一个另外的方面,对所述候选正弦波的频率的所述依赖是基于人对音频的感知。这样一种依赖的例子是由巴克(Bark)带宽定义。巴克(Bark)是感知频率的单位,这在本领域是已知的。另外的例子是Mel标度(scale)和ERB标度,这在本领域也是已知的。通过考虑人对音频的感知,做出较好的决定来选择候选正弦波作为选择正弦波。在本专利技术的一个实施例中,当关于振幅的所述组合,其振幅是很重要时,选择所述候选正弦波作为选择正弦波,其重要性通过阈值处理(thresholding)在所述候选正弦波的振幅和在所述候选正弦波的本振频率带内的频率成分的加权平均振幅之间的差值来估计,其中排除在所述本振频率带内的候选正弦波的至少其中一个。通过阈值处理(thresholding)所述差值,获得适合的方法用于确定候选正弦波的峰值。在本专利技术的另一个实施例中,所述候选正弦波振幅的所述重要性由阈值处理(thresholding)以下比率来估计-在所述候选正弦波的振幅和在所述候选正弦波的本振频率带内的频率成分的加权平均振幅之间的差值,其中排除在所述本振频率带内的候选正弦波的至少其中一个;以及-在所述本振频率带内的频率成分振幅的加权偏差,其中排除在所述本振频率带内的候选正弦波的至少其中一个。对于所述偏差,例如可以使用标准偏差的定义。通过阈值处理所述比率,获得另外一个合适方法用于确定候选正弦波的峰值。在本专利技术的再一个另外的实施例中,将另一个选择程序应用于选择的正弦波上。这另一个选择程序包含以下步骤为选择正弦波的至少其中一个确定相位一致性,该一致性由一个范围所定义,该范围是在某一时刻所述选择的正弦波的及时相位由在另外的时刻确定的所述选择的正弦波的及时相位来预测的范围;当所述选择的正弦波的相位一致性高于预定的阀值时,选择所述的选择正弦波作为另一个选择正弦波。在某一时刻所述选择正弦波的及时相位由在另外的时刻确定的所述选择的正弦波的及时相位来预测,因为它的频率和在预测的时间和确定的时间之间的差值是已知的。本专利技术是基于一种洞察力当正弦波在解码器中被合成以再生编码的音频信号时,正弦波的相位将是一致的。通过选择那些正弦波用于编码其中相位一致的正弦波,做出较好的选择。所述另外的选择是基于正弦波的相位,所述相位独立于正弦波的振幅。因此,另外的选择可导致另外选择正弦波的数目相比于先前的选择程序选择的选择正弦波的数目再次减少。仅另外选择的正弦波将必须被编码。结果,另外选择程序将导致对于给定音频质量编码较少数目的正弦波,这在给定音频质量的比特率方面是有优势的。因为在基于振幅的选择程序和基于相位一致性的另外选择程序之间的独立性,所以可并行的执行两个选择程序。这两个选择程序在候选正弦波范围之外进行选择,之后其结果被组合。在本专利技术的又一个另外的实施例中,通过以下步骤来确定所述选择正弦波的相位一致性将音频信号的第三段分割为至少第一和第二部分;确定在至少第一和第二部分的所述选择正弦波的实际相位;使用在第一部分的实际相位当作输入用于预测在第二部分的实际相位;以及基于在第二部分中的实际相位和预测相位之间的预测误差确定所述选择正弦波的相位一致性。通常,第三段将等于在先前选择程序中使用的第二段,但是这也不是必需的情况。这个实施例的优点是,通过执行频率分析,像FFT程序,可以容易地确定所述选择正弦波的实际相位,因为分析需要作为输入的一部分音频信号。结合下文描述的实施例,本专利技术的上述和其他方面将显而易见,并且结合下文描述的实施例说明本专利技术的上述和其他本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种通过由多个正弦波表示至少部分音频信号来编码音频信号的方法,该方法包含以下步骤-在所述音频信号的第一段上执行分析;-基于所述分析选择候选正弦波;-为候选正弦波的至少其中一个定义在所述候选正弦波的频率周围的一个本振频率带;-在所述本振频率带内组合多个频率成分的振幅,由此排除在所述本振频率带内的候选正弦波的至少之一;以及-依赖振幅的组合,选择所述候选正弦波作为选择正弦波。2.如权利要求1所述的方法,其中依赖所述候选正弦波的频率定义在所述候选正弦波的频率周围的所述本振频率带的带宽。3.如权利要求2所述的方法,其中对所述候选正弦波的频率的所述依赖是基于人对音频的感知。4.如权利要求1所述的方法,其中当针对振幅的所述组合所述候选正弦波的振幅很重要时,选择所述候选正弦波作为选择正弦波,其重要性通过阈值处理在所述候选正弦波的振幅和在所述候选正弦波的本振频率带内的频率成分的加权平均振幅之间的差值来估计的,由此排除在所述本振频率带内的候选正弦波的至少其中一个。5.如权利要求1所述的方法,其中当针对振幅的所述组合所述候选正弦波的振幅很重要时,选择所述候选正弦波作为选择的正弦波,其重要性是由阈值处理以下比率来估计-在所述候选正弦波的振幅和在所述候选正弦波的本振频率带内的频率成分的加权平均振幅之间的差值,其中排除在所述本振频率带内的候选正弦波的至少其中一个;以及-在所述本振频率带内的频率成分振幅的加权偏差,其中排除在所述本振频率带内的候选正弦波的至少其中一个。6.如权利要求1所述的方法,其中该方法进一步包含在选择正弦波范围外的另外的选择,其包含以下步骤-为选择正弦波的至少其中一个确定相位一致性,该一致性由一个范围来定义,该范围是在某一时刻所述选择正弦波的及时相位由在另外的时刻确...

【专利技术属性】
技术研发人员:A·J·格里特斯A·C·登布林克
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1