叉积增强的谐波转置制造技术

技术编号:9766679 阅读:142 留言:0更新日期:2014-03-15 14:34
本发明专利技术涉及使用用于高频重建(HFR)的谐波转置方法的音频编码系统。描述了一种用于从信号的低频分量生成信号的高频分量的系统和方法。该系统包括提供信号的低频分量的多个分析子带信号的分析滤波器组。该系统还包括非线性处理单元,其通过改变所述多个分析子带信号中的第一分析子带信号和第二分析子带信号的相位并且通过混合相位改变的分析子带信号而生成具有合成频率的合成子带信号。最后,该系统包括用于从合成子带信号生成信号的高频分量的合成滤波器组。

【技术实现步骤摘要】
叉积增强的谐波转置本专利技术申请是国际申请日为2010年1月15日、国际申请号为“PCT/EP2010/050483”、国家申请号为“201080004764.8”、专利技术名称为“叉积增强的谐波转置”的专利技术专利申请的分案申请。
本专利技术涉及使用用于高频重建(HFR)的谐波转置(transposition)方法的音频编码系统。
技术介绍
HFR技术(例如频谱复制(SBR)技术)使得显著改进传统感知音频编解码器的编码效率。与MPEG-4高级音频编码(AAC)组合,它形成非常有效的音频编解码器,已将其用在XM卫星无线电系统和全球数字无线电系统(DigitalRadioMondiale)中。AAC和SBR的组合被称为aacPlus。这是MPEG-4标准的部分,其中,它被称作高效AAC规格(HighEfficiencyAACProfile)。通常,HFR技术可以通过后向和前向兼容的方式与任何感知音频编解码器组合,因此提供使已经建立的广播系统(类似于EurekaDAB系统中使用的MPEG层-2)升级的可能性。HFR转置方法也可以与语音编解码器组合以允许超低比特率的宽带语音。HRF之后的基本构思是观测到通常存在信号的高频率范围的特性与同一信号的低频率范围的特性之间的强相关性。因此,通过从低频率范围到高频率范围的信号转置可以实现对于信号的原始输入高频率范围的表示的良好近似。WO98/57436中建立了这种转置的构思,以作为用于从音频信号的较低频带重建高频带的方法。通过在音频编码和/或语音编码中使用该构思可以获得比特率的大量节省。下文中,将提到音频编码,但应注意描述的方法和系统同样可应用于语音编码并且可应用在统一的语音和音频编码(USAC)中。在基于HFR的音频编码系统中,低带宽信号被提供给核心波形编码器,使用通常以非常低的比特率被编码的并且描述目标谱形状的附加边信息和低带宽信号的转置在解码器侧再生成较高频率。对于低比特率,在核心编码的信号的带宽窄的情况下,重建具有感知愉悦特性的高带(即音频信号的高频率范围)变得愈加重要。以下提及谐波频率重建方法的两种变型,一个被称为谐波转置,而另一个被称为单边带调制。WO98/57436中定义的谐波转置的原理是具有频率ω的正弦波映射成具有频率Tω的正弦波,其中,T>1是定义转置阶的整数。谐波转置的有吸引力的特征在于,其通过等于转置阶的因子(即通过等于T的因子)将源频率范围扩展到目标频率范围。对于复杂音乐材料,谐波转置良好地执行。此外,谐波转置呈现低交叉频率,即,从低于交叉频率的相对小的低频率范围可以生成高于交叉频率的大的高频率范围。与谐波转置对照,基于单边带调制(SSB)的HFR将具有频率ω的正弦波映射成具有频率ω+Δω的正弦波,其中,Δω是固定频率偏移。已经观测到若给定具有低带宽的核心信号,则由于SSB转置会导致失谐振铃假声(ringingartifact)。还应注意,对于低交叉频率(即小的源频率范围),谐波转置将需要比基于SSB的转置更少数目的补丁块(patch),以填充期望的目标频率范围。以举例的方式,如果应填充(ω,4ω]的高频率范围,则使用转置阶T=4,谐波转置可以从的低频率范围填充该频率范围。另一方面,使用相同低频率范围的基于SSB的转置必须使用的频率偏移,并且需要重复处理四次以填充高频率范围(ω,4ω]。另一方面,如已经在WO02/052545A1中指出的那样,谐波转置对于具有显著周期结构的信号具有缺点。这些信号是具有频率Ω、2Ω、3Ω、…的谐波相关的正弦波的叠加,其中,Ω是基频。在阶T的谐波转置时,输出正弦波具有频率TΩ、2TΩ、3TΩ、…,在T>1的情况下,其仅是期望的全谐波序列的严格子集。关于所得音频质量,通常将感知与转置的基频TΩ对应的“鬼影(ghost)”音调。一般,谐波转置产生编码的和解码的音频信号的“金属”声音特性。通过将若干转置阶T=2、3、…、Tmax加到HFR可以将该情况减缓到一定程度,但如果要避免多数谱隙,则该方法在计算上是复杂的。WO02/052545A1中已经提出了当使用谐波转置时用于避免“鬼影”音调出现的替选解决方案。该解决方案在于使用两种类型的转置,即典型谐波转置和特殊“脉冲转置”。描述的方法教导对于被检测为具有类似脉冲串(pulse-train)特性的周期的音频信号的部分切换到专用“脉冲转置”。该方法的问题在于,与基于高分辨率滤波器组的谐波转置相比,对复杂音乐材料应用“脉冲转置”一般使得质量下降。因此,必须相当谨慎地调谐检测机制,以使得对于复杂材料不使用脉冲转置。不可避免地,单音调乐器和声音有时将被分类为复杂信号,由此调用谐波转置并且因此丢失谐波。此外,如果在单音调信号或具有较弱复杂背景中的主要音调的信号的中间发生切换,则在具有非常不同的谱填充特性的这两种转换方法之间切换自身将生成可听见的假声。
技术实现思路
本专利技术提供一种用于完成由于周期信号的谐波转置而产生的谐波序列的方法和系统。频域转置包括步骤:将来自分析滤波器组的非线性改变的子带信号映射到合成滤波器组的选择的子带。非线性改变包括相位改变或相位旋转,其是在幅度调整之后可以在复滤波器组域中通过幂法则获得的。而现有技术转置一次分开地改变一个分析子带,本专利技术教导将用于每个合成子带的至少两个不同分析子带的非线性组合相加。待混合的分析子带之间的间隔可以与待转置的信号的主分量的基频有关。在多数常见形式中,本专利技术的数学描述是使用一组频率分量ω1、ω2、…、ωk来创建新的频率分量ω=T1ω1+T2ω2+...+TKωK,其中,系数T1、T2、…、Tk是整数转置阶,它们的和是总转置阶T=T1+T2+…+Tk。通过用因子T1、T2、…、Tk改变K个适当选取的子带信号的相位并且将结果重组为具有等于改变的相位之和的相位的信号,来获得这种效果。重要的是,注意,由于各转置阶是整数,因此准确定义了所有这些相位操作并且它们是不模糊的,并且只要总转置阶满足T≥1,这些整数中的一些甚至可以是负数。现有技术方法与情况K=1对应,本专利技术教导使用K≥2。描述的文本主要处理情况K=2,T≥2,由于其足以解决手上的多数具体问题。但应注意,认为情况K>2同样被本文献公开和涵盖。本专利技术使用来自较高数目的较低频带分析信道(即较高数目的分析子带信号)的信息,以将来自分析滤波器组的非线性改变的子带信号映射到合成滤波器组的选择的子带。转置不仅是一次分开地修改一个子带,而且其将用于每个合成子带的至少两个不同分析子带的非线性组合相加。如已经提到的,阶T的谐波转置被设计为将频率ω的正弦波映射为具有频率Tω的正弦波,其中,T>1。根据本专利技术,具有音调(pitch)参数Ω和索引0<r<T的所谓的叉积增强被设计为将具有频率(ω,ω+Ω)的正弦波的对映射为具有频率(T-r)ω+r(ω+Ω)=Tω+rΩ的正弦波。应理解,对于这些叉积转置,通过利用范围从1到T-1的索引r将音调参数Ω的所有叉积加到阶T的谐波转置上,将生成具有周期Ω的周期信号的所有部分频率。根据本专利技术的一方面,描述了一种用于从信号的低频分量生成该信号的高频分量的系统和方法。应注意,在系统的背景中以下描述的特征同样可应用于本专利技术的方法。例如,信号可以是音频和本文档来自技高网
...
叉积增强的谐波转置

【技术保护点】
一种用于对音频信号进行编码的系统,包括:?分离单元,其用于将所述音频信号分离成低频分量和高频分量;?核心编码器,其用于对所述低频分量进行编码;?频率确定单元,其用于确定所述音频信号的基频Ω;以及?参数编码器,其用于对与所述基频Ω相关联的信息进行编码,其中,与所述基频Ω相关联的信息被用于再生所述音频信号的高频分量。

【技术特征摘要】
2009.01.16 US 61/145,2231.一种用于对音频信号进行编码的系统,包括:-分离单元,其用于将所述音频信号分离成低频分量和高频分量;-核心编码器,其用于对包括多个分析子带信号的所述低频分量进行编码;-频率确定单元,其用于确定所述音频信号的基频Ω;以及-信息编码器,其用于对与所述基频Ω相关联的信息进行编码,其中,所述信息表示所述多个分析子带信号中的用于通过转置生成所述音频信号的所述高频分量的两个分析子带信号。2.如权利要求1所述的系统,还包括:-包络确定单元,其用于确定所述高频分量的谱包络;以及-包络编码器,其用于对所述谱包络进行编码。3.一种用于对音频信号进行解码的系统,所述系统包括:-核心解码器(101),其用于对所述音频信号的低频分量进行解码;-分析滤波器组(301),其用于提供所述音频信号的低频分量的多个分析子带信号;-子带选择接收单元,其用于接收允许从所述多个分析子带信号选择第一分析子带信号(801)和第二分析子带信号(802)的信息,从所述第一分析子带信号(801)和所述第二分析子带信号(802)通过改变所述第一分析子带信号和所述第二分析子带信号的相位并且混合相位改变的分析子带信号而生成合成子带信号(803);其中,所述信息与所述音频信号的基频Ω相关联;以及-合成滤波器组(303),其用于从所述合成子带信号生成所述音频信号的高频分量。4.如权利要求3所述的系统,其中,-所述分析滤波器组(301)具有N个分析子带,所述N个分析子带具有基本恒定子带间隔Δω;-分析子带与分析子带索引n相关联,其中,n∈(1,…,N);-所述合成滤波器组(303)具有合成子带;-所述合成子带与合成子带索引n相关联;以及-具有索引n的所述合成子带和所述分析子带均包括通过因子T而彼此有关的频率范围。5.如权利要求4所述的系统,其中,-所述合成子带信号(803)与具有索引n的所述合成子带相关联;-所述第一分析子带信号(801)与具有索引n-p1的分析子带相关联;-所述第二分析子带信号(802)与具有索引n+p2的分析子带相关联;以及-所述系统还包括用于选择索引偏移p1和p2的索引选择单元。6.如权利要求5所述的系统,其中,所述索引选择单元能够操作以基于所述音频信号的基频Ω选择所述索引偏移p1和p2。7.如权利要求6所述的系统,其中,-所述索引选择单元能够操作以选择所述索引偏移p1和p2,使得:-所述索引偏移的和p1+p2近似于分数Ω/Δω;以及-所述分数p1/p2近似于r/(T-r),其中1≤r<T。8.如权利要求6所述的系统,其中,-所述索引选择单元能够操作以选择所述索引偏移p1和p2,使得:-所述索引偏移的和p1+p2近似于分数Ω/Δω;以及-所述分数p1/p2等于r/(T-r),其中1≤r<T。9.如权利要求7或8所述的系统,其中T=2且r=1。10.如权利要求3所述的系统,还包括:-分析窗(2001),其在预定义时间k周围隔离预定义时间间隔的低频分量;以及-合成窗(2201),其在预定义时间k周围隔离预定义时间间隔的高频分量。11.如权利要求10所述的系统,其中,-所述合成窗(2201)是所述分析窗(2001)的...

【专利技术属性】
技术研发人员:拉尔斯·维尔默斯佩尔·赫德林
申请(专利权)人:杜比国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1