利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信号表示型态产生扩充带宽信号的表示型态的装置、方法及计算机程序制造方法及图纸

技术编号:4889010 阅读:221 留言:0更新日期:2012-04-11 18:40
一种用于基于输入信号表示型态产生扩充带宽信号的表示型态的装置包括相位语音编码器,该相位语音编码器被配置为基于输入信号表示型态获得扩充带宽信号的第一修补的频域表示型态的值。该装置也包括值复制工具,该值复制工具被配置为复制第一修补的频域表示型态的由相位语音编码器提供的一组值,以获得第二修补的频域表示型态的一组值,其中,相比于该第一修补,该第二修补与更高的频率相关联。该装置被配置为利用第一修补的频域表示型态的值和第二修补的频域表示型态的值,来获得扩充带宽信号的表示型态。

【技术实现步骤摘要】
【国外来华专利技术】利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信 号表示型态产生扩充带宽信号的表示型态的装置、方法及计算机程序
依据本专利技术的实施例涉及一种基于输入信号表示型态产生扩充带宽信号的表示 型态的装置。依据本专利技术的其它实施例关于一种基于输入信号表示型态产生扩充带宽信 号的表示型态的方法。依据本专利技术的进一步实施例关于一种用于执行此方法的计算机程序。依据本专利技术的一些实施例关于频带复制内的新颖的修补(patching)方法。技术背景储存及传输音频信号经常受到严格的比特率限制。这些限制通常通过信号的编 码来解决。过去,只有在极低比特率可用时,编码器才被迫使急剧减小所传输的音频带 宽。现代的音频编解码器使用带宽扩充(BWE)方法能够保留可听带宽。此类方法例如 于参考文献[1]至[12]中被加以描述。这些算法依赖于高频内容(HF)的参数表示型态, 此参数表示型态是通过将解码信号的波形编码的低频部分(LF)移调(transposition)至HF 频谱区域(“修补”)并应用参数驱动后处理而产生。在现有技术中,带宽扩充方法,诸如频带复制6BR)用作在基于HFR(高频重 建)的编解码器中产生高频信号的有效方法。参考文献[1]中所描述的频带复制,简要表示为“SBR”,使用正交镜像滤波器 组(QMF)来产生HF信息。在所谓的“修补”过程的帮助下,较低QMF频带被复制至 较高(频率)位置,造成LF部分信息复制到HF部分中。产生的HF部分在采取(或调 整)频谱包络及音调(例如使用包络格式化)的参数的帮助下后向适于原始HF部分。在标准的SBR中,修补始终是由QMF域中的复制操作来完成。已得知的是, 这有时可造成听觉伪像伪像,特别是如果正弦波在LF与产生的HF部分的边界被复制于 彼此近邻内的话。因此,可以说,标准的SBR有听觉伪像的问题。再者,带宽扩充构想 的一些传统实现带来了相对高的复杂度。此外,在带宽扩充构想的一些本专利技术实现中, 对于高修补(高伸缩因数)频谱变得非常稀疏,此可导致不期望的(可听的)音频伪像。鉴于上述讨论,本专利技术的目的是创造一种基于输入信号表示型态产生扩充带宽 信号的表示型态的构想,这带来复杂度与音频品质之间的改进折衷。
技术实现思路
依据本专利技术的实施例创建一种用于基于输入信号表示型态产生扩充带宽信号的 表示型态的装置。该装置包含相位语音编码器,该相位语音编码器被配置为基于输入信 号表示型态获得该扩充带宽信号的第一修补的频域表示型态的值。该装置还包括值复制 工具,该值复制工具被配置为复制该第一修补的频域表示型态的一组值,该值由相位语 音编码器提供以获得第二修补的频谱表示的一组值。该第二修补与比第一修补更高的频6率相关联。该装置被配置为利用第一修补的该频域表示型态的值与第二修补的频域表示 型态的值,来获得扩充带宽信号的表示型态。本专利技术的关键思想是,扩充带宽信号的计算复杂度与音频品质之间的良好折衷 是由将相位语音编码器与值复制工具相组合来获得的,使得该扩充带宽信号的第一修补 由该位语音编码器来获得,以及使得扩充带宽信号的第二修补是利用该复制工具基于第 一修补来获得的。因此,第一修补的内容是输入信号(以输入信号表示型态表示)的低频部分 (LF)内容的谐波移调版本,且第二修补是(或表示)第一修补的信号内容的(非谐波)频 移版本。因此,由于对值的复制在计算上比相位语音编码器橾作简单,可以以相对低的 计算复杂度获得第二修补。再者,避免了第二修补中有大的频谱孔,因为第一修补的频 谱值通常被充分填入(即,包括非零值),使得如果第二修补仅被稀疏填入,减少或避免 在一些情况中产生的可听伪像。总之,本专利技术构想相对传统修补方法带来了显著优点,因为使用相位语音编码 器的谐波带宽扩展仅应用于获得第一修补的频域表示型态(即,频谱的较低部分)的值, 而依赖于对第一修补的频域表示型态的值的复制,来获得第一修补的频域表示型态的值 的非谐波带宽扩充用于较高频率。因此,提供扩充频率部分(为在交越频率之上的频率 部分)的较低范围(也被指定为“第一修补”)作为基本频率范围的谐波扩充(即,在输 入信号的频率范围中,覆盖低于扩充频率部分的频率的频率,例如在交越频率之下的频 率),这造成了扩充带宽信号的良好听觉印象。再者,已发现的是,使用复制工具执行的 简单产生扩充频率部分的较高范围(也被指定为“第二修补”)的频域表示型态的值并不 带来显著的听觉伪像,因为人类听力对扩充频率部分的较高范围(第二修补)的频谱细节 并不特别敏感。总之,本专利技术构想以相对小的计算复杂度带来良好的听觉印象。在优选实施例中,相位语音编码器被配置为复制与输入信号表示型态的多个指 定频率子域(frequency subranges)相关联的一组幅度值,来获得与第一修补的对应频率子 域相关联的一组幅度值,其中,输入信号表示型态的指定频率子域与第一修补的对应的 频率子域的成对覆盖(或包括)基本频率与基本频率的谐波(例如,基本频率的第一谐 波)的成对。相位语音编码器也优选地被配置为,将与输入信号表示型态的多个指定频 率子域相关联的相位值与预定因数(例如幻相乘,来获得与第一修补的对应频率子域相 关联的相位值。优选地,值复制工具被配置为复制与第一修补的多个指定频率子域相关 联的一组值,来获得与第二修补的对应频率子域相关联的一组值。值复制工具优选地被 配置为在复制中保持相位值不变。因此,相位语音编码器至少近似地执行谐波移调,而 值复制工具执行非谐波频移。频率子域例如可以是与快速傅立叶变换(或任何相当的转 换)的系数相关联的频率范围。备选地,频率子域可以是与QMF滤波器组的各个单独信 号相关联的频率范围。典型地,频率子域的宽度与中心频率相比相对小,使得频率子域 覆盖在结束频率与开始频率之间具有频率比的频带宽度,该频率比远小于2 1。换言 的,即使输入信号表示型态(例如,可以采用FFT系数的形式或QMF滤波器组信号的形 式)的频率子域与第一修补的频率子域不需要相对彼此是准确谐波的,识别输入频率表 示型态的频率子域(例如,具有频率索引k)与第一修补的对应的频率子域(例如,具有频率索引2k)之间的关联通常是可能的,使得第一修补的频率子域Ok)至少近似地表示 输入频谱表示型态的对应频率子域的谐波频率。因此,谐波移调由相位语音编码器来执行,考虑利用相位缩放处理的相位值。 相反,值复制工具仅仅执行(至少近似地)非谐波频移操作。在优选实施例中,值复制工具被配置为复制值,使得获得第一修补的值到第二 修补的值的普通频谱移动(spectral shift)(或频移)。在优选实施例中,相位语音编码器被配置为获得第一修补的频域表示型态的 值,使得第一修补的频域表示型态的值表示输入信号表示型态的基本频率范围的谐波向 上转换的版本(例如,在所谓交越频率之下的基本频率范围)。值复制工具优选地被配置 为获得第二修补的频域表示型态的值,使得第二修补的频域表示型态的值表示第一修补 的频移版本。因此,获得上面讨论的优点。特别是,实现简单,而同时获得良好听觉印 象。在优选实施例中,装置被配置为接收脉冲编码调制(PCM)的输入音频数据,来 下采样脉冲编码调制的输入音频数据,以便获得下采样的脉冲编码调制的音频数据。再 者,装置被配置为对下采样本文档来自技高网
...

【技术保护点】
一种用于基于输入信号表示型态(110;383)产生扩充带宽信号的表示型态(120;426)的装置(100;386),该装置包括:  相位语音编码器(130;406),被配置为基于输入信号表示型态获得扩充带宽信号的第一修补的频域表示型态的值(β↓[ζ]...β↓[2ζ],408);以及  值复制工具(140;410,416),被配置为复制第一修补的频域表示型态的由相位语音编码器提供的一组值(β↓[ζ]...β↓[2ζ],408),以获得第二修补的频域表示型态的一组值(β↓[2ζ]...β↓[3ζ],408),其中,相比于第一修补第二修补与更高的频率相关联;  其中,所述装置被配置为利用第一修补的频域表示型态的值和第二修补的频域表示型态的值,来获得扩充带宽信号的表示型态(120;426)。

【技术特征摘要】
【国外来华专利技术】EP 2009-12-30 09181008.5;US 2009-4-2 61/166,125;US1.一种用于基于输入信号表示型态(110 ; 383)产生扩充带宽信号的表示型态(120 ; 426)的装置(100 ; 386),该装置包括相位语音编码器(130; 406),被配置为基于输入信号表示型态获得扩充带宽信号的 第一修补的频域表示型态的值(β ζ...β2ζ,408);以及值复制工具(140; 410,416),被配置为复制第一修补的频域表示型态的由相位语 音编码器提供的一组值(β ζ...β2ζ,408),以获得第二修补的频域表示型态的一组值 (β2ζ...β3ζ,408),其中,相比于第一修补第二修补与更高的频率相关联;其中,所述装置被配置为利用第一修补的频域表示型态的值和第二修补的频域表示 型态的值,来获得扩充带宽信号的表示型态(120 ; 426)。2.如权利要求1所述的装置(100;386),其中,相位语音编码器(130; 406)被 配置为复制与输入信号表示型态(110; 383)的多个指定频率子域相关联的一组幅度值 (α ζ/2...α ζ),以获得与第一修补的对应频率子域相关联的一组幅度值(α ζ...α2ζ),其中,输入信号表示型态的指定频率子域和第一修补的对应频率子域的成对覆盖基 本频率和基本频率的谐波的成对,其中,相位语音编码器(130 ; 406)被配置为用输入信号表示型态的多个指定频率子 域相关联的相位值(φζ/2 ... φζ)与预定因数相乘,来获得与第一修补的对应频率子域相关 联的一组相位值(φζ ... φ2ζ),及其中,值复制工具(140; 410)被配置为复制与第一修补的多个指定频率子域 相关联的一组值(β ζ...β2ζ),来获得与第二修补的对应频率子域相关联的一组值 (β2ζ...β3ζ),其中,值复制工具被配置为使相位值在复制中保持不变。3.如权利要求2所述的装置(100;386),其中,值复制工具(140; 410)被配置为复 制所述值,使得获得第一修补的值(β ζ...β2ζ)与第二修补的对应值(β2ζ...β3ζ)之间的 共同频移。4.如权利要求1至3中任一项所述的装置(100;386),其中,相位语音编码器 (130 ; 410)被配置为获得第一修补的频域表示型态(132 ; 408)的值(β ζ...β2ζ),使得 第一修补的频域表示型态的值表示输入信号表示型态(110; 383)的基本频率范围的谐波 上转换版本;以及其中,值复制工具(140 ; 410)被配置为获得第二修补的频域表示型态(142 ; 412) 的值(β2ζ...β3ζ),使得第二修补的频域表示型态的值表示第一修补的音频内容的频移版 本。5.如权利要求1至4中任一项所述的装置(100;380,382,386),其中,所述装置 被配置为接收输入音频数据(322),对输入音频数据(322)进行下采样(380),以便获得下采样的音频数据(381), 对下采样的音频数据(381)进行加窗(382),以便获得加窗的输入数据(383), 将加窗的输入数据(383)转换(400)或变换到频域,以便获得频域表示型态(410)形 式的输入信号表示型态(383),计算(402,404)输入信号表示型态(383)中表示具有索引k的频率段的幅度值α 相位值<Pk,利用(130; 406)输入信号表示型态(383)中表示具有索引k的频率段的多个幅度值 ak,来获得第一修补中表示具有频率段索引Sk的频率段的幅度值Ci2k,其中,s是在1.5与2.5之间的伸缩因数,以及复制和缩放(130; 406)与输入信号表示型态(383)中具有频率段索引k的频率段相 关联的相位值tpk,来获得与第一修补中具有频率段索引2k的频率段相关联的复制和缩放后 的相位值^k=scPb复制(140 ; 410)与第一修补的频域表示型态(132 ; 408)中具有频率段索引k_i ζ的 频率段相关联的值 ^_ιζ,来获得第二修补的频域表示型态(142; 412)的值i3k,将扩充带宽信号的表示型态(426)转换(428)到时域,来获得时域表示型态(430),以及将合成窗应用(432)于所述时域表示型态。6.如权利要求1至5中任一项所述的装置(100; 386),其中,所述装置包括时域 至频域转换器(400),被配置为提供输入音频信号(322)或所述输入音频信号(322)的预 处理版本(383)的频域表示型态的值,作为输入信号表示型态(401);以及其中,所述装置包括频域至时域转换器(428),被配置为利用第一修补的频域表 示型态的值(β ζ...β2ζ,408)和第二修补的频域表示型态的值(β2ζ...β3ζ,412),来提 供扩充带宽信号的时域表示型态(430);其中,频域至时域转换器(428)被配置为,使得由频域至时域转换器(428)接收的 不同频谱值(426)的数目(N = 2048)大于由时域至频域转换器(400)提供的不同频谱值 (401)的数目(N = 512),使得频域至时域转换器(428)被配置为,...

【专利技术属性】
技术研发人员:弗雷德里克纳格尔马克斯诺伊恩多夫尼古拉斯里特尔博谢热雷米勒康特马库斯马特拉斯伯恩哈德格瑞
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1