谐波音频信号的带宽扩展制造技术

技术编号:10787785 阅读:123 留言:1更新日期:2014-12-17 15:24
一种在编解码器中支持谐波音频信号的带宽扩展(BWE)的方法和装置。编解码器的解码器部分中的方法包括:接收与频带b及频带b的多个相邻频带相关联的多个增益值。所述方法还包括:确定重建的对应频带b’是否包括谱峰。当频带b’包括谱峰时,基于接收到的多个增益值将与频带b’相关的增益值设置为第一值;否则基于接收到的多个增益值将所述增益值设置为第二值。本发明专利技术使得增益值与带宽扩展频域中的波峰位置一致。

【技术实现步骤摘要】
【国外来华专利技术】谐波音频信号的带宽扩展
本专利技术涉及音频信号的编码和解码,更具体地,涉及支持谐波音频信号的带宽扩展(BWE)。
技术介绍
基于变换的编码是当今的音频压缩/传输系统中最常用的方案。这种方案的主要步骤是首先通过合适的变换(例如DFT(离散傅立叶变换)、DCT(离散余弦变换)或MDCT(修正离散余弦变换))将信号波形的短块转换到频域。然后变换系数被量化、发送或存储且随后用于重建音频信号。这种方案对于一般的音频信号有效,但是需要足够高的比特速率以创建变换系数的足够好的表示。下面将给出这种变换域编码方案的高层概述。将要编码的波形逐块地变换到频域。用于此目的一个常用变换是所谓的修正离散余弦变换(MDCT)。将由此得到的频域变换矢量分成频谱包络(缓慢变化的能量)和频谱残留。频谱残留是使用所述频谱包络对所获得的频域矢量进行归一化而获得的。对频谱包络进行量化,将量化指标发送到解码器。接下来,使用量化的频谱包络作为比特分配算法的输入,并基于频谱包络的特性分配用于编码残留矢量的比特。作为此步骤的结果,某个数量的比特被分配给残留的不同部分(残留矢量或“子矢量”)。一些残留矢量不接收任何比特且必定是充满噪声的或带宽扩展的。通常,残留矢量的编码是两个步骤的过程;首先对矢量项的幅值进行编码,接着对非零项的符号(不要与“相位”混淆,相位是与例如傅立叶变换相关的)进行编码。将针对于残留幅值和符号的量化指标发送给解码器,在解码器中将残留和频谱包络进行组合,并最终变换回时域。电信网络的容量在持续增长。然而,尽管有增长的容量,仍然存在限制每一通信信道所需带宽的强驱动力。在移动网络中,用于每个呼叫的较小的传输带宽在移动设备和服务于该设备的基站两者中都产生较低的功率消耗。这转化成了移动运营商能量和成本的节约,同时,最终用户将体验到延长的电池寿命和增长的通话时间。此外,每一用户消耗的带宽越少,移动网络能够(并行地)服务的用户就越多。提高将被以低的或中等的比特速率传送的音频信号质量的一个方法是集中可用的比特以精确地表示音频信号中的较低频率。因此,使用BWE技术来基于仅需要少量比特的较低频率塑造较高频率。这些技术的背景是人类听觉系统的灵敏度取决于频率。具体而言,人类听觉系统(例如我们的听力)对于较高频率不太精确。在典型的频域BWE方案中,高频变换系数按照频带进行分组。针对每个频带,对增益(能量)进行计算、量化并发送(至信号的解码器)。在解码器端,用高频增益对所接收到的低频系数的翻转或平移(translate)及能量归一化版本进行缩放(scale)。这样,BWE并不完全是“瞎的”,因为至少频谱能量与目标信号的高频频带的频谱能量相似。然而,某些音频信号的BWE可能会导致音频信号包含瑕疵,这对听众带来烦恼。
技术实现思路
本文提出了支持和改善谐波音频信号的BWE的技术。根据本专利技术的第一方面,提出了一种变换音频解码器中的方法。该方法用于支持谐波音频信号的带宽扩展(BWE)。所提出的方法可以包括与频带b及频带b的多个相邻频带相关的多个增益值的接收。所提出的方法还包括确定带宽扩展频率区域的重建的对应频带b’是否包括谱峰。此外,如果该频带包括至少一个谱峰,该方法包括基于所接收到的多个增益值将与频带b’相关的增益值Gb设置为第一值。如果该频带不包括任何谱峰,该方法包括基于所接收到的多个增益值将与频带b’相关的增益值Gb设置为第二值。因此使得增益值与频谱的带宽扩展部分中的波峰位置一致。此外,该方法可能包括:接收反映原始信号的高频部分的至少一段的波峰能量与噪声底能量之间关系的参数或系数α。该方法还可以包括:基于接收到的系数α,将对应的重建的高频段的变换系数与噪声混合。从而使得可以重建/仿真原始信号的高频部分的噪声特性。根据本专利技术的第二方面,提出了一种支持谐波音频信号的带宽扩展(BWE)的变换音频解码器或编解码器。该变换音频编解码器包括适于执行上面描述的动作的功能单元。此外,提出了一种变换音频编码器或编解码器,包括适于导出或提供一个或更多个参数的功能单元,当将所述一个或更多个参数提供给变换音频解码器时,能够进行本文描述的噪声混合。根据本专利技术的第三方面,提出了一种用户终端,其包括根据本专利技术第二方面的变换音频编解码器。用户终端可能是例如移动终端、平板设备、计算机、智能电话等诸如此类的设备。附图说明现在将通过示例性的实施例并参照附图的方式更详细地描述本专利技术,在附图中:图1示出了谐波音频频谱,即谐波音频信号的频谱。这种类型的频谱通常针对于例如单一乐器声音、嗓音等。图2示出了谐波音频频谱的带宽扩展。图3a示出了用解码器接收到的对应BWE频带增益来进行缩放的BWE频谱(也在图2中示出)。频谱的BWE部分严重失真。图3b示出了本文提出的利用修正的BWE频带增益来进行缩放的BWE频谱。在这种情况下,频谱的BWE部分得到了所希望的形状。图4a和图4b是示出了根据示例性实施例的变换音频解码器中的过程中的动作的流程图。图5是示出了根据示例性实施例的变换音频解码器的框图。图6是示出了根据示例性实施例的变换音频编码器中的过程中的动作的流程图。图7是示出了根据示例性实施例的变换音频编码器的框图。图8是示出了根据示例性实施例的变换音频解码器中的装置的框图。具体实施方式如上所述,音频信号的带宽扩展与一些问题相关联。在解码器中,当翻转或平移低频带(即经编码、传输和解码的频带部分)以形成高频带时,不能确定谱峰将会与原始信号或“真实的”高频带中的谱峰结束于(endup)相同的频带中。来自低频带中的谱峰也许会结束于在原始信号没有波峰的频带中。还可能是另一种方式,即,低频信号的没有波峰的部分(在翻转或平移之后)结束于原始信号具有波峰的频带中。图1提供了谐波频谱的示例,图2提供了BWE原理的图示,接下来将对此作进一步的描述。如上描述的效果可能导致具有主要谐波内容的信号产生严重质量下降。原因是波峰和增益位置间的这种不匹配将导致不必要的波峰衰减,或者两个谱峰之间低能量频谱系数的放大。本文描述的方案涉及一种基于与波峰位置有关的信息来控制带宽扩展区域的带宽增益的新方法。此外,本文提出的BWE算法能够通过所发送的噪声混合等级来控制“谱峰噪声底比”。这导致了在扩展的高频中保留大量结构的BWE。本文描述的方案适用于谐波音频信号。图1示出了谐波音频信号的频谱(还可以表示为谐波频谱)。从图中可以看出,频谱包括波峰。这种类型的频谱典型地适用于例如单一乐器(如长笛)的声音或者嗓音等。本文将讨论谐波音频信号频谱的两个部分。一个包括较低频率的下部,其中“下”表示低于将要进行带宽扩展的部分;一个包括较高频率的上部,例如比下部高。本文使用的像“下部”或“低/较低频率”之类的表达指的是谐波音频频谱的低于BWE交叉频率的部分(参见图2)。类似地,像“上部”或者“高/较高频率”之类的表达指的是谐波音频频谱的高于BWE交叉频率的部分(参见图2)。图2示出了谐波音频信号的频谱。本文接下来讨论的两个部分,在BWE交叉频率左边的可看作下部,在BWE交叉频率右边的可看作上部。在图2中,用浅灰色示出了原始频谱,即(在编码器端看到的)原始音频信号的频谱。用深/较深灰色示出了频谱的带宽扩展部分。频谱的带宽扩展部分不由编码器进行编码,而是通过使用先前描述的接收本文档来自技高网
...
谐波音频信号的带宽扩展

【技术保护点】
一种由变换音频解码器执行的用于支持谐波音频信号的带宽扩展“BWE”的方法,所述方法包括:‑接收(401a)与频带b及频带b的多个相邻频带相关联的多个增益值;‑确定(404a)带宽扩展频率区域的重建的对应频带b’是否包括谱峰,以及:当重建的频带b’包括至少一个谱峰时:‑基于接收到的多个增益值,将与重建的频带b’相关联的增益值设置(406a:1)为第一值;以及当重建的频带b’不包括任何谱峰时:‑基于接收到的多个增益值,将与重建的频带b’相关联的增益值设置(406a:2)为第二值,其中,所述第二值小于或等于所述第一值;从而使得增益值与所述带宽扩展频率区域中的波峰位置一致。

【技术特征摘要】
【国外来华专利技术】2012.03.29 US 61/617,1751.一种由变换音频解码器执行的用于支持谐波音频信号的带宽扩展“BWE”的方法,所述方法包括:-接收(401a)与频带b及频带b的多个相邻频带相关联的多个增益值;-确定(404a)带宽扩展频率区域的重建的对应频带b’是否包括谱峰,以及:当重建的频带b’包括至少一个谱峰时:-基于接收到的多个增益值,将与重建的频带b’相关联的增益值设置(406a:1)为第一值,其中所述第一值是所述接收到的多个增益值的加权和;以及当重建的频带b’不包括任何谱峰时:-基于接收到的多个增益值,将与重建的频带b’相关联的增益值设置(406a:2)为第二值,其中,所述第二值小于或等于所述第一值;从而使得增益值与所述带宽扩展频率区域中的波峰位置一致。2.根据权利要求1所述的方法,其中,所述加权和是接收到的多个增益值的平均值。3.根据前述权利要求的任意一项所述的方法,其中,所述第二值是接收到的多个增益值中最小的增益值之一。4.根据权利要求1或2所述的方法,其中,所述第二值是接收到的多个增益值之中的最小增益值。5.根据权利要求1或2所述的方法,还包括:-接收(402b)反映原始信号的高频部分的至少一段的波峰能量与噪声底能量之间的关系的系数α;-基于接收到的系数α,将对应的重建的高频段的变换系数与噪声混合(403b),从而能够实现所述原始信号的所述高频部分的噪声特性的重建。6.一种用于支持...

【专利技术属性】
技术研发人员:塞巴斯蒂安·内斯隆德沃洛佳·格兰恰诺夫托马斯·詹森·托夫特戈德
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:瑞典;SE

网友询问留言 已有1条评论
  • 来自[北京市电信互联网数据中心] 2015年01月26日 12:33
    波音公司是全球航空航天业的领袖公司,也是世界上最大的民用和军用飞机制造商。此外,波音公司设计并制造旋翼飞机、电子和防御系统、导弹、卫星、发射装置、以及先进的信息和通讯系统。作为美国国家航空航天局的主要服务提供商,波音公司运营着航天飞机和国际空间站。波音公司还提供众多军用和民用航线支持服务,其客户分布在全球90多个国家。就销售额而言,波音公司是美国最大的出口商之一。
    0
1
相关领域技术
  • 暂无相关专利