当前位置: 首页 > 专利查询>诺基亚公司专利>正文

带宽扩展器制造技术

技术编号:8539237 阅读:157 留言:0更新日期:2013-04-05 04:44
一种用于扩展音频信号的带宽的装置,所述装置配置为:从音频信号生成激励信号,其中在所述音频信号中包括多个频率分量;从音频信号提取特征向量,其中所述特征向量包括至少一个频域分量特征和至少一个时域分量特征;从特征向量确定至少一个谱形参数,其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号;和通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于改进音频信号的质量的装置和方法。更具体地,本专利技术涉及用于 扩展音频信号的带宽的装置和方法。
技术介绍
可将例如话音或音乐的音频信号进行编码,以能够进行音频信号的高效传输或存 储。音频信号可受限制于带宽,这典型地由传输系统或存储介质的可用容量来确定。 然而,在一些实例中,可期望按照比原始编码音频信号的带宽更宽的带宽来观察解码后的 音频信号。在这些实例中,可在解码器处实施人工带宽扩展,从而可通过使用从解码后的音 频信号本身单独确定的信息来扩展解码后的音频信号的带宽。在移动电信领域中可存在一个人工带宽扩展的应用的这种实例。典型地,在例如 全球移动通信系统(GSM)的移动通信系统中,话音信号可受限于小于4kHz的带宽,换句话 说,受限于窄带话音信号。然而,自然发生的话音可包含高达IOkHz的主要频率分量。传统 的更高频率可有助于话音信号的总体质量和清晰度,与等同的窄带信号相比导致更清脆和更响亮的声音。现有的通过人工带宽扩展来改进窄带话音的质量和清晰度的方法可部署生成额 外高频率分量的码书。所述码书可包括不同频谱特性的频率向量,所有频率向量覆盖感兴 趣的频率的范围。可通过选择最佳向量并对其增加来自接收的解码后信号的频谱分量,基 于逐个帧来扩展频率范围。此外,人工带宽扩展方法可实施上采样技术,按更高频率分量建立接收的信号的 别名副本。然后,可调节别名的频率分量的大小或能量等级,以建立话音信号的代表性更高 频率。然而,现有的人工带宽扩展的方法可遭遇不佳的质量和低效率。例如,人工带宽扩展的一些方法可采用一种按进入话音帧的语音内容将他们归类 以确定上带封包。然后,所述封包可用于将低频率的频混所建立的频率频谱进行定形。然而,使用这个方法生成的上带不能始终听起来自然。这可部分地导致在不同因 素之间的转换在话音信号中是自然平滑的事实。然而,使用将因素归类的系统可具有在判 断边界引入不连续性的结果。其他因素也可倾向于使用上述人工带宽扩展方法(例如进入话音帧的不正确归类 和高带频谱形状的不精确估计)来进行非自然发音。
技术实现思路
本专利技术考虑到现有人工带宽扩展方案可导致扩展的音频信号的总体观察的自然 性降低而做出。这个降低可特别地对于私密语音的总体观察是普遍的。实施例旨在解决以上问题。根据一些实施例的第一方面,提供一种方法,包括从音频信号生成激励信号,其 中在所述音频信号中包括多个频率分量;从音频信号提取特征向量,其中所述特征向量包 括至少一个频域分量特征和至少一个时域分量特征;从特征向量确定至少一个谱形参数, 其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号;和 通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述 子带信号。根据实施例,该方法在生成激励信号时可包括通过用逆线性预测滤波器过滤所 述音频信号来生成剩余信号;基于线性预测滤波器用包括自回归移动平均滤波器的后滤波 器阶段来过滤剩余信号;和通过上采样和频谱交叠来自后滤波器阶段的输出来生成激励信号。所述后滤波器阶段还包括频谱倾斜滤波器和谐波滤波器。子带信号的频率分量根据包括多个重叠带的心理声学标准来分布,以及滤波器组 的频率特性对应于子带信号的频率分量的分布。重叠带根据梅尔标度来分布,以及其中所述子带信号使用三角形遮蔽函数来遮 蔽。或者,重叠带根据梅尔标度来分布,以及其中所述子带信号使用梯形遮蔽函数来 遮蔽。从特征向量确定至少一个谱形参数包括使用神经网络来从特征向量确定至少一 个谱形参数,其中从音频信号提取的特征向量形成对于神经网络的输入目标向量,以及其 中对神经网络进行训练以提供用于输入目标向量的子带谱形参数。所述谱形参数是子带能量等级值。所述谱形参数是基于子带能量等级值的子带增益因子。当音频信号的功率接近音频信号中噪音等级的估计时,使所述子带能量等级值衰 减。所述特征向量的至少一个频域分量特征包括以下至少一个音频信号的多个能量 等级的组,其中所述多个能量等级的每个对应于音频信号的重叠带的能量;表示音频信号 的频域频谱的质心的值;和表示所述频域频谱的平整度的值。所述特征向量的至少时域分量特征包括以下至少一个基于音频信号中导致音频 信号的波形方向改变的点处的梯度的总和的梯度指数;音频信号的帧的能量与音频信号的 先前帧的能量的比;和指示音频信号的帧是归类为活动还是不活动的语音活动性检测器。该方法还包括将子带信号与音频信号组合,以提供带宽扩展的音频信号。根据一些实施例的第二方面,提供一种装置,包括至少一个处理器和含有计算机 代码的至少一个存储器,所述至少一个存储器和所述计算机代码配置为通过所述至少一个 处理器使得所述装置至少执行从音频信号生成激励信号,其中在所述音频信号中包括多 个频率分量;从音频信号提取特征向量,其中所述特征向量包括至少一个频域分量特征和 至少一个时域分量特征;从特征向量确定至少一个谱形参数,其中所述至少一个谱形参数 对应于包括属于其他多个频率分量的频率分量的子带信号;和通过经由滤波器组过滤激励 信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。根据一个实施例,该装置当所述至少一个存储器和所述计算机代码配置为使得所述装置至少执行生成激励信号时,还配置为执行通过用逆线性预测滤波器过滤所述音频 信号来生成剩余信号;基于线性预测滤波器用包括自回归移动平均滤波器的后滤波器阶段 来过滤剩余信号;和通过上采样和频谱交叠来自后滤波器阶段的输出来生成激励信号。所述后滤波器阶段还包括频谱倾斜滤波器和谐波滤波器。子带信号的频率分量根据包括多个重叠带的心理声学标准来分布,以及滤波器组 的频率特性对应于子带信号的频率分量的分布。重叠带根据梅尔标度来分布,以及其中所述子带信号使用三角形遮蔽函数来遮 蔽。或者,重叠带根据梅尔标度来分布,以及其中所述子带信号使用梯形遮蔽函数来 遮蔽。所述至少一个存储器和所述计算机代码配置为通过所述至少一个处理器使得所 述装置至少执行从特征向量确定至少一个谱形参数,还配置为执行使用神经网络来从特 征向量确定至少一个谱形参数,其中从音频信号提取的特征向量形成对于神经网络的输入 目标向量,以及其中对神经网络进行训练以提供用于输入目标向量的子带谱形参数。所述谱形参数是子带能量等级值。所述谱形参数是基于子带能量等级值的子带增益因子。当音频信号的功率接近音频信号中噪音等级的估计时,使所述子带能量等级值衰 减。所述特征向量的至少一个频域分量特征包括以下至少一个音频信号的多个能量 等级的组,其中所述多个能量等级的每个对应于音频信号的重叠带的能量;表示音频信号 的频域频谱的质心的值;和表示所述频域频谱的平整度的值。所述特征向量的至少时域分量特征包括以下至少一个基于音频信号中导致音频 信号的波形方向改变的点处的梯度的总和的梯度指数;音频信号的帧的能量与音频信号的 先前帧的能量的比;和指示音频信号的帧是归类为活动还是不活动的语音活动性检测器。所述至少一个存储器和所述计算机代码还配置为执行将子带信号与音频信号组 合,以提供带宽扩展的音频信号。根据一些实施例的第三方面,提供一种计算机程序产品,其中软件代码存储于计 算机可读介质中,其中所述代码在由处理器执行时实现以下步骤从音频信号生成激励信 号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括 从音频信号生成激励信号,其中在所述音频信号中包括多个频率分量; 从音频信号提取特征向量,其中所述特征向量包括至少一个频域分量特征和至少一个时域分量特征; 从特征向量确定至少一个谱形参数,其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号;和 通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。2.如权利要求1所述的方法,其中生成激励信号包括 通过用逆线性预测滤波器过滤所述音频信号来生成剩余信号; 基于线性预测滤波器用包括自回归移动平均滤波器的后滤波器阶段来过滤剩余信号;和 通过上采样和频谱交叠来自后滤波器阶段的输出来生成激励信号。3.如权利要求2所述的方法,其中所述后滤波器阶段还包括频谱倾斜滤波器和谐波滤波器。4.如权利要求1至3所述的方法,其中子带信号的频率分量根据包括多个重叠带的心理声学标准来分布,以及滤波器组的频率特性对应于子带信号的频率分量的分布。5.如权利要求4所述的分发,其中重叠带根据梅尔标度来分布,以及其中所述子带信号使用以下至少一个来遮蔽 三角形遮蔽函数;和 梯形遮蔽函数。6.如权利要求1至5所述的方法,其中从特征向量确定至少一个谱形参数包括 使用神经网络来从特征向量确定至少一个谱形参数,其中从音频信号提取的特征向量形成对于神经网络的输入目标向量,以及其中对神经网络进行训练以提供用于输入目标向量的子带谱形参数。7.如权利要求1至6所述的方法,其中所述谱形参数是子带能量等级值。8.如权利要求7所述的方法,其中所述谱形参数是基于子带能量等级值的子带增益因子。9.如权利要求7和8所述的方法,其中当音频信号的功率接近音频信号中噪音等级的估计时,使所述子带能量等级值衰减。10.如权利要求1至9所述的方法,其中所述特征向量的至少一个频域分量特征包括以下至少一个 音频信号的多个能量等级的组,其中所述多个能量等级的每个对应于音频信号的重叠带的能量; 表示音频信号的频域频谱的质心的值;和 表示所述频域频谱的平整度的值。11.如权利要求1至10所述的方法,其中所述特征向量的至少时域分量特征包括以下至少一个 基于音频信号中导致音频信号的波形方向改变的点处的梯度的总和的梯度指数;音频信号的帧的能量与音频信号的先前帧的能量的比;和 指示音频信号的帧是归类为活动还是不活动的语音活动性检测器。12.如权利要求1至11中任一项所述的方法,还包括 将子带信号与音频信号组合,以提供带宽扩展的音频信号。13.一种装置,包括至少一个处理器和含有计算机代码的至少一个存储器,所述至少一个存储器和所述计算机代码配置为通过所述至少一个处理器使得所述装置至少执行 从音频信号生成激励信号,其中在所述音频信号中包括多个频率分量; 从音频信号提取特征向量,其中所述特征向量包括至少一个频域分量特征和至少一个时域分量特征; 从特征向量确定至少一个谱形参数,其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号;和 通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。14.如权利要求13所述的装置,其中所述至少一个存储器和所述计算机代码配置为使得所述装置至少执行生成激励信号,还配置为执行 通过用逆线性预测滤波器过滤所述音频信号来生成剩余信号; 基于线性预测滤波器用包括自回归移动平均滤波器的后滤波器阶段来过滤剩余信号;和 通过上采样和频谱交叠来自后滤波器阶段的输出来生成激励信号。15.如权利要求13所述的装置,其中所述后滤波器阶段还包括频谱倾斜滤波器和谐波滤波器。16.如权利要求13至15所述的装置,其中子带信号的频率分量根据包括多个重叠带的心理声学标准来分布,以及滤波器组的频率特性对应于子带信号的频率分量的分布。17.如权利要求16所述的装置,其中重叠带根据梅尔标度来分布,以及其中所述子带信号使用以下至少一个来遮蔽三角形遮蔽函数;和梯形遮蔽函数。18.如权利要求13至17所述的装置,其中所述至少一个存储器和所述计算机代码配置为通过所述至少一个处理器使得所述装置至少执行从特征向量确定至少一个谱形参数,还配置为执行 使用神经网络来从特征向量确定...

【专利技术属性】
技术研发人员:V·M·米吕拉L·拉克索宁H·J·普拉卡P·I·阿尔库
申请(专利权)人:诺基亚公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1