带宽扩展器制造技术

技术编号：8539237 阅读：157 留言：0更新日期：2013-04-05 04:44

一种用于扩展音频信号的带宽的装置，所述装置配置为：从音频信号生成激励信号，其中在所述音频信号中包括多个频率分量；从音频信号提取特征向量，其中所述特征向量包括至少一个频域分量特征和至少一个时域分量特征；从特征向量确定至少一个谱形参数，其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号；和通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于改进音频信号的质量的装置和方法。更具体地，本专利技术涉及用于扩展音频信号的带宽的装置和方法。
技术介绍
可将例如话音或音乐的音频信号进行编码，以能够进行音频信号的高效传输或存储。音频信号可受限制于带宽，这典型地由传输系统或存储介质的可用容量来确定。然而，在一些实例中，可期望按照比原始编码音频信号的带宽更宽的带宽来观察解码后的音频信号。在这些实例中，可在解码器处实施人工带宽扩展，从而可通过使用从解码后的音频信号本身单独确定的信息来扩展解码后的音频信号的带宽。在移动电信领域中可存在一个人工带宽扩展的应用的这种实例。典型地，在例如全球移动通信系统(GSM)的移动通信系统中，话音信号可受限于小于4kHz的带宽，换句话说，受限于窄带话音信号。然而，自然发生的话音可包含高达IOkHz的主要频率分量。传统的更高频率可有助于话音信号的总体质量和清晰度，与等同的窄带信号相比导致更清脆和更响亮的声音。现有的通过人工带宽扩展来改进窄带话音的质量和清晰度的方法可部署生成额外高频率分量的码书。所述码书可包括不同频谱特性的频率向量，所有频率向量覆盖感兴趣的频率的范围。可通过选择最佳向量并对其增加来自接收的解码后信号的频谱分量，基于逐个帧来扩展频率范围。此外，人工带宽扩展方法可实施上采样技术，按更高频率分量建立接收的信号的别名副本。然后，可调节别名的频率分量的大小或能量等级，以建立话音信号的代表性更高频率。然而，现有的人工带宽扩展的方法可遭遇不佳的质量和低效率。例如，人工带宽扩展的一些方法可采用一种按进入话音帧的语音内容将他们归类以确定上...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括从音频信号生成激励信号，其中在所述音频信号中包括多个频率分量；从音频信号提取特征向量，其中所述特征向量包括至少一个频域分量特征和至少一个时域分量特征；从特征向量确定至少一个谱形参数，其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号；和通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。2.如权利要求1所述的方法，其中生成激励信号包括通过用逆线性预测滤波器过滤所述音频信号来生成剩余信号；基于线性预测滤波器用包括自回归移动平均滤波器的后滤波器阶段来过滤剩余信号；和通过上采样和频谱交叠来自后滤波器阶段的输出来生成激励信号。3.如权利要求2所述的方法，其中所述后滤波器阶段还包括频谱倾斜滤波器和谐波滤波器。4.如权利要求1至3所述的方法，其中子带信号的频率分量根据包括多个重叠带的心理声学标准来分布，以及滤波器组的频率特性对应于子带信号的频率分量的分布。5.如权利要求4所述的分发，其中重叠带根据梅尔标度来分布，以及其中所述子带信号使用以下至少一个来遮蔽三角形遮蔽函数；和梯形遮蔽函数。6.如权利要求1至5所述的方法，其中从特征向量确定至少一个谱形参数包括使用神经网络来从特征向量确定至少一个谱形参数，其中从音频信号提取的特征向量形成对于神经网络的输入目标向量，以及其中对神经网络进行训练以提供用于输入目标向量的子带谱形参数。7.如权利要求1至6所述的方法，其中所述谱形参数是子带能量等级值。8.如权利要求7所述的方法，其中所述谱形参数是基于子带能量等级值的子带增益因子。9.如权利要求7和8所述的方法，其中当音频信号的功率接近音频信号中噪音等级的估计时，使所述子带能量等级值衰减。10.如权利要求1至9所述的方法，其中所述特征向量的至少一个频域分量特征包括以下至少一个音频信号的多个能量等级的组，其中所述多个能量等级的每个对应于音频信号的重叠带的能量；表示音频信号的频域频谱的质心的值；和表示所述频域频谱的平整度的值。11.如权利要求1至10所述的方法，其中所述特征向量的至少时域分量特征包括以下至少一个基于音频信号中导致音频信号的波形方向改变的点处的梯度的总和的梯度指数；音频信号的帧的能量与音频信号的先前帧的能量的比；和指示音频信号的帧是归类为活动还是不活动的语音活动性检测器。12.如权利要求1至11中任一项所述的方法,还包括将子带信号与音频信号组合，以提供带宽扩展的音频信号。13.一种装置，包括至少一个处理器和含有计算机代码的至少一个存储器，所述至少一个存储器和所述计算机代码配置为通过所述至少一个处理器使得所述装置至少执行从音频信号生成激励信号，其中在所述音频信号中包括多个频率分量；从音频信号提取特征向量，其中所述特征向量包括至少一个频域分量特征和至少一个时域分量特征；从特征向量确定至少一个谱形参数，其中所述至少一个谱形参数对应于包括属于其他多个频率分量的频率分量的子带信号；和通过经由滤波器组过滤激励信号和用至少一个谱形参数加权过滤的激励信号来生成所述子带信号。14.如权利要求13所述的装置，其中所述至少一个存储器和所述计算机代码配置为使得所述装置至少执行生成激励信号，还配置为执行通过用逆线性预测滤波器过滤所述音频信号来生成剩余信号；基于线性预测滤波器用包括自回归移动平均滤波器的后滤波器阶段来过滤剩余信号；和通过上采样和频谱交叠来自后滤波器阶段的输出来生成激励信号。15.如权利要求13所述的装置，其中所述后滤波器阶段还包括频谱倾斜滤波器和谐波滤波器。16.如权利要求13至15所述的装置，其中子带信号的频率分量根据包括多个重叠带的心理声学标准来分布，以及滤波器组的频率特性对应于子带信号的频率分量的分布。17.如权利要求16所述的装置，其中重叠带根据梅尔标度来分布，以及其中所述子带信号使用以下至少一个来遮蔽三角形遮蔽函数；和梯形遮蔽函数。18.如权利要求13至17所述的装置，其中所述至少一个存储器和所述计算机代码配置为通过所述至少一个处理器使得所述装置至少执行从特征向量确定至少一个谱形参数，还配置为执行使用神经网络来从特征向量确定...

【专利技术属性】
技术研发人员：V·M·米吕拉，L·拉克索宁，H·J·普拉卡，P·I·阿尔库，
申请(专利权)人：诺基亚公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人