一种音频带宽扩展的方法及扩展装置制造方法及图纸

技术编号:16328929 阅读:79 留言:0更新日期:2017-09-29 20:07
本发明专利技术公开了一种音频带宽扩展的方法及扩展装置,方法包括检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。扩展装置包括信号类型检测模块、语音信号带宽扩展模块和音乐信号带宽扩展模块。本发明专利技术充分考虑到了不同信号类型的特性,从信号类型的角度着手,以提高音频恢复质量,能够更准确的进行高频重建。

【技术实现步骤摘要】
一种音频带宽扩展的方法及扩展装置
本专利技术涉及音频编码领域,具体是一种音频带宽扩展的方法及扩展装置。
技术介绍
心理声学研究表明人们对于音频不同频率下的敏感性具有差异,对低频更敏感而对高频不敏感,因此在音频编码中常常不对高频进行编码以节省码率。而高频部分的完全缺失又会带来听感上的不适,因此往往采用带宽扩展的方式恢复高频。基于LPC的带宽扩展技术是目前低码率、低复杂度的代表技术。它通过提取表征高频包络的LPC参数,子带能量,然后对得到高频的低频信号进行调整,从而完成高频重建。我国自主研发的移动音频编解码器AVS-P10也采用了这种带宽扩展方法。在对现有方法的研究和实践中,存在以下弊端:算法中对于信号的高频部分统一通过基于语音产生原理的LPC的带宽扩展算法进行编码,通过将低频信号的残差信号作为高频激励并结合线性预测编码技术实现高频的重建。从原理上来看,AVS-P10带宽扩展技术采用的一种典型的参数编码技术。其对语音信号的高频重建具有良好的效果,而对音乐信号的高频重建效果不佳,不能根据信号的类型与特征做自适应的调整。
技术实现思路
本专利技术的目的在于提供一种音频带宽扩展的方法及扩展装置,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种音频带宽扩展的方法,包括如下步骤:步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;步骤2,同时基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。作为本专利技术进一步方案:所述对于语音信号,采用基于LPC的带宽扩展方法具体为:(1)提取低频残差信号作为激励信号;低带原始信号经过低带线性预测逆滤波器滤波后得到低带残差信号作为激励信号,低带的线性预测系数每帧更新一次;每一个1024样点超帧的低带激励信号通过长度为288样点,重叠区域为32样点的余弦窗分割为四个长度288样点的帧(2)提取高频LPC系数,表征高频包络信息;对每一帧高频原始信号进行一次八阶线性预测分析,得到一组八阶的线性预测编码系数,并转换为导抗频谱对系数,导抗频谱对系数进一步变换为导抗谱频率系数;量化后的导抗谱频率系数变换为量化后线性预测系数,并以此产生高频合成滤波器;假设高频合成滤波器288点的冲击响应为,用288点的快速傅里叶变换将变换到频域,以此表示原始高频信号的频谱包络;(3)利用高频包络信息和低频残差信号得到准高频信号;每一帧的低带激励信号和高带合成滤波器的冲击响应用288点的FFT变换到频域;高带合成滤波器冲击响应的288点FFT系数用其中的最大值归一化;将低带激励信号的FFT系数乘以归一化的高带合成滤波器的冲击响应FFT系数就可以得到频域的基础信号;(4)提取高低频对应频带之间的增益信息;计算288样点帧准高频信号和原始高频信号对应子带间的能量增益,(5)利用高频信号的谱包络信息及增益信息调整原始低频信号生成的高频激励信号来重建高频信号。作为本专利技术进一步方案:所述对于音乐信号,采用基于高低频信号相关性的频带复制带宽扩展方法具体为:(1)对原始高低频信号进行加窗并变换到频域;利用重叠区域为32样点的余弦窗对每一个256样点帧的原始高低频信号进行加窗,得到288样点帧;对加窗后的原始信号和高频信号通过FFT变换到频域;(2)计算高低频信号对应频带之间的相关性,若相关性较高,则将低频信号复制到高频频段用于高频重建;若高低频信号之间的相关性较低,则将白噪声信号填充到高频频段用于高频重建;针对每一个288样点帧,计算对应高低频信号之间的相关性,从而确定用低频信号还是白噪声信号来重建;(3)提取能量参数;若采用低频信号来复制高频信号,需提取对应低频子带的能量增益;若采用白噪声重建高频,则需提取高频子带平均能量;(4)利用能量参数调整复制的低频信号或白噪声信号完成高频重建。一种所述音频带宽扩展的扩展装置,包括信号类型检测模块、语音信号带宽扩展模块和音乐信号带宽扩展模块,所述信号类型检测模块,用于检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;所述语音信号带宽扩展模块,用于完成语音帧信号的高频重建,所述音乐信号带宽扩展模块,用于完成音乐帧信号的高频重建。作为本专利技术进一步方案:所述语音信号带宽扩展模块包括:低频残差提取模块,提取低频残差信号作为激励信号,低带原始信号经过低带线性预测逆滤波器滤波后得到低带残差信号作为激励信号,低带的线性预测系数每帧更新一次;每一个1024样点超帧的低带激励信号通过长度为288样点,重叠区域为32样点的余弦窗分割为四个长度288样点的帧;包络信息提取模块,提取高频LPC系数,表征高频包络信息,提取高频LPC系数,表征高频包络信息,具体为,对每一帧高频原始信号进行一次八阶线性预测分析,得到一组八阶的线性预测编码系数,并转换为导抗频谱对系数,导抗频谱对系数进一步变换为导抗谱频率系数;量化后的ISF系数变换为量化后线性预测系数,并以此产生高频合成滤波器;假设高频合成滤波器288点的冲击响应为,用288点的快速傅里叶变换将变换到频域,以此表示原始高频信号的频谱包络;增益提取模块,提取高频与准高频信号之间的对应频带之间的增益信息,计算288样点帧准高频信号和原对应子带间的能量增益,并进行编码传递到解码端;重建模块,用于利用增益信息调整调整准高频信号完成高频重建。作为本专利技术再进一步方案:所述音乐信号带宽扩展模块包括:加窗转换模块,对原始高低频信号进行加窗并变换到频域,利用重叠区域为32样点的余弦窗对每一个256样点帧的原始高低频信号进行加窗,得到288样点帧;对加窗后的原始信号和高频信号通过FFT变换到频域;相关性计算模块,计算高低频信号对应频带之间的相关性,针对每一个288样点帧,计算对应高低频信号之间的相关性,从而确定用低频信号还是白噪声信号来重建;能量参数提取模块,提取指导高频重建所需的能量参数,采用低频信号来复制高频信号,需提取对应低频子带的能量增益;若采用白噪声重建高频,则需提取高频子带平均能量;重建模块,用于利用能量参数调整低频或白噪声信号完成高频重建。与现有技术相比,本专利技术的有益效果是:本专利技术充分考虑到了不同信号类型的特性,从信号类型的角度着手,通过检测当前帧信号的ACELP/TVC编码模式判断当前帧的信号类型(语音/音乐),再基于信号类型分别对语音和音乐信号进行自适应的高频重建策略,以提高音频恢复质量。因此本专利技术实施例技术方案能够更准确的进行高频重建。附图说明图1是本专利技术实施例带宽扩展的方法流程图。图2是本专利技术实施例语音帧信号高频重建策略流程图。图3是本专利技术实施例音乐帧信号高频重建策略流程图。图4是本专利技术实施例带宽扩展的模块装置图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例本文档来自技高网...
一种音频带宽扩展的方法及扩展装置

【技术保护点】
一种音频带宽扩展的方法,其特征在于,包括如下步骤:步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;步骤2,同时基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。

【技术特征摘要】
1.一种音频带宽扩展的方法,其特征在于,包括如下步骤:步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;步骤2,同时基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。2.根据权利1所述的音频带宽扩展的方法,其特征在于,所述对于语音信号,采用基于LPC的带宽扩展方法具体为:(1)提取低频残差信号作为激励信号;低带原始信号经过低带线性预测逆滤波器滤波后得到低带残差信号作为激励信号,低带的线性预测系数每帧更新一次;每一个1024样点超帧的低带激励信号通过长度为288样点,重叠区域为32样点的余弦窗分割为四个长度288样点的帧(2)提取高频LPC系数,表征高频包络信息;对每一帧高频原始信号进行一次八阶线性预测分析,得到一组八阶的线性预测编码系数,并转换为导抗频谱对系数,导抗频谱对系数进一步变换为导抗谱频率系数;量化后的导抗谱频率系数变换为量化后线性预测系数,并以此产生高频合成滤波器;假设高频合成滤波器288点的冲击响应为,用288点的快速傅里叶变换将变换到频域,以此表示原始高频信号的频谱包络;(3)利用高频包络信息和低频残差信号得到准高频信号;每一帧的低带激励信号和高带合成滤波器的冲击响应用288点的FFT变换到频域;高带合成滤波器冲击响应的288点FFT系数用其中的最大值归一化;将低带激励信号的FFT系数乘以归一化的高带合成滤波器的冲击响应FFT系数就可以得到频域的基础信号;(4)提取高低频对应频带之间的增益信息;计算288样点帧准高频信号和原始高频信号对应子带间的能量增益,(5)利用高频信号的谱包络信息及增益信息调整原始低频信号生成的高频激励信号来重建高频信号。3.根据权利1所述的带音频带宽扩展的方法,其特征在于,所述对于音乐信号,采用基于高低频信号相关性的频带复制带宽扩展方法具体为:(1)对原始高低频信号进行加窗并变换到频域;利用重叠区域为32样点的余弦窗对每一个256样点帧的原始高低频信号进行加窗,得到288样点帧;对加窗后的原始信号和高频信号通过FFT变换到频域;(2)计算高低频信号对应频带之间的相关性,若相关性较高,则将低频信号复制到高频频段用于高频重建;若高低频信号之间的相关性较低,则将白噪声信号填充到高频频段用于高频重建;针对每一个288样点帧,计算...

【专利技术属性】
技术研发人员:胡瑞敏姜林文彬王晓晨江游
申请(专利权)人:武汉大学深圳研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1