【技术实现步骤摘要】
一种音频带宽扩展的方法及扩展装置
本专利技术涉及音频编码领域,具体是一种音频带宽扩展的方法及扩展装置。
技术介绍
心理声学研究表明人们对于音频不同频率下的敏感性具有差异,对低频更敏感而对高频不敏感,因此在音频编码中常常不对高频进行编码以节省码率。而高频部分的完全缺失又会带来听感上的不适,因此往往采用带宽扩展的方式恢复高频。基于LPC的带宽扩展技术是目前低码率、低复杂度的代表技术。它通过提取表征高频包络的LPC参数,子带能量,然后对得到高频的低频信号进行调整,从而完成高频重建。我国自主研发的移动音频编解码器AVS-P10也采用了这种带宽扩展方法。在对现有方法的研究和实践中,存在以下弊端:算法中对于信号的高频部分统一通过基于语音产生原理的LPC的带宽扩展算法进行编码,通过将低频信号的残差信号作为高频激励并结合线性预测编码技术实现高频的重建。从原理上来看,AVS-P10带宽扩展技术采用的一种典型的参数编码技术。其对语音信号的高频重建具有良好的效果,而对音乐信号的高频重建效果不佳,不能根据信号的类型与特征做自适应的调整。
技术实现思路
本专利技术的目的在于提供一种音频带宽扩展的方法及扩展装置,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种音频带宽扩展的方法,包括如下步骤:步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;步骤2 ...
【技术保护点】
一种音频带宽扩展的方法,其特征在于,包括如下步骤:步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;步骤2,同时基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。
【技术特征摘要】
1.一种音频带宽扩展的方法,其特征在于,包括如下步骤:步骤1,通过检测当前帧信号在混合ACELP/TVC核心编码器中的编码模式来区分信号类型;若当前帧信号在核心编码器的编码模式为ACELP256,则当前帧为语音信号;若当前帧信号在核心编码器的编码模式为TVC256、TVC512、TVC1024,则当前帧为音乐信号;步骤2,同时基于信号类型分别对语音和音乐信号选择自适应的高频重建策略;若为语音信号,则采用基于LPC的带宽扩展方法;若为音乐信号,则采用基于高低频信号相关性的频带复制带宽扩展方法。2.根据权利1所述的音频带宽扩展的方法,其特征在于,所述对于语音信号,采用基于LPC的带宽扩展方法具体为:(1)提取低频残差信号作为激励信号;低带原始信号经过低带线性预测逆滤波器滤波后得到低带残差信号作为激励信号,低带的线性预测系数每帧更新一次;每一个1024样点超帧的低带激励信号通过长度为288样点,重叠区域为32样点的余弦窗分割为四个长度288样点的帧(2)提取高频LPC系数,表征高频包络信息;对每一帧高频原始信号进行一次八阶线性预测分析,得到一组八阶的线性预测编码系数,并转换为导抗频谱对系数,导抗频谱对系数进一步变换为导抗谱频率系数;量化后的导抗谱频率系数变换为量化后线性预测系数,并以此产生高频合成滤波器;假设高频合成滤波器288点的冲击响应为,用288点的快速傅里叶变换将变换到频域,以此表示原始高频信号的频谱包络;(3)利用高频包络信息和低频残差信号得到准高频信号;每一帧的低带激励信号和高带合成滤波器的冲击响应用288点的FFT变换到频域;高带合成滤波器冲击响应的288点FFT系数用其中的最大值归一化;将低带激励信号的FFT系数乘以归一化的高带合成滤波器的冲击响应FFT系数就可以得到频域的基础信号;(4)提取高低频对应频带之间的增益信息;计算288样点帧准高频信号和原始高频信号对应子带间的能量增益,(5)利用高频信号的谱包络信息及增益信息调整原始低频信号生成的高频激励信号来重建高频信号。3.根据权利1所述的带音频带宽扩展的方法,其特征在于,所述对于音乐信号,采用基于高低频信号相关性的频带复制带宽扩展方法具体为:(1)对原始高低频信号进行加窗并变换到频域;利用重叠区域为32样点的余弦窗对每一个256样点帧的原始高低频信号进行加窗,得到288样点帧;对加窗后的原始信号和高频信号通过FFT变换到频域;(2)计算高低频信号对应频带之间的相关性,若相关性较高,则将低频信号复制到高频频段用于高频重建;若高低频信号之间的相关性较低,则将白噪声信号填充到高频频段用于高频重建;针对每一个288样点帧,计算...
【专利技术属性】
技术研发人员:胡瑞敏,姜林,文彬,王晓晨,江游,
申请(专利权)人:武汉大学深圳研究院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。