【技术实现步骤摘要】
基于频谱拉伸的带宽扩展音频编解码方法及装置
本专利技术的实施例涉及数字音频编解码技术,尤其涉及一种用于带宽扩展的音频编码方法及装置,以及用于带宽扩展的音频解码方法及装置。
技术介绍
传统的感觉音频编码技术(DRA、AAC和MP3等)的立体声典型工作码率是96-128kbps,且在64kbps/立体声以下时编码质量存在明显的主观感觉失真。调频广播应用的典型编码码率为48kbps-64kbps/立体声,这时传统感觉音频编码技术的主观声音质量已不能满足调频广播要求。如图1所示,提出了数字音频信号的带宽扩展(BandWidthExtension,简称BWE)编码技术。如图1所示,一个全频带单声道音频信号的低频部分采用传统的感觉音频编码(如AAC或DRA),而高频部分采用BWE进行参数编码,从而实现了一种低码率音频编码的方法。目前的带宽扩展编码技术有很多,性能也参差不齐。已经公开且用于国际标准中带宽扩展编码技术主要由如下两种编码算法:第一种带宽扩展编码技术是ISO/IEC14496-3MPEG-4中描述的频谱带 ...
【技术保护点】
1.一种用于带宽扩展的音频编码方法,所述音频具有低频部分与高频部分,所述方法包括步骤:/n将高频部分进行频域栅格划分得到频域栅格区域;/n在低频部分选择与所述频域栅格区域中的M个频域栅格区域对应匹配的拷贝频谱,M为自然数;/n确定拉伸因子,所述拉伸因子为与M个频域栅格区域中的频域栅格区域以及匹配的相应拷贝频谱相关的线性拉伸因子;和/n向解码端传送与拉伸因子有关的拉伸信息。/n
【技术特征摘要】
1.一种用于带宽扩展的音频编码方法,所述音频具有低频部分与高频部分,所述方法包括步骤:
将高频部分进行频域栅格划分得到频域栅格区域;
在低频部分选择与所述频域栅格区域中的M个频域栅格区域对应匹配的拷贝频谱,M为自然数;
确定拉伸因子,所述拉伸因子为与M个频域栅格区域中的频域栅格区域以及匹配的相应拷贝频谱相关的线性拉伸因子;和
向解码端传送与拉伸因子有关的拉伸信息。
2.根据权利要求1所述的方法,其中:
所述拉伸因子为频域栅格区域的带宽与匹配的拷贝频谱的带宽的比值。
3.根据权利要求2所述的方法,其中:
所述方法还包括步骤:将M个频域栅格区域中的每一个频域栅格区域在时域上进行栅格划分以获得N个时域栅格区域,其中N为自然数;且
所述拉伸因子为αij,其中,αij=BWHij/BWLij,BWHij为第i个频域栅格区域在第j个时域栅格区域的带宽,BWLij为低频部分中与第i个频域栅格区域在第j个时域栅格区域匹配的拷贝频谱的带宽,i为不大于M的自然数,j为不大于N的自然数。
4.根据权利要求1所述的方法,其中:
所述高频部分具有强谐波音频信号,M个频域栅格区域中的每一个频域栅格区域具有至少两个高次谐波;且
所述拉伸因子为高频对应带宽与对应的低频对应带宽之间的比值,所述高频对应带宽为M个频域栅格区域中的对应频域栅格区域的频率最低的两个高次谐波谱线之间的带宽;且所述低频对应带宽,在对应的拷贝频谱中具有基波的情况下,为拷贝频谱中的低频起始谱线与基波谱线之间的带宽,而在对应的拷贝频谱中不具有基波的情况下,为拷贝频谱中的频率最低的两个低次谐波谱线之间的带宽。
5.根据权利要求1所述的方法,其中:
所述高频部分具有强谐波音频信号,M个频域栅格区域中的每一个频域栅格区域具有至少两个高次谐波;
M个频域栅格区域包括以低频部分的最高谱线作为高频起始谱线的频域栅格区域;
M大于1,M个频域栅格区域中相邻的频域栅格区域中,前一个频域栅格区域的终止谱线为后一个频域栅格区域的起始谱线;
彼此对应的拷贝频谱与频域栅格区域中,高频起始谱线和频率最低的高次谐波谱线之间的带宽与低频起始谱线和低频基准谱线之间的带宽的比值等于所述拉伸因子,其中,在对应的拷贝频谱中具有基波的情况下,所述低频基准谱线为基波谱线,而在对应的拷贝频谱中不具有基波的情况下,所述低频基准谱线为拷贝频谱中频率最低的低次谐波谱线。
6.根据权利要求4或5所述的方法,其中:
将高频部分进行频域栅格划分得到M+1个频域栅格区域,所述第M+1个频域栅格区域为所述M个频域栅格区域之外的频域栅格区域;
所述方法还包括将代表辅助拉伸因子的辅助拉伸信息传送给解码端,对于第M+1个频域栅格区域,辅助拉伸因子为第M+1个频域栅格区域的带宽与匹配的辅助拷贝频谱的带宽的比值。
7.根据权利要求4或5所述的方法,其中:
所述方法还包括步骤:将M个频域栅格区域中的至少一个频域栅格区域在时域上进行栅格划分以获得N个时域栅格区域,其中N为自然数;且
所述拉伸因子包括αij,其中,αij=BWHij/BWLij,BWHij为第i个频域栅格区域在第j个时域栅格区域的高频对应带宽,BWLij为低频部分中与第i个频域栅格区域在第j个时域栅格区域匹配的拷贝频谱的低频对应带宽,i为不大于M的自然数,j为不大于N的自然数。
8.一种用于带宽扩展的音频解码方法,所述音频具有低频部分与高频部分,所述方法包括步骤:
获取与拉伸因子有关的拉伸信息以及确定拉伸因子,所述拉伸因子为与高频部分的M个频域栅格区域中的频域栅格区域以及低频部分中匹配的相应拷贝频谱相关的线性拉伸因子,M为自然数;
基于拉伸信息从低频部分确定匹配的拷贝频谱;
将匹配的拷贝频谱拉伸对应的拉伸因子倍得到拉伸频谱;和
将拉伸频谱拷贝到M个频域栅格区域中的对应频域栅格区域的对应位置。
9.根据权利要求8所述的方法,其中:
所述拉伸因子为频域栅格区域的带宽与匹配的拷贝频谱的带宽的比值。
10.根据权利要求9所述的方法,其中:
M个频域栅格区域中的每一个频域栅格区域在时域上栅格划分为N个时域栅格区域,其中N为自然数;所述拉伸因子为αij,其中,αij=BWHij/BWLij,BWHij为第i个频域栅格区域在第j个时域栅格区域的带宽,BWLij为低频部分中与第i个频域栅格区域在第j个时域栅格区域匹配的拷贝频谱的带宽,i为不大于M的自然数,j为不大于N的自然数;且
“将拉伸频谱拷贝到M个频域栅格区域中的对应频域栅格区域的对应位置”包括步骤:以将匹配的拷贝频谱拉伸αij倍得到的拉伸频谱,代替高频部分的M个频域栅格区域的第i个频域格栅区域的第j个时域栅格区域。
11.根据权利要求8所述的方法,其中:
所述拉伸因子为频域栅格区域的带宽与匹配的拷贝频谱的带宽的比值所述高频部分具有强谐波音频信号,M个频域栅格区域中的每一个频域栅格区域具有至少两个高次谐波;且
所述拉伸因子为高频对应带宽与对应的低频对应带宽之间的比值,所述高频对应带宽为M个频域栅格区域中的对应频域栅格区域的频率最低的两个高次谐波谱线之间的带宽;且所述低频对应带宽,在对应的拷贝频谱中具有基波的情况下,为拷贝频谱中的低频起始谱线与基波谱线之间的带宽,而在对应的拷贝频谱中不具有基波的情况下,为拷贝频谱中的频率最低的两个低次谐波谱线之间的带宽。
12.根据权利要求8所述的方法,其中:
所述高频部分具有强谐波音频信号,M个频域栅格区域中的每一个频域栅格区域具有至少两个高次谐波;
M个频域栅格区域包括以低频部分的最高谱线作为高频起始谱线的频域栅格区域;
M大于1,M个频域栅格区域中相邻的频域栅格区域中,前一个频域栅格区域的终止谱线为后一个频域栅格区域的起始谱线;
彼此对应的拷贝频谱与频域栅格区域中,高频起始谱线和频率最低的高次谐波谱线之间的带宽与低频起始谱线和低频基准谱线之间的带宽的比值等于所述拉伸因子,其中,在对应的拷贝频谱中具有基波的情况下,所述低频基准谱线为基波谱线,而在对应的拷贝频谱中不具有基波的情况下,所述低频基准谱线为拷贝频谱中频率最低的低次谐波谱线。
13.根据权利要求11或12所述的方法,其中:
高频部分频域栅格划分为M+1个频域栅格区域,所述第M+1个频域栅格区域为所述M个频域栅格区域之外的频域栅格区域;
所述方法还包括步骤:获得代表辅助拉伸因子的辅助拉伸信息以及确定辅助拉伸因子,辅助拉伸因子为第M+1个频域栅格区域的带宽与匹配的辅助拷贝频谱的带宽的比值;
所述方法还包括步骤:将与第M+1个频域栅格区域匹配的辅助拷贝频谱拉伸所述辅助拉伸因子倍而得到所述辅助拉伸频谱,以及将辅助拉伸频谱拷贝到第M+1个频域栅格区域中的对应位置。
14.根据权利要求11或12所述的方法,其中:
M个频域栅格区域中的每一个频域栅格区域在时域上栅格划分为N个时域栅格区域,其中N为自然数;
所述拉伸因子为αij,其中,αij=BWHij/BWLij,BWHij为第i个频域栅格区域在第j个时域栅格区域的高频对应带宽,BWLij为低频部分中与第i个频域栅格区域在第j个时域栅格区域匹配的拷贝频谱的低频对应带宽,i为不大于M的自然数,j为不大于N的自然数;且
“将拉伸频谱拷贝到M个频域栅格区域中的对应频域栅格区域的对应位置”包括步骤:以将匹配的拷贝频谱拉伸αij倍得到的拉伸频谱,代替高频部分的M个频域栅格区域的第i个频域格栅区域的第j个时域栅格区域。
15.根据权利要求8所述的方法,还包括步骤:
对拷贝到高频部分的拉伸频谱进行包络整形。
16.根据权利要求15所述的方法,还包括步骤:
对已经进行包络整形或者即将进行包络整形的拉伸频谱进行增益调整。
17.一种用于带宽扩展的音频编码装置,所述音频具有低频部分与高频部分,所述装置包括:
频域栅格划...
【专利技术属性】
技术研发人员:闫建新,王磊,
申请(专利权)人:广州广晟数码技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。