A method for frequency conversion coefficient of harmonic audio signal (Y (k)) encoding encoder (20) includes the following units: wave locator (22), configured to locate the peak with frequency dependent amplitude exceeds a predetermined threshold; peak domain encoder (24), configured to: including the located peaks and encoding in the peak region around the peak position; low frequency set (26), the encoder is configured to the outside of the peak field and set in at least one low frequency coefficient more frequency below the encoding bits, the crossover frequency depends on for encoding of the peak domain; noise gain base (28), the encoder is configured to gain at least a high frequency noise base set on the outside of the peak domain not encoding coefficient encoding.
【技术实现步骤摘要】
谐波音频信号的变换编码/解码本申请是2012年10月30日提交的中国专利申请No.201280072072.6的专利技术名称为“谐波音频信号的变换编码/解码”的分案申请。
本专利技术所提出的技术涉及音频信号(特别是谐波音频信号)的变换编码/解码。
技术介绍
变换编码是用于压缩和发送音频信号的主要技术。变换编码的概念是首先将信号变换到频域,然后量化并发送变换系数。解码器使用所接收的变换系数通过应用逆频率变换来重构信号波形,见图1。在图1中,将音频信号X(n)转发到频率变换器10。将所得到的频率变换Y(k)转发到变换编码器12,并将已编码的变换发送到解码器,变换解码器14对该已编码的变换进行解码。将已解码的变换转发到逆频率变换器16,逆频率变换器16将其变换为已解码的音频信号此方案背后的动机是,因为以下原因,可以更高效地量化频域系数:1)变换系数(图1中的Y(k))比输入信号采样(图1中的X(n))更非相关。2)频率变换提供能量压缩(更多的系数Y(k)接近于零并可以被忽略),以及3)变换背后的主观动机是人的听觉系统在变换域上工作,在该域上更易于选择感官上重要的信号成分。在典型的变换编解码器中,使用修正离散余弦变换(MDCT)来逐块地(有50%重合)对信号波形进行变换。在MDCT类型变换编解码器中,将块信号波形X(n)变换为MDCT矢量Y(k)。波形块的长度对应于20-40ms音频段。如果长度用2L表示,则MDCT变换可以定义为:其中k=0,...,L-1。然后,MDCT矢量Y(k)被分为多个频带(子矢量),并且每个频带中的能量(或增益)计算为:其中,mj是频带 ...
【技术保护点】
一种用于对谐波音频信号的修正离散余弦变换MDCT系数(Y(k))进行编码的方法,所述方法包括以下步骤:对具有超过预定阈值的幅度的谱峰进行定位(S1),其中通过将系数与所述阈值进行比较以形成波峰候选的矢量并按照降序从所述波峰候选中提取元素来定位所述谱峰,其中所述阈值计算如下:
【技术特征摘要】
2012.03.29 US 61/617,2161.一种用于对谐波音频信号的修正离散余弦变换MDCT系数(Y(k))进行编码的方法,所述方法包括以下步骤:对具有超过预定阈值的幅度的谱峰进行定位(S1),其中通过将系数与所述阈值进行比较以形成波峰候选的矢量并按照降序从所述波峰候选中提取元素来定位所述谱峰,其中所述阈值计算如下:其中是平均波峰能量,是平均噪声基底能量,以及γ具有固定预定值,并且按照Ep(k)=βEp(k)+(1-β)|Y(k)|计算波峰能量,按照Enf(k)=αEnf(k)+(1-α)|Y(k)|计算噪声基底能量,其中在波峰能量的计算中强调高能系数的贡献,而在噪声基底能量的计算中强调低能系数的贡献;对包括已定位的波峰和在已定位的波峰周围的峰域进行编码(S2),其中所述谱峰与相邻MDCT频段一起被量化;使用多个保留比特,对在所述峰域之外并在交越频率以下的系数的第一低频LF集合进行编码(S3),所述交越频率取决于用于对所述峰域进行编码的比特数,其中编码(S3)包括:如果在对所述峰域进行编码之后有非保留比特可用,则对所述峰域之外的系数的一个或多个其他低频集合进行编码;以及使用多个保留比特,对所述峰域之外的尚未编码的系数的至少一个高频集合的噪声基底增益进行编码(S4)。2.根据权利要求1所述的编码方法,其中,加权因子α定义如下:以及加权因子β定义如下:3.根据权利要求1或2所述的编码方法,其中对峰域进行编码的步骤(S2)包括:对波峰的谱位置和符号进行编码(S2-A);对波峰增益进行量化(S2-B);对已量化的波峰增益进行编码(S2-C);将所述波峰周围的预定频段缩放(S2-D)所述已量化的波峰增益的倒数倍;对已缩放的频段进行形状编码(S2-E)。4.根据权利要求1至3中任一项所述的编码方法,其中所述峰域包括所述波峰和所述波峰周围的四个MDCT频段。5.根据前述权利要求中任一项所述的编码方法,其中,对系数的低频集合进行编码的步骤(S3)包括:将剩余的未量化的MDCT系数分组到24维频带中。6.根据前述权利要求中任一项所述的编码方...
【专利技术属性】
技术研发人员:沃洛佳·格兰恰诺夫,托马斯·托夫特戈德,塞巴斯蒂安·内斯隆德,哈拉尔德·波布洛斯,
申请(专利权)人:瑞典爱立信有限公司,
类型:发明
国别省市:瑞典,SE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。