当前位置: 首页 > 专利查询>徐光锁专利>正文

频带扩展编码方法及装置和解码方法及装置制造方法及图纸

技术编号:3044994 阅读:156 留言:0更新日期:2012-04-11 18:40
本发明专利技术提出一种频带扩展编码方法,包括如下步骤:A.将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;根据原始高频时域信号获得原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱,再对其进行IDFT变换得到高频拷贝激励信号;B.对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。本发明专利技术还提出了相应的解码方法以及编解码装置。本发明专利技术方案可以有效提高编码声音质量。

【技术实现步骤摘要】

本专利技术涉及宽带声音的编码、解码和声音合成领域,特别涉及频带扩展编码方法及装置和解码方法及装置
技术介绍
经过多年的技术发展,数字声音编码技术已经非常成熟,目前,很多声音编码技术已经成为工业标准被大量应用,融入人们的日常生活中。这些技术如Dolby实验室的AC-3、数字影院系统公司的数字家庭影院系统(DigitalTheater Systems,DTS)、移动图象专家组(Moving Picture Experts Group,MPEG)组织的MP3和高级音频编码(Advanced Audio Coding,AAC)、微软公司的视窗媒体音频(Windows Media Audio,WMA)、索尼公司的ATRAC、国际电联(International Telecommunication Union,ITU)的G.723和G.729等,是数字声音编码技术在不同阶段发展的结果。由于声音产生的复杂性,广义的声音,包括语音、音乐、自然声音和人工合成声音等人耳可感知的信号等,通常无法采用简单有效的参数模型,如传统的语音编码技术普遍采用“预测+激励”模型来实现,而常采用以波形编码为基础的“波形-参数”编码方案。其中,最典型的例子是被第三代合作伙伴项目(Three Generation Partnership Project,3GPP)采纳的扩展的宽带自适应多速率(Extended Adaptive Multi-Rate-Wideband,AMR-WB+)编解码方案。在AMR-WB+方案中,在传统语音编码的“预测+激励”编码框架即代数码本激励预测编码(Algebraic Code Enhance Excited LinearPredictive,ACELP)中,增加了预测残差的变换波形编码(Transform CodedExcitation,TCX)和简单的高频扩展编码(Band Width Extension,BWE)技术,其中残差实际就是语音编码中的激励信号。图1所示为AMR WB+编码器结构框图。首先,输入的模拟声音信号被预处理及分析滤波器组101分解为两个子带,第一个子带为低频(LowFrequency,LF)信号,经临界采样,其采样频率为Fs/2,其中Fs是经AMRWB+编码器的重采样模块所获得信号的采样频率;第二个子带为高频(HighFrequency,HF)信号,同样被临界采样,使其采样频率为Fs/2。此后,LF信号和HF信号采用不同的方法编码即LF信号采用ACELP/TCX编码器102进行编码,所述ACELP/TCX编码器102所使用的编码方法可以在ACELP或TCX这两种编码方法中进行切换;高频编码器103采用一种带宽扩展方法(BWE)对HF信号进行编码,以有效降低编码所需要的比特数。最后,比特流复用器104将编码方法选择信息即模式信息、LF参数和HF参数复用为数字音频信号比特流输出。图2是AMR WB+解码器结构框图。其中,解复用模块201将所收到的数字音频信号比特流解复用成LF参数、HF参数以及模式信息,这两部分信号再分别通过ACELP/TCX解码器202和高频解码模块203进行解码,解码后通过综合滤波器组204组合成全频带的数字音频信号。由于波形和参数相结合的编码技术可以有效的提高编码效率,因此,AMR WB+技术适合于很低码率的声音编码应用,并且AMR WB+与目前已有的其他低码率声音编码技术相比,更适合语音信号的编码、以及语音和音乐混合信号的编码。AMR WB+技术实际上是ACELP技术针对音乐信号的一个改进方案,其典型的特征包括采用了激励信号的变换编码,以及高频信号扩展技术。下面重点介绍AMR WB+的高频信号扩展技术。图1所示采用BWE方法对HF信号进行处理的高频编码器103,其结构如图3所示。其中,原始高频信号SHF(n)的分析带宽为Fs/4,可视为临界采样之前的高频信号的折叠。由线性预测分析编码(Linear PredictiveCode,LPC)、量化与插值模块305对原始高频信号SHF(n)做LPC,获得一组8阶的线性预测器系数(LP系数)作为信号SHF(n)谱的包络参数。将这些LP系数变换成线谱对(Linear Spectrum Pair,LSP)系数并量化编码;再由估计增益计算模块306根据线性预测分析获得的预测器系数及其插值与低频激励信号估计一组增益,简称“估计增益”;另一方面,高频合成滤波器301将低频激励信号拷贝为高频拷贝激励信号,并由子帧能量计算模块302计算高频拷贝激励信号的能量,再由子帧能量计算模块303计算原始高频信号的能量,真实增益计算模块304将所得两种子帧能量进行比较,确定高频增益,简称“真实增益”,高频增益以64个时域样值为一个子帧(subframe)进行计算;最后,由增益差值处理模块模块将真实增益减去估计增益,对获得的增益差值,每4个一组进行矢量量化得到并输出增益因子,从而降低量化代价,即量化所需的比特数。图2所示的采用BWE方法对HF信号进行处理的高频解码模块202,其结构如图4所示。其中,子帧时域增益调整模块401接收来自低频解码器的低频激励信号拷贝到特定的高频频段并进行时域增益调整,得到高频拷贝激励信号;由于时域增益调整以N个样值为一个子帧(subframe)进行,为了去除由此引起的块噪声,需要由噪声处理模块402进行去噪声(Buzziness)处理二最后,由高频综合预测器403对所述高频拷贝激励信号进行滤波,获得高频时域信号 。AMR WB+的编码和解码详细细节参见标准文本《(3GPP TS26.290V6.3.0(2005-06)Technical Specification)》。现有的AMR WB+的频带扩展技术是一个时域的实现方法,不能对低频激励信号拷贝获得的高频拷贝激励信号进行有效的频谱结构调整,特别是在局部频率区域内的音调性。而音乐信号的频谱结构丰富,往往低频谱结构和高频谱结构的差异很大,这些结构特征包括显著影响声音质量的音调、音色的频谱包络形状信息。因此,AMR WB+的频带扩展技术有相当大的局限性,编码后生成的声音质量较低,特别是对一些音乐信号的编码声音会出现较大失真。
技术实现思路
有鉴于此,本专利技术的目的在于,提出一种频带扩展编码方法和解码方法,能够有效地提高编码声音信号的质量。频带扩展编码方法包括如下步骤A、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;根据原始高频时域信号获得原始高频激励信号,并将原始高频激励信号作离散傅立叶变换DFT得到原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱;对调整后的高频拷贝激励谱进行逆离散傅立叶变换IDFT得到调整后的高频拷贝激励信号;B、对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。所述低频激励谱为变换激励编码TCX模式生成的TCX帧的低频激励谱,或代数码本激励预测编码ACELP模式形成ACELP帧的低频激励信号经DFT变换得到的ACE本文档来自技高网
...

【技术保护点】
一种频带扩展编码方法,其特征在于,该方法包括如下步骤:    A、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;根据原始高频时域信号获得原始高频激励信号,并将原始高频激励信号作离散傅立叶变换DFT得到原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱;对调整后的高频拷贝激励谱进行逆离散傅立叶变换IDFT得到调整后的高频拷贝激励信号;    B、对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。

【技术特征摘要】
1.一种频带扩展编码方法,其特征在于,该方法包括如下步骤A、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;根据原始高频时域信号获得原始高频激励信号,并将原始高频激励信号作离散傅立叶变换DFT得到原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱;对调整后的高频拷贝激励谱进行逆离散傅立叶变换IDFT得到调整后的高频拷贝激励信号;B、对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。2.根据权利要求1所述的方法,其特征在于,所述低频激励谱为变换激励编码TCX模式生成的TCX帧的低频激励谱,或代数码本激励预测编码ACELP模式形成ACELP帧的低频激励信号经DFT变换得到的ACELP帧的低频激励谱。3.根据权利要求1所述的方法,其特征在于,预设两种高频编码模式,步骤A之前进一步包括对预设的高频编码模式进行判断,若为模式1,则依次执行步骤A和步骤B;若为模式2,则进一步判断低频激励谱的编码模式,若为TCX模式,则依次执行步骤A和步骤B,若为ACELP模式,则转至步骤CC、对ACELP帧的低频时域激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;将所述时域增益调整参数作为高频参数输出,并结束本方法流程。4.根据权利要求1所述的方法,其特征在于,步骤A所述根据原始高频时域信号获得原始高频激励信号包括A1、对一个超帧的原始高频时域信号进行信号类型分析,并根据得到的信号类型信息将所述一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;A2、对所划分的每一个预测帧进行线性预测分析,获得每个预测帧的原始高频激励信号,然后再把各个预测帧组合生成一个超帧的原始高频激励信号。5.根据权利要求4所述的方法,其特征在于,步骤A1所述信号类型分析为判断所述原始高频时域信号的类型是缓变信号还是快变信号,若是快变信号则进一步分析快变点发生的位置;所述信号类型信息包括信号类型;若信号类型为快变信号,则进一步包括快变点发生的位置信息。6.根据权利要求1所述的方法,其特征在于,所述谱调整参数包括调性调整参数和频域增益调整参数,步骤A所述调整包括A3、计算所述原始高频激励谱的调性,根据所得原始高频激励谱的调性对所述高频拷贝激励谱进行调性调整,得到调性调整后的高频拷贝激励谱和调性调整参数;A4、根据所述原始高频激励谱,对所述调性调整后的高频拷贝激励谱进行频域增益调整,得到频域增益调整后的高频拷贝激励谱和频域增益调整参数。7.根据权利要求6所述的方法,其特征在于,步骤A3所述调性调整包括A31、将原始高频激励谱以及所述高频拷贝激励谱按照相同的划分方式分别划分为一个以上的频段,并计算每个频段的原始高频激励谱的调性Tref以及相应频段的高频拷贝激励谱的调性Test,判断高频拷贝激励谱的调性Test与原始高频激励谱的调性Tref的大小,若Test<Tref-T0,则执行步骤A32;若Tref-T0≤Test≤Tref+T1,则调整类型设置为不进行调性调整,将调整类型作为调性调整参数并转至步骤A4;若Test>Tref+T1,则执行步骤A33;其中T0、T1为预先设置的常数;A32、调整类型设置为加弦调整,将p^=Tref-Test1+Test]]>和调整类型作为调性调整参数,用加弦能量ΔET=Eest·(Tref-Test)1+Test]]>对所述高频拷贝激励谱进行加弦调整并转至步骤A4;A33、调整类型设置为加噪调整,将p^=Tref-TestTref·(1+Test)]]>和调整类型作为调性调整参数,用加噪能量ΔEN=Eest·(Test-Tref)Tref·(1+Test)]]>对所述高频拷贝激励谱进行加噪调整并转至步骤A4。8.根据权利要求1至7任一项所述的方法,其特征在于,步骤B所述对原始高频激励信号进行综合滤波,得到重建高频时域信号包括B1、对一个超帧的原始高频时域信号进行信号类型分析,并根据分析结果将一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;B2、对所述每一个预测帧,得到该预测帧内一组线谱频率,并做矢量量化,将所得量化后的线谱频率转化为量化后的线性预测滤波器系数,并由所得的这些系数构成线性预测综合滤波器;B3、将所述原始高频激励信号通过所述线性预测综合滤波器的滤波,得到重建高频时域信号。9.根据权利要求8所述的方法,其特征在于,步骤B所述提取时域增益调整参数包括根据所述对原始高频时域信号进行信号类型分析的分析结果,将所得的每个预测帧的重建高频时域信号划分为一个或一个以上的子帧;计算每个子帧的重建高频时域信号的能量平均值和该子帧对应的原始高频时域信号的能量平均值的比值,将所述比值的平方根作为调整该子帧时域增益的参数。10.一种频带扩展解码方法,其特征在于,该方法包括如下步骤a、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;b、读取谱调整参数,并根据谱调整参数对所述高频拷贝激励谱进行调整;对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号;c、对所述高频拷贝激励信号进行时域增益调整,得到调整后的高频拷贝激励信号,再对调整后的高频拷贝激励信号进行综合滤波,得到并输出重建高频时域信号。11.根据权利要求10所述的方法,其特征在于,所述低频激励谱为采用TCX解码模式得到的TCX帧低频激励谱,或ACELP解码模式得到的ACELP帧的低频激励信号进行DFT变换得到的ACELP帧低频激励谱。12.根据权利要求10所述的方法,其特征在于,预设两种高频解码模式,所述步骤a之前进一步包括对预设的高频解码模式进行判断,若为模式1,则执行步骤a;若为模式2,则进一步判断低频解码模式信息,若为TCX模式,则执行步骤a;若为ACELP模式,则对来自低频编码器的ACELP帧的低频激励信号进行综合滤波,得到重建高频时域信号,并根据时域增益调整参数对所得重建高频时域信号进行时域增益调整,输出所得调整后的重建高频时域信号并结束本流程。13.根据权利要求10所述的方法,其特征在于,步骤b所述调整参数包括调性调整参数和频域增益调整参数,所述调整包括调性调整和频域增益调整。14.根据权利要求13所述的方法,其特征在于,所述调性调整参数包括调整类型和调整参数 则所述调性调整包括b1、将高频拷贝激励谱划分为一个或一个以上的频带,并分别计算每个频带的能量Eest;b2、对于每一个频带判断调整类型,若调整类型为不调整,则对该频带不作处理;若调整类型为加弦处理,则在该频带的正中位置加弦,所加弦的能量为ΔET=Eest·P^,]]>并使所加弦的相位与前一帧对应相位连续;若调整类型为加噪调整,则在该频带加随机噪声,加噪能量为ΔEN=Eest·P^;]]>处理完毕所有频带后则结束调性调整。15.根据权利要求13所述的方法,其特征在于,所述频域增益调整包括b3、将高频拷贝激励谱划分为一个或一个以上的频带;b4、对于任一个频带,用该频带对应的增益调整参数乘以该频带内的每根谱线,得到该频带的频域增益调整后的高频拷贝激励谱,将所有频带组合起来即为频域增益调整后的高频拷贝激励谱。16.根据权利要求10至15任一项所述的方法,其特征在于,步骤c所述综合滤波包括c1、读取信号类型信息,并根据所读取的信号类型信息将一个超帧的高频拷贝激励信号划分成一个或一个以上的预测帧;c2、对所述每一个预测帧,读取量化后的线谱频率构成线性预测综合滤波器;c3、由所述线性预测综合滤波器对所述高频拷贝激励信号进行滤波,得到重建高频时域信号。17.根据权利要求10至15任一项所述的方法,其特征在于,步骤c所述时域增益调整包括c4、将高频拷贝激励信号划分为一个或一个以上的子帧;c5、读取时域增益调整参数,将每个子帧的高频拷贝激励信号分别乘以相应的时域增益调整参数,得到时域增益调整后的高频拷贝激励信号。18.一种频带扩展解码方法,其特征在于,该方法包括如下步骤a、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;b、读取调整参数,并根据调整参数对所述高频拷贝激励谱进行调整;对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号;c、对所述高频拷贝激励信号进行综合滤波,得到重建高频时域信号,再对所得重建高频时域信号进行时域增益调整,得到并输出时域增益调整后的重建高频时域信号。19.一种频带扩展编码装置,位于扩展的宽带自适应多速率AMR-WB+编码器中,用于接收来自预处理与分析滤波器组的高频时域信号以及来自低频编码器的低频激励谱,输出高频参数至比特流复用器,其特征在于,该装置包括如下部分谱参数编码模块,用于接收低频激励谱,...

【专利技术属性】
技术研发人员:徐光锁
申请(专利权)人:徐光锁
类型:发明
国别省市:13[中国|河北]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1