声音编码方法、声音译码方法、声音编码装置和声音译码装置制造方法及图纸

技术编号:3047459 阅读:193 留言:0更新日期:2012-04-11 18:40
在将声音信号压缩编码成数字信号的声音编码译码中,使用较少的信息量再生高品质的声音。在码驱动线性预测(CELP)声音编码中,使用频谱信息、功率信息和音调信息中的至少一个代码或编码结果对该编码区间内的声音的噪声水平进行评价,根据评价结果使用不同的驱动代码簿19、20。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及对声音信号进行数字信号的压缩编码译码时使用的声音编码译码方法和声音编码译码装置,特别涉及用来使用低比特率再生高品质的声音的声音编码方法、声音译码方法、声音编码装置和声音译码装置
技术介绍
过去,作为高效率声音编码方法,典型的有码驱动线性预测编码(Code-Excited Linear PredictionCELP),对该技术,“Code-ExcitedLinear Prediction(CELP)High-quality speech at very 1ow bitrates”(M.R.Shroeder and B.S.Atal著、ICASSP'85,pp.937-940,1985)已有叙述。图6是表示一例CELP声音编码方法的整体构成的图。图中101是编码部,102是译码部,103是多路复用装置,104是分离装置。编码部101由线性预测参数分析装置105、线性预测参数编码装置106、合成滤波器107、适应代码簿108、驱动代码簿109、增益编码装置110、距离计算装置111和加权相加计算装置138构成。此外,译码部102由线性预测参数译码装置112、合成滤波器113、适应代码簿114、驱动代码簿115、增益译码装置116和加权相加计算装置139构成。在CELP声音编码中,将5-50ms作为一帧,将该帧的声音分成频谱信息和声音源信息后进行编码。首先,说明CELP声音编码方法的动作。在编码部101中,线性预测参数分析装置105分析输入声音S101,抽出作为声音频谱信息的线性预测参数。线性预测参数编码装置106对该线性预测参数进行编码,将该编码后的线性预测参数作为合成滤波器的系数来设定。其次,说明声音源信息的编码。在适应代码簿108中,存储过去的驱动声音源信号,并与距离计算装置111输入的适应代码对应输出周期性的重复过去的驱动声音源信号的时间序列矢量。在驱动代码簿109中,存储多个时间序列矢量,该时间序列矢量构成为例如能够进行学习,使学习用声音和它的编码声音的失真很小。从适应代码簿108、驱动代码簿109来的各时间序列矢量与增益编码装置110给出的各增益对应,在加权相加计算装置138中进行加权相加,将该计算结果作为驱动声音信号供给合成滤波器107,得到编码声音。距离计算装置111求出编码声音和输入声音S101的距离,寻求距离最小的适应代码、驱动代码和增益。在上述编码结束后,将线性预测参数的代码以及使输入声音和编码声音的失真最小的适应代码、驱动代码、增益的代码作为编码结果输出。其次,说明CPEL声音译码方法的动作。另一方面,在声音译码部102中,线性预测参译编码装置112根据线性预测参数的代码对该线性预测参数进行译码,并作为合成滤波器的系数来设定。其次,适应代码簿114与适应代码对应输出周期性的重复过去的驱动声音源信号的时间序列矢量,驱动代码簿115与驱动代码对应时间序列矢量。这些时间序列矢量与增益译码装置中从增益代码译码的各增益对应,在加权相加计算装置139中进行加权相加,将该计算结果作为驱动声音信号供给合成滤波器113,得到输出声音S103。此外,在CELP声音编码译码方法中,作为以提高再生声音品质为目的进行改良的先有的声音编码译码方法,有“Phonetically-basedvector excitation coding of speech at 3.6kbps”(S.wang andA.Gersho著、ICASSP'89,pp.49-52,1989)所示的方法。图7示出一例该先有的声音编码译码方法的整体构成,对与图6对应的装置添加相同的符号,在图中的编码部101中,117是声音状态判定装置,118是驱动代码簿切换装置,119是第1驱动代码簿,120是第2驱动代码簿。此外,在图中的译码装置102中,121是驱动代码簿切换装置,122是第1驱动代码簿,123是第2驱动代码簿。说明这样构成的编码译码方法的动作。首先,在编码装置101中,声音状态判定装置117分析输入声音S101,判定声音状态例如是有声、无声两种状态中的哪一种状态。驱动代码簿切换装置118根据该声音状态的判定结果切换驱动代码簿,例如,若是有声则使用第1驱动代码簿119编码,若是无声则使用第2驱动代码簿120编码,此外,对使用了哪一个驱动代码簿也进行编码。其次,在译码装置102中,驱动代码簿切换装置121与在编码装置中使用了哪一个驱动代码簿的代码对应切换到第1驱动代码簿或第2驱动代码簿,使其与编码装置101使用的驱动代码簿相同。通过这样的构成,对声音的每一个状态准备一个与编码适应的驱动代码簿,通过与输入的声音状态对应切换使用驱动代码簿,可以提高再生声音的品质。此外,作为不增加比特数去切换多个驱动代码簿的先有的声音编码译码方法,有特开平8-185198号公报公开的方法。它是与用适应代码簿选择的音调周期对应去切换使用多个驱动代码簿的方法。因此,可以在不增加传送信息的情况下使用与输入信号的特征相适应的驱动代码簿。如上所述,在图6所示的先有的声音编码译码方法中,使用单一的驱动代码簿生成合成声音。为了即使在低比特率时也能得到高品质的编码声音,存储在驱动代码簿中的时间序列矢量变成包含很多脉冲的无噪声的东西。因此,当将背景噪声或磨擦性子音等有噪声的声音编码合成时。编码声音存在产生“叽哩叽哩”“嘁哩嘁哩”等不自然的声音的问题。若使驱动编码簿只由带噪声的时间序列矢量构成,虽然可以解决该问题,但作为编码声音的整体品质却变差了。此外,在已改良的图7所示的先有的声音编码译码方法中,与输入声音的状态对应切换多个驱动代码簿并生成编码声音。因此,对例如输入声音是有噪声的无声部分,可以使用由有噪声的时间序列矢量构成的驱动代码簿,对除此之外的有声部分可以使用由无噪声的时间序列矢量构成的驱动代码簿,即使对有噪声的声音进行编码、也不会发生“叽哩叽哩”的声音。但是,因译码侧也使用和编码侧相同的驱动代码簿,故有必要对使用了哪一个驱动编码簿的信息重新进行编码传送,存在妨碍低比特率化的问题。此外,在不增加发送比特数的情况下切换多个驱动代码簿的先有的声音编码译码方法中,与用适应代码选择的音调周期对应切换驱动代码簿。但是,因用适应代码选择的音调周期与实际的声音音调周期有差别,只根据该值不能判定输入声音的状态是有噪声还是无噪声,故不能解决声音的噪声部分的编码声音不自然的问题。本专利技术是为了解决有关的问题而提出的,其目的在于提供一种声音编码译码方法和声音编码译码装置,即使在低比特率的情况下也能再生高品质的声音。专利技术的公开为了解决上述课题,本专利技术的声音编码方法使用频谱信息、功率信息和音调信息中的至少一个代码或编码结果,对该编码区间中的声音的噪声水平进行评价,根据评价结果选择多个驱动代码中的一个。进而,下一个专利技术的声音编码方法具有多个驱动代码簿,所存储的时间序列矢量的噪声水平不同,根据声音的噪声水平的评价结果切换多个驱动代码簿。进而,下一个专利技术的声音编码方法根据声音的噪声水平的评价结果,使存储在驱动代码簿中时间序列矢量的噪声水平发生变化。进而,下一个专利技术的声音编码方法具有存储有噪声的时间序列矢量的驱动代码簿,根据声音的噪声水平的评价结果,通过问拔驱动声音源的信号样品本文档来自技高网...

【技术保护点】
一种声音编码方法,其特征在于:在码驱动线性预测编码(Code-Excited Linear Prediction:CELP)声音编码方法中,使用频谱信息、功率信息和音调信息中的至少一个代码或编码结果,对该编码区间中的声音的噪声水平进行评价,根据评价结果选择多个驱动代码簿中的一个。

【技术特征摘要】
JP 1997-12-24 354754/971.一种声音编码方法,其特征在于在码驱动线性预测编码(Code-Excited Linear PredictionCELP)声音编码方法中,使用频谱信息、功率信息和音调信息中的至少一个代码或编码结果,对该编码区间中的声音的噪声水平进行评价,根据评价结果选择多个驱动代码簿中的一个。2.权利要求1记载的声音编码方法,其特征在于具有多个驱动代码簿,其所存储的时间序列矢量的噪声水平不同,根据声音的噪声水平的评价结果切换上述多个驱动代码簿。3.权利要求1记载的声音编码方法,其特征在于根据声音的噪声水平的评价结果,使存储在驱动代码簿中时间序列矢量的噪声水平发生变化。4.权利要求3记载的声音编码方法,其特征在于具有存储有噪声的时间序列矢量的驱动代码簿,根据声音的噪声水平的评价结果,通过间拔上述时间序列矢量的信号样品去生成噪声水平低的时间序列矢量。5.权利要求3记载的声音编码方法,其特征在于具有存储有噪声的时间序列矢量的第1驱动代码簿和存储无噪声的时间序列矢量的第2驱动代码簿,根据声音的噪声水平的评价结果,生成将第1驱动代码簿的时间序列矢量和第2驱动代码簿的时间序列矢量加权相加后的时间序列矢量。6.一种声音译码方法,其特征在于在码驱动线性预测(CELP)声音译码方法中,使用频谱信息、功率信息和音调信息中的至少一个代码或译码结果,对该译码区间中的声音的噪声水平进行评价,根据评价结果选择多个驱动代码薄中的一个。7.权利要求6记载的声音译码方法,其特征在于具有多个驱动代码簿,其所存储的时间序列矢量的噪声水平不同,根据声音的噪声水平的评价结果切换上述多个驱动代码簿。8.权利要求6记载的声音译码方法,其特征在于根据声音的噪声水平的评价结果,使存储在驱动代码簿中时间序列矢量的噪声水平发生变化。9.权利要求8记载的声音译码方法,其特征在于具有存储有噪声的时间序列矢量的驱动代码簿,根据声音的噪声水平的评价结果,通过间拔上述时间序列矢量的信号样品去生成噪声水平低的时间序列矢量。10.权利要求8记载的声音译码方法,其特征在于具有存储有噪声的时间序列矢量的第1驱动代码簿和存储无噪声的时间序列矢量的第2驱动代码簿,根据声音的噪声水平的评价结果,生成将上述第1驱动代码簿的时间序列矢量和上述第2驱动代码簿的时间序列矢量加权相加后的时间序列矢量。11.一种声音编码装置,其...

【专利技术属性】
技术研发人员:山浦正
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1