编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法制造方法及图纸

技术编号:7868405 阅读:227 留言:0更新日期:2012-10-15 02:33
公开了即使对音乐信号进行编码时,也能够提高解码信号的质量的编码装置。该装置中,CELP编码单元(101)对输入信号进行编码而生成第1编码数据,CELP解码单元(102)对从CELP编码单元(101)输入的第1编码数据进行解码而生成解码信号,特征参数编码单元(106)计算用于表示解码信号和输入信号之间的、频谱的峰部分量与底部分量之比的变动量的参数。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及。
技术介绍
在移动通信系统中,为了有效利用电波资源等,期望将语音信号压缩至低比特率进行传输的技木。另ー方面,不仅语音信号,而且对于音乐信号等语音信号以外的信号也寻求能够以低比特率高质量地进行编码的语音编解码。这种技术是,例如,为高质量地实现作为回铃音(Ring Back Tone)放音乐的业务(melody call (乐曲传呼)等)必需的技术。对语音信号以低比特率高效率地进行编码的有效方式有CELP(Code Excited Linear Prediction :码激励线性预测)编码(例如,參照非专利文献I)。CELP编码是如下的方式基于工程学模仿人的语音生成模式所得的模型,使记录在码本(Code Book)中的激励信号通过对应于周期性的強度的基音滤波器(Pitch filter)和对应于声道特性的合成滤波器,并决定编码參数以使该输出信号和输入信号之间的方差在听觉特性的加权下为最小。通过采用上述模式,在CELP编码中能够将语音信号以低比特率高质量地进行编码。当前的很多标准语音编码方式基于CELP编码,例如,ITU(国际电信联盟)的G729、G718,或3GPP (第3代合作伙伴计划)的AMR (自适应多速率)、AMR-WB (自适应多速率宽带)等技术为代表性的例子。现有技术文献非专利文献[非专利文献 I] M. R. Schoder and B. S. Atal, “Code-excited linearprediction(CELP) ;high-quality speech at very low bit rates,,,Proc. ICASSP 85,pp.937-940,1985.
技术实现思路
专利技术要解决的问题然而,虽然CELP编码是能够对于语音信号以低比特率且高音质地进行编码的语音编解码方法,但它基于不适合音乐信号的模式,所以对音乐信号适用CELP编码时,音质极大地劣化。具体而言,在CELP编码中,如上所述,使记录在码本(code book)中的激励信号通过对应于周期性的強度的基音滤波器和对应于声道特性的合成滤波器而生成合成信号。该模式适合于表现语音信号的与共振峰对应的共振频率中的高能量分量(谱包络)、以及出现于基本频率的整数倍处的峰部(peak)性较强的分量(谐波结构或谐音)。但是,在一般的音乐信号中,并不一定如语音信号那样存在共振峰或谐波结构。而且,对于音乐信号中出现的与语音信号的谐波结构相比峰部性非常强的分量,CELP编码无法准确地表示该分量。例如,图IA和图IB表示对以16kHz的采样率录音语音信号的母音部分所得的信号进行频率分析时的频谱(图IA所示的原信号频谱(语音))、以及通过ITU-T G718的8kbit/s模式处理该信号时的解码音的频谱(图IB所示的解码信号频谱(语音))。G718的8kbit/s模式是基于CELP编码的编码方式。对图IA所示的原信号频谱和图IB所示的解码信号频谱进行比较可知,虽然在高频段存在若干差异但整体上是非常相似的频谱。另ー方面,图IC和图ID表示对以16kHz的采样率录音钢琴音(音乐信号)所得的信号进行频率分析时的频谱(图IC所示的原信号频谱(钢琴))、以及通过ITU-T G718的8kbit/s模式处理该信号时的解码音的频谱(图ID所示的解码信号频谱(钢琴))。对图IC所示的原信号频谱和图ID所示的解码信号频谱进行比较可知,原信号频谱中,整个频谱上明显出现了频谱的峰部(tone:単音)形状。相对于此,在解码信号频谱中,频谱的峰部形状从I. 5kHz附近开始失去原形,在3. 5kHz以上,频谱的形状与原信号频谱差异很大。这样,由于解码信号频谱的峰部形状失去原形,频谱峰部的山和谷之间的大小被抑制,从而在试听解码信号时感觉到噪声感,音质极大地劣化。 因此,作为在CELP编码中改善解码信号的质量的技术,提出了如下的技木通过对CELP编码的解码信号进行频率分析,以子带为单位抑制单音间的分量,实现音乐信号的首质改善(例如麥照 Tommy Vaillancourt, et. al. ,inter—tone noise reduction in alow bit rate CELP decoder”,Proc. ICASSP2009,pp.4113-4116,2009)。然而,该技术中存在如下的问题,因为以子带为单位决定单音间的分量的抑制量,所以频率分辨率降低。而且,该技术中还存在如下的问题因为通过对解码信号(即,质量劣化的信号)进行频率分析而计算单音间的分量的抑制量,所以难以计算改善音质所需的正确的抑制量。由此,无法得到充分的音质改善效果。本专利技术的目的是提供即使对音乐信号进行编码的情况下也能够提高解码信号的质量的。解决问题的方案本专利技术的编码装置采用的结构包括 第I编码单元,对输入信号进行编码而生成第I编码数据;解码单元,对所述第I编码数据进行解码而生成解码信号;以及计算单元,计算用于表示所述解码信号和所述输入信号之间的、频谱的峰部分量与底部(floor)分量之比的变动量的參数。本专利技术的解码装置采用的结构包括 第I解码单元,对在编码装置中将输入信号进行编码所得的第I编码数据进行解码而生成解码信号;以及调整单元,使用表示所述解码信号和所述输入信号之间的、频谱的峰部分量与底部分量之比的变动量的參数,进行所述解码信号的频谱的峰部分量的振幅调整。本专利技术的频谱变动量计算方法采用的结构包括编码步骤,对输入信号进行编码而生成第I编码数据;解码步骤,对所述第I编码数据进行解码而生成解码信号;以及计算步骤,计算用于表示所述解码信号和所述输入信号之间的、频谱的峰部分量与底部分量之比的变动量的參数。本专利技术的频谱振幅调整方法采用的结构包括解码步骤,对在编码装置中将输入信号进行编码所得的第I编码数据进行解码而生成解码信号;以及调整步骤,使用表示所述解码信号和所述输入信号之间的、频谱的峰部分量与底部分量之比的变动量的參数,进行所述解码信号的频谱的峰部分量的振幅调整。专利技术的效果根据本专利技术,即使在对音乐信号进行编码的情况下,也能够提高解码信号的质量。附图说明图IA 图ID是表示语音信号和音乐信号的原信号频谱和解码信号频谱的形状的图。图2是表示本专利技术实施方式I的编码装置的结构的方框图。图3是表示本专利技术实施方式I的特征參数编码单元的内部结构的方框图。图4是表示本专利技术实施方式I的解码装置的结构的方框图。图5是表示本专利技术实施方式I的变换系数增强单元的内部结构的方框图。 图6A 图6D是表示本专利技术实施方式I的变换系数增强单元的处理流程的图。图7是表示本专利技术实施方式2的编码装置的结构的方框图。图8是表示本专利技术实施方式2的特征參数编码单元的内部结构的方框图。图9是表示本专利技术实施方式2的解码装置的结构的方框图。图10是表示本专利技术实施方式2的变换系数增强单元的内部结构的方框图。图11是表示本专利技术实施方式3的特征參数编码单元的内部结构的方框图。图12是表示本专利技术实施方式3的变换系数增强单元的内部结构的方框图。图13是表示本专利技术实施方式4的编码装置的结构的方框图。图14是表示本专利技术实施方式4的解码装置的结构的方框图。图15是表示本专利技术实施方式4的变换系数增强单元的内部结构的方框图。图1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.01.14 JP 2010-0062601.编码装置,包括 第I编码单元,对输入信号进行编码而生成第I编码数据; 解码单元,对所述第I编码数据进行解码而生成解码信号;以及计算单元,计算用于表示所述解码信号和所述输入信号之间的、频谱的峰部分量与底部分量之比的变动量的参数。2.如权利要求I所述的编码装置, 还包括第2编码单元,对所述参数进行编码而生成第2编码数据。3.如权利要求2所述的编码装置, 所述第I编码单元对所述输入信号进行码激励线性预测编码, 所述第2编码单元使用所述输入信号、所述解码信号以及所述码激励线性预测编码中的基音增益计算所述参数。4.解码装置,包括 第I解码单元,对在编码装置中将输入信号进行编码所得的第I编码数据进行解码而生成解码信号;以及 调整单元,使用表示所述解码信号和所述输入信号之间的、频谱的峰部分量与底部分量之比的变动量的参数,对所述解码信号的频谱的峰部分量进行振幅调整。5.如权利要求4所述的解码装置, 所述编码单元对输入信号进行编码而生成第I编码数据,对所述第I编码数据进行解码而生成解码信号,使用所述输入信号和所述解码信号计算所述参数,并且对所述参数进行编码而生成第2编码数据, 所述解码装置还包括对所述第2编码数据进行解码而获得所述参数的第2解码单元; 所述调整单元使用所述参数进行所述振幅调整。6.如权利要...

【专利技术属性】
技术研发人员:押切正浩
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1