声源矢量生成装置以及声音编码装置和声音解码装置制造方法及图纸

技术编号:3046745 阅读:171 留言:0更新日期:2012-04-11 18:40
一种声源矢量生成装置,其特征在于,包括    存储多个振种的振种存储装置;    对应于振种的值输出不同的矢量系列的振荡器;    切换从所述振种存储装置供给所述振荡器的振种的切换装置。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及能得到高品质合成声音的声源矢量生成装置以及能用低位速率对高品质的声音信号进行编码/解码的声音编码装置和声音解码装置。
技术介绍
CELP(Code Excited Linear Prediction编码激励线性预测)型的声音编码装置,是对每个以一定的时间划分声音的帧进行线性预测,用存储过去的驱动声源的自适应码本和存储多个噪声向量的噪声码本,对每帧线性预测的预测残差(激励信号)进行编码的方式。例如在“低位速率高品质量话音”(“High Quality Speechat Low Bit Rate”M.R.Schroeder,Proc.ICASSP’85,PP937-940)中公开的CELP型声音编码装置。附图说明图1表示CELP型的声音编码装置的概略结构。CELP型的声音编码装置将声音信息分离成声源信息和声道信息并进行编码。对于声道信息,将输入声音信号10输入到滤波器系数分析单元11中并进行线性预测,在滤波器系数量化单元12对线性预测系数(LPG)进行编码。借助于对合成滤波器13提供线性预测系数,在合成滤波器13能将声道信号掺入声源信息中。对于声源信息,在每个进一步细分帧的区间(称为子帧)进行自适应码本14的检索和噪声码本15的声源检索。自适应码本14的检索和噪声码本15的声源检索,是决定使式(1)的编码失真最小的自适应码矢量的码号及其增益(音调增益)、和噪声码矢量的码号及其增益(噪声码增益)的处理。‖v·(gaHp+gcHc)‖2(1)V声音信号(矢量)H合成滤波器的脉冲响应卷积矩阵 H=h(0)0ΛΛ00h(1)h(0)0Λ00h(2)h(1)h(0)000MMMO00MMMOh(0)0h(L-1)ΛΛΛh(1)h(0)]]>其中,h合成滤波器的脉冲响应(矢量)L帧长p自适应码矢量c噪声码矢量ga自适应码增益(音调增益)gc噪声码增益但是,因当闭环检索使式(1)为最小的前述码时,码检索中所要的运算量变得膨大,所以在一般的CELP型声音编码装置中,首先进行自适应码本检索,规定自适应码矢量的码号,接着接受其结果,进行噪声码本检索,规定噪声码矢量的码号。这里,参照图2A~图2C对CELP型声音编码装置的噪声码本检索进行说明。图中,符号x是基于式(2)求得的噪声码本检索用的目标矢量。设自适应码本检索已经结束。x=v-gaHp (2)x噪声码本检索目标(矢量)v声音信号(矢量)H合成滤波器的脉冲响应卷积矩阵p自适应码矢量ga自适应码增益(音调增益)如图2所示,噪声码本检索是规定使计算单元16中用式(3)定义的编码失真最小的噪声码矢量c的处理。‖x-gcHc)‖2(3)x噪声码本检索目标(矢量)H合成滤波器的脉冲响应卷积矩阵 c噪声码矢量gc噪声码增益失真计算单元16对控制开关21进行控制,切换从噪声码本15读出的噪声编码矢量,直到定出噪声码矢量c为止。为了减少计算的费用,实际的CELP型声音编码装置为图2B的结构,在失真计算单元16’中进行规定使式(4)的失真估算值最大的码号的处理。(xtHc)2||Hc||2=((xtH)c)2||Hc||2=(x′tc)2||Hc||2=(x′tc)2ctHtHc---(4)]]>x噪声码本检索目标(矢量)H合成滤波器的脉冲响应卷积矩阵H’H的转置矩阵x’在H对x进行时间反转合成倒置所得矢量(x”=x’H)c噪声码矢量具体地说,将噪声码本控制开关21连接到噪声码本15的1端,从对应于该端的地址读出噪声码矢量c。由合成滤波器13,将读出的噪声码矢量c与声道信息合成,生成合成矢量Hc。接着,用对目标x进行时间反转、合成、时间反转得到的矢量x’、以合成滤波器合成噪声码矢量的所得矢量Hc和噪声码矢量c,失真计算单元16’算出式(4)的失真估算值。然后,切换噪声码本控制开关21,对噪声码本内的全部噪声矢量,算出上述失真估算值。最后,将式(4)的失真估算值为最大时连接的噪声码本控制开关21的号码,作为噪声码矢量的码号,输出到编码输出单元17中。图2C表示声音解码转置的部分结构。切换控制噪声码本控制开关21,以便读出被传送来的码号的噪声码矢量。在放大电路23和合成滤波器24中设定被传送来的噪声编码增益gc和滤波器系数后,读出噪声码矢量并复原合成声音。在前述的声音编码装置和解码装置中,存储在噪声码本15中作为声源信息的噪声码矢量的越多,越能检索接近实际声音的声源的噪声码矢量。但是,因噪声码本(ROM)的容量有限制,所以不能将对应于全部声源的无数的噪声码矢量存储在噪声码本中。因此,在谋求声音品质的改善方面有其极限。此外,提议有能大幅度地降低失真计算单元的编码失真计算,而且能减小噪声码本(ROM)的代数结构的声源(记载在“8KBIT/S ACELP CODING OFSPEECH WITH 10MS SPEECH-FRAMEA CANDIDATE FOR CCITTSTANDARDIZATION”R.Salami,C.Laflamme,J-P.Adoul,ICASSP’94,pp.II-97~II-100,1994中)。代数结构的声源预先计算合成滤波器的脉冲响应和时间反转的目标的卷积运算结果以及合成滤波器的自相关,并在存储器中展开,因而能大幅度地减少编码失真计算的费用。借助于代数生成噪声码矢量,能减小存储噪声码矢量的ROM。在噪声码本中使用前述代数结构声源的CS-ACELP和ACELP分别被ITU-T作为G.729建议和G.723.1建议提出。但是,在将前述代数结构声源包括在噪声码本中的CELP型的声音编码装置/声音解码装置中,因不断地用脉冲串矢量对噪声码本检索用目标进行编码,所以在谋求声音品质的改善方面有其极限。专利技术概述鉴于前述实际情况,本专利技术的第1个目的是提供比原样在噪声码本中存储噪声码矢量的场合能大幅度地减小存储器容量,并能谋得声音品质改善的声源矢量生成装置以及声音编码装置和声音解码装置。本专利技术的第2个目的是提供在噪声码本中包括代数结构声源,与用脉冲串矢量对噪声码本检索用目标进行编码的场合相比,能生成复杂的噪声码矢量,并能谋得声音品质改善的声源矢量生成装置以及声音编码装置和声音解码装置。本专利技术将以往的CELP型声音编码/解码装置的固定矢量读出单元和固定码本,分别置换为输出与被输入的振种值相对应的不同的矢量系列的振荡器和存储多个振种(产生振荡器)的振种存储单元中。由此,不必将固定矢量原样存储在固定码本(ROM)中,能大幅度地减小存储器的容量。本专利技术将以往的CELP型声音编码/解码装置的噪声矢量读出单元和噪声码本置换为振荡器和振种存储单元。由此,不必将噪声矢量原样存储在固定码本(ROM)中,能大幅度地减小存储器的容量。本专利技术声源矢量生成装置的结构是存储多个固定波形,根据起始端候补位置信息将各固定波形配置在各自的起始端位置上,并对这些固定波形进行加法运算,生成声源矢量。因此,能生成接近实际声音的声源矢量。本专利技术是噪声码本采用前述声源矢量生成装置而构成的CELP型声音编码/解码本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声源矢量生成装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;切换从所述振种存储装置供给所述振荡器的振种的切换装置。2.如权利要求1所述的声源矢量生成装置,其特征在于,所述振荡器是非线性滤波器。3.如权利要求2所述的声源矢量生成装置,其特征在于,所述非线性振荡器是非线性数字滤波器。4.如权利要求3所述的声源矢量生成装置,其特征在于,所述非线性数字滤波器包含具有基于非线性加法特性的加法器、将所述加法器的输出作为状态变量依次传送的多个状态变量保持单元,以及对从所述各状态变量保持单元输出的状态变量乘以增益,并将相乘所得的值输出到所述加法器的多个乘法器,所述状态变量保持单元提供从所述振种存储装置读出的振种作为所述状态变量的初始值,所述加法器以从外部供给的矢量系列和所述乘法器输出的相乘所得值作为输入值,对于所述输入值的总和产生遵循所述非线性加法特性的加法器输出,所述乘法器对增益进行限定,使数字滤波器的极点在Z平面的单位圆外。5.如权利要求4所述的声源矢量生成装置,其特征在于,所述非线性数字滤波器具有所述状态变量保持单元用2级构成,将所述乘法器并行连接到这些状态变量保持单元的输出上的2阶全极结构,所述加法器的非线性加法特性是2的补数特性。6.一种声音编码装置,其特征在于,包括存储多个振种的振种存储装置;对应于振种的值输出不同的矢量系列的振荡器;将从所述振荡器输出的矢量系列作为声源矢量进行LPC合成,生成合成话音的合成滤波器;切换从所述振种存储装置供给到所述振荡器的振种,另一方面对应于所述振种,估算生成的合成话音的失真,指定估算值为最大的振种号码的检索装置。7.如权利要求6所述的声音编码装置,其特征在于,所述振荡器是非线性数字滤波器。8.如权利要求7所述的声音编码装置,其特征在于,所述非线性数字滤波器包含具有基于非线性加法特性的加法器,将所述加法器的输出作为状态变量依次地传送的多个状态变量保持单元,以及对从所述各状态变量保持单元输出的状态变量乘以增益,并将相乘所得的值输出到所述加法器的多个乘法器,所述状态变量保持单元提供从所述振种存储装置读出的振种作为所述状态变量的初始值,所述加法器以从外部供给的矢量系列和所述乘法器输出的相乘所得值作为输入值,对所述输入值的总和产生遵循所述非线性加法特性的加法器输出,所述乘法器对增益进行限定,使数字滤波器的极点在Z平面的单位圆外。9.如权利要求6所述的声音编码装置,其特征在于,包括存储成为声音编码的对象的输入声音信号...

【专利技术属性】
技术研发人员:安永和敏森井利幸渡边泰助江原宏幸
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1