频域参数串生成方法、频域参数串生成装置以及记录介质制造方法及图纸

技术编号:14207664 阅读:189 留言:0更新日期:2016-12-18 15:23
比以往减小频域的编码的编码失真,且根据与通过频域的编码而获得的线性预测系数等价的系数,获得与在时域的编码中利用的前一帧的已量化LSP参数对应的LSP参数。LSP线性变换部(300)将p设为1以上的整数,将a[1],a[2],…,a[p]设为对规定的时间区间的声音信号进行线性预测分析而获得的线性预测系数串,将ω[1],ω[2],…,ω[p]设为来自线性预测系数串a[1],a[2],…,a[p]的频域参数串,将频域参数串ω[1],ω[2],…,ω[p]设为输入,将变换后频域参数串

Frequency domain parameter string generating method, coding method, decoding method, frequency domain parameter string generating device, coding device, decoding device, program, and recording medium

Reduce the frequency than previous encoding distortion, and according to the coefficient of linear and frequency domain obtained by encoding prediction coefficient equivalent, with the previous frame in the time domain using the quantized LSP encoding parameters corresponding to the LSP parameter. LSP linear transform part (300) will be set to p more than 1 integers, a[1], a[2],... The a[p] is set up for the linear prediction analysis of the sound signal of the prescribed time interval, and the Omega [1], Omega [2],... The Omega [p] is set as a string of linear prediction coefficients from a[1], a[2],... A[p], the frequency domain parameter string, the frequency domain parameter string Omega [1], Omega [2],... The Omega [p] is set as input, and the frequency domain parameters are changed to [1], Omega [2],... Omega [i] in Omega [p] (I = 1,2),... (P), through the linear transformation of the relationship between the value of one or more frequency domain parameters of the Omega [i] and the [i], the value of the parameter of the transformed frequency domain to [i] is obtained.

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及编码技术,尤其涉及改变与线性预测系数等价的频域的参数的技术。
技术介绍
在语音信号或声音信号的编码中,正在广泛使用利用对输入声音信号进行线性预测分析而获得的线性预测系数进行编码的方法。例如,在非专利文献1或非专利文献2中对每帧的输入声音信号通过频域中的编码方法或时域中的编码方法进行编码。根据各帧的输入声音信号的特性而决定使用频域中的编码方法和时域中的编码方法中的哪一个。无论是在时域中的编码方法还是频域中的编码方法,都将对输入声音信号进行线性预测分析而获得的线性预测系数变换为LSP参数的串,对LSP参数的串进行编码而获得LSP码并获得与LSP码对应的已量化LSP参数串。在时域中的编码方法中,将根据当前帧的已量化LSP参数串和前一帧的已量化LSP参数串而获得的线性预测系数作为时域的滤波器即合成滤波器的滤波器系数来利用,对将自适应码本中包含的波形和固定码本中包含的波形合成的信号应用合成滤波器而求得合成信号,通过将各码本的索引决定为所求出的合成信号与输入声音信号之间的失真成为最小,从而进行编码。在频域的编码方法中,将已量化LSP参数串变换为线性预测系数而求出已量化线性预测系数串,对所求出的已量化线性预测系数串进行平滑化而求出已校正已量化线性预测系数串,利用与已校正已量化线性预测系数对应的频域的序列即功率谱包络序列的各值,通过对将输入声音信号变换为频域的频域信号序列的各值进行归一化而求出去除了谱包络的影响的信号,考虑谱包络信息而对求出的信号进行可变长度编码。如此,在频域中的编码方法和时域中的编码方法中,共用对输入声音信号进行线性预测分析而获得的线性预测系数。线性预测系数被变换为与LSP(线谱对(Line Spectrum Pair))参数或ISP(导抗谱对(Immittance Spectrum Pairs))参数等线性预测系数等价的频域的参数的串。然后,对LSP参数串(或者ISP参数串)进行编码而获得的LSP码(或者ISP码)被送入解码装置。有时将在量化或插补中使用的LSP参数的0至π为止的频率尤其与LSP频率(LSP Frequency:LSF)或者ISP频率的情况(ISP Frequency:ISF)区分标记,但在本申请的说明中,将这样的频率的参数标记为LSP参数、ISP参数而进行说明。参照图1和图2,更具体说明现有的编码装置的处理。在以下的说明中,将由p个LSP参数构成的LSP参数串标记为θ[1],θ[2],…,θ[p]。p是1以上的整数的预测阶数。方括号([])内的记号表示索引。例如,θ[i]是LSP参数串θ[1],θ[2],…,θ[p]中的第i个LSP参数。在θ的右上角通过方括号标记的记号表示帧号。例如,将针对第f个帧的声音信号生成的LSP参数串标记为θ[f][1],θ[f][2],…,θ[f][p]。其中,由于多数处理是在帧内闭合进行,因此对与当前的帧(第f个帧)对应的参数省略右上角的帧号的记载而标记。设当省略帧号的记载的情况下,指对当前的帧生成的参数。即,θ[i]=θ[f][i]。右上角没有方括号而标记的记号表示幂运算。即,θk[i]表示θ[i]的k次方。在文中使用的记号「~」、「^」、「-」等本来应记载在其后的字符的正上方,但由于文本记载方法的限制,记载在该字符的前方。在公式中这些记号记载在本来的位置即字符的正上方。在步骤S100中,对现有的编码装置9输入作为规定的时间区间的帧单位的时间区域的语音声音数字信号(以下,称为输入声音信号)。编码装置9对输入声音信号按照每个帧进行以下的各处理部的处理。帧单位的输入声音信号被输入到线性预测分析部105、特征量提取部120、频域编码部150以及时域编码部170。在步骤S105中,线性预测分析部105对帧单位的输入声音信号进行线性预测分析,从而求出并输出线性预测系数串a[1],a[2],…,a[p]。这里,a[i]是i阶的线性预测系数。线性预测系数串的各系数a[i]是将输入声音信号z通过由式(1)表示的线性预测模型进行了模型化时的系数a[i](i=1,2,…,p)。【数1】 A ( z ) = 1 + Σ i = 1 p a [ i ] z - i ... ( 1 ) ]]>从线性预测分析部105输出的线性预测系数串a[1],a[2],…,a[p]被输入到LSP生成部110。在步骤S110中,LSP生成部110求出并输出与从线性预测分析部105输出的线性预测系数串a[1],a[2],…,a[p]对应的LSP参数的序列θ[1],θ[2],…,θ[p]。在以后的说明中,将LSP参数的序列θ[1],θ[2],…,θ[p]称为LSP参数串。LSP参数串θ[1],θ[2],…,θ[p]是被定义为在式(2)中定义的和多项式以及在(3)中定义的差多项式的根的参数的序列。【数2】F1(z)=A(z)+z-(p+1)A(z-1)…(2)F2(z)=A(z)-z-(p+1)A(z-1)…(3)LSP参数串θ[1],θ[2],…,θ[p]是按照值从小到大的顺序排列的序列。即,满足0<θ[1]<θ[2]<…<θ[p]<π。从LSP生成部110输出的LSP参数串θ[1],θ[2],…,θ[p]被输入到LSP编码部115。在步骤S115中,LSP编码部115对从LSP生成部110输出的LSP参数串θ[1],θ[2],…,θ[p]进行编码,求出并输出LSP码C1、以及与该LSP码C1对应的已量化了的LSP参数的序列^θ[1],^θ[2],…,^θ[p]。在以后的说明中,将已量化了的LSP参数的序列^θ[1],^θ[2],…,^θ[p]称为已量化LSP参数串。从LSP编码部115输出的已量化LSP参数串^θ[1],^θ[2],…,^θ[p]被输入到已量化线性预测系数生成部900、延迟输入部165以及时域编码部170。此外,从LSP编码部115输出的LSP码C1被输入到输出部175。在步骤S120中,特征量提取部120提取输入声音信号的时间变动的大小作为特征量。特征量提取部120在提取的特征量小于规定的阈值的情况下(即,输入声音信号的时间变动小的情况下),进行控制使得已量化线性预测系数生成部900执行后续的处理。此外,同时,将表示频域编码方法的信息作为识别码Cg而输入到输出部175。另一方面,特征量提取部120在提取的特征量是规定的阈值以上的情况下(即,输入声音信号的时间变动大的情况下),进行控制使得时域编码部170执行后续的处理。此外,同时,将表示时域编码方法的信息作为识别码Cg输入到输出部175。已量化线性预测系数生成部900、已量化线性预测系数校正部905、近似已平滑化功率谱包络序列计算部910以及频域编码部150的各处理在特征量提取部120中提取出的特征量小于规定的阈值本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/21/201580020682.html" title="频域参数串生成方法、频域参数串生成装置以及记录介质原文来自X技术">频域参数串生成方法、频域参数串生成装置以及记录介质</a>

【技术保护点】
一种频域参数串生成方法,其中,将p设为1以上的整数,将a[1],a[2],…,a[p]设为对规定的时间区间的声音信号进行线性预测分析而获得的线性预测系数串,将ω[1],ω[2],…,ω[p]设为来自上述线性预测系数串a[1],a[2],…,a[p]的频域参数串,上述频域参数串生成方法包含:参数串变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为输入,从而求出变换后频域参数串上述参数串变换步骤将上述变换后频域参数串中的各通过基于ω[i]和接近ω[i]的一个或多个频域参数之间的值的关系的线性变换,求出变换后频域参数的值。

【技术特征摘要】
【国外来华专利技术】2014.04.24 JP 2014-0898951.一种频域参数串生成方法,其中,将p设为1以上的整数,将a[1],a[2],…,a[p]设为对规定的时间区间的声音信号进行线性预测分析而获得的线性预测系数串,将ω[1],ω[2],…,ω[p]设为来自上述线性预测系数串a[1],a[2],…,a[p]的频域参数串,上述频域参数串生成方法包含:参数串变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为输入,从而求出变换后频域参数串上述参数串变换步骤将上述变换后频域参数串中的各通过基于ω[i]和接近ω[i]的一个或多个频域参数之间的值的关系的线性变换,求出变换后频域参数的值。2.如权利要求1所述的频域参数串生成方法,其中,上述线性变换是如下的线性变换,即与上述频域参数串ω[1],ω[2],…,ω[p]相比,上述变换后频域参数串的参数值的间隔更接近等间隔,或者更远离等间隔。3.一种频域参数串生成方法,其中,将p设为1以上的整数,将a[1],a[2],…,a[p]设为对规定的时间区间的声音信号进行线性预测分析而获得的线性预测系数串,将ω[1],ω[2]…,ω[p]设为以下参数串中的任一个:来自上述线性预测系数串a[1],a[2],…,a[p]的LSP参数串、来自上述线性预测系数串a[1],a[2],…,a[p]的ISP参数串、来自上述线性预测系数串a[1],a[2],…,a[p]的LSF参数串、来自上述线性预测系数串a[1],a[2],…,a[p]的ISF参数串、以及来自上述线性预测系数串a[1],a[2],…,a[p]且在ω[1],ω[2]…,ω[p-1]的全部处于0至π的期间且线性预测系数串中包含的所有的线性预测系数为0的情况下ω[1],ω[2]…,ω[p-1]在0至π的期间等间隔存在的频域参数串,将γ1以及γ2分别设为作为1以下的正常数的校正系数,将K设为预先决定的p×p的带状矩阵,所述频域参数串生成方法包含:参数串变换步骤,生成通过以下式定义的变换后频域参数串【数30】 ω ~ [ 1 ] ω ~ [ 2 ] . . . ω ~ [ p ] = K ω [ 1 ] - π p + 1 ω [ 2 ] - 2 π p + 1 . . . ω [ p ] - p π p + 1 ( γ 2 - γ 1 ) + ω [ 1 ] ω [ 2 ] . . . ω [ p ] . ]]>4.如权利要求3所述的频域参数串生成方法,其中,上述带状矩阵K的对角元素为0以上的值,且在行方向上与对角元素相邻的元素为0以下的值。5.一种频域参数串生成方法,其中,将p设为1以上的整数,将a[1],a[2],…,a[p]设为对规定的时间区间的声音信号进行线性预测分析而获得的线性预测系数串,将ω[1],ω[2],…,ω[p]设为来自上述线性预测系数串a[1],a[2],…,a[p]的频域参数串,上述频域参数串生成方法包含:参数串变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为输入,从而求出变换后频域参数串上述参数串变换步骤在ω[i]比ω[i+1]与ω[i-1]的中心点更接近ω[i+1]的情况下,求出上述变换后频域参数串中的各使得比与的中心点更接近且与ω[i+1]-ω[i]相比,的值更小,在ω[i]比ω[i+1]与ω[i-1]的中心点更接近ω[i-1]的情况下,求出上述变换后频域参数串中的各使得比与的中心点更接近且与ω[i]-ω[i-1]相比,的值更小。6.一种频域参数串生成方法,其中,将p设为1以上的整数,将a[1],a[2],…,a[p]设为对规定的时间区间的声音信号进行线性预测分析而获得的线性预测系数串,将ω[1],ω[2],…,ω[p]设为来自上述线性预测系数串a[1],a[2],…,a[p]的频域参数串,上述频域参数串生成方法包含:参数串变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为输入,从而求出变换后频域参数串上述参数串变换步骤在ω[i]比ω[i+1]与ω[i-1]的中心点更接近ω[i+1]的情况下,求出上述变换后频域参数串中的各使得比与的中心点更接近且与ω[i+1]-ω[i]相比,的值更大,在ω[i]比ω[i+1]与ω[i-1]的中心点更接近ω[i-1]的情况下,求出上述变换后频域参数串中的各使得比与的中心点更接近且与ω[i]-ω[i-1]相比,的值更大。7.如权利要求1至6的任一项所述的频域参数串生成方法,其中,将γ1设为1以下的正常数,上述频域参数串ω[1],ω[2],…,ω[p]中的各ω[i](i=1,2,…,p)是设为aγ1[i]=a[i]×(γ1)i从而与aγ1[1],aγ1[2],…,aγ1[p]等价的频域的参数或其量化值。8.一种编码方法,包含如权利要求1至7的任一项所述的频域参数串生成方法的各步骤,其中,将γ设为作为1以下的正常数的校正系数,所述编码方法包含:线性预测系数校正步骤,生成对上述线性预测系数串a[1],a[2],…,a[p]利用上述校正系数γ进行了校正的已校正线性预测系数串aγ[1],aγ[2],…,aγ[p];已校正LSP生成步骤,利用上述已校正线性预测系数串aγ[1],aγ[2],…,aγ[p]生成已校正LSP参数串θγ[1],θγ[2],…,θγ[p];已校正LSP编码步骤,对上述已校正LSP参数串θγ[1],θγ[2],…,θγ[p]进行编码,从而生成已校正LSP码以及与上述已校正LSP码对应的已校正已量化LSP参数串LSP线性变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为上述已校正已量化LSP参数串并设为γ1=γ、γ2=1,通过执行上述参数串变换步骤,生成上述变换后频域参数串作为近似已量化LSP参数串已量化线性预测系数串生成步骤,生成将上述已校正已量化LSP参数串变换为线性预测系数的已校正已量化线性预测系数串已量化已平滑化功率谱包络序列计算步骤,计算作为与上述已校正已量化线性预测系数串对应的频域的序列的已量化已平滑化功率谱包络序列频域编码步骤,生成对与上述声音信号对应的频域样本串X[1],X[2],…,X[N],利用上述已量化已平滑化功率谱包络序列进行了编码的频域信号码;LSP生成步骤,利用上述线性预测系数串a[1],a[2],…,a[p]生成LSP参数串θ[1],θ[2],…,θ[p];LSP编码步骤,对上述LSP参数串θ[1],θ[2],…,θ[p]进行编码,生成LSP码以及与上述LSP码对应的已量化LSP参数串以及时域编码步骤,对上述声音信号,利用在前一个时间区间的上述LSP编码步骤中获得的已量化LSP参数串、在前一个时间区间的LSP线性变换步骤中获得的近似已量化LSP参数串的任一个、以及上述规定的时间区间的已量化LSP参数串,进行编码而生成时域信号码。9.一种编码方法,包含如权利要求1至7的任一项所述的频域参数串生成方法的各步骤,其中,将γ设为作为1以下的正常数的校正系数,所述编码方法包含:线性预测系数校正步骤,生成对上述线性预测系数串a[1],a[2],…,a[p]利用上述校正系数γ进行了校正的已校正线性预测系数串aγ[1],aγ[2],…,aγ[p];已校正LSP生成步骤,利用上述已校正线性预测系数串aγ[1],aγ[2],…,aγ[p]生成已校正LSP参数串θγ[1],θγ[2],…,θγ[p];已校正LSP编码步骤,对上述已校正LSP参数串θγ[1],θγ[2],…,θγ[p]进行编码,从而生成已校正LSP码以及与上述已校正LSP码对应的已校正已量化LSP参数串LSP线性变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为上述已校正已量化LSP参数串并设为γ1=γ、γ2=1,通过执行上述参数串变换步骤,生成上述变换后频域参数串作为近似已量化LSP参数串已量化已平滑化功率谱包络序列计算步骤,基于上述已校正已量化LSP参数串计算已量化已平滑化功率谱包络序列频域编码步骤,生成对与上述声音信号对应的频域样本串X[1],X[2],…,X[N],利用上述已量化已平滑化功率谱包络序列进行了编码的频域信号码;LSP生成步骤,利用上述线性预测系数串a[1],a[2],…,a[p]生成LSP参数串θ[1],θ[2],…,θ[p];LSP编码步骤,对上述LSP参数串θ[1],θ[2],…,θ[p]进行编码,生成LSP码以及与上述LSP码对应的已量化LSP参数串以及时域编码步骤,对上述声音信号,利用在前一个时间区间的上述LSP编码步骤中获得的已量化LSP参数串、在前一个时间区间的LSP线性变换步骤中获得的近似已量化LSP参数串的任一个、以及上述规定的时间区间的已量化LSP参数串,进行编码而生成时域信号码。10.如权利要求8或9所述的编码方法,进一步具有:输出步骤,输出在上述频域编码步骤中生成的频域信号码和在上述时域编码步骤中生成的时域信号码中的任一个,上述时域编码步骤在前一个时间区间的输出步骤中输出了频域信号码的情况下,进行利用了在前一个时间区间的LSP线性变换步骤中获得的近似已量化LSP参数串的编码,在前一个时间区间的输出步骤中输出了时域信号码的情况下,进行利用了在前一个时间区间的LSP生成步骤中获得的已量化LSP参数串的编码。11.一种解码方法,包含如权利要求1至7的任一项所述的频域参数串生成方法的各步骤,所述解码方法包含:已校正LSP码解码步骤,对被输入的已校正LSP码进行解码,从而获得解码已校正LSP参数串解码LSP线性变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为上述解码已校正LSP参数串并设为γ1=γ、γ2=1,通过执行上述参数串变换步骤,生成上述变换后频域参数串作为解码近似LSP参数串解码线性预测系数串生成步骤,生成将上述解码已校正LSP参数串变换为线性预测系数的解码已校正线性预测系数串解码已平滑化功率谱包络序列计算步骤,计算作为与上述解码已校正线性预测系数串对应的频域的序列的解码已平滑化功率谱包络序列频域解码步骤,利用对被输入的频域信号码进行解码而获得的频域信号串、上述解码已平滑化功率谱包络序列生成解码声音信号;LSP码解码步骤,对被输入的LSP码进行解码,获得解码LSP参数串以及时域解码步骤,对被输入的时域信号码进行解码,利用在前一个时间区间的上述LSP码解码步骤中获得的解码LSP参数串、在前一个时间区间的上述LSP线性变换步骤中获得的解码近似LSP参数串的任一个、以及上述规定的时间区间的解码LSP参数串而进行合成,从而生成解码声音信号。12.一种解码方法,包含如权利要求1至7的任一项所述的频域参数串生成方法的各步骤,所述解码方法包含:已校正LSP码解码步骤,对被输入的已校正LSP码进行解码,从而获得解码已校正LSP参数串解码LSP线性变换步骤,将上述频域参数串ω[1],ω[2],…,ω[p]设为上述解码已校正LSP参数串并设为γ1=γ、γ2=1,通过执行上述参数串变换步骤,生成上述变换后频域参数串作为解码近似LSP参数串解码已平滑化功率谱包络序列计算步骤,基于上述解码已校正LSP参数串计算解码已平滑化功率谱包络序列频域解码步骤,利用对被输入的频域信号码进行解码而获得的频域信号串、上述解码已平滑化功率谱包络序列生成解码声音信号;频域解码步骤,利用对被输入的频域信号码进行解码而获得的频域信号串、上述解码已平滑化功率谱包络序列生成解码声音信号;LSP码解码步骤,对被输入的LSP码进行解码,获得解码LSP参数串以及时域解码步骤,对...

【专利技术属性】
技术研发人员:守谷健弘镰本优原田登龟冈弘和杉浦亮介
申请(专利权)人:日本电信电话株式会社国立大学法人东京大学
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1