【技术实现步骤摘要】
本专利技术涉及一种语音编码方法,该方法将输入的语音信号划分为作为编码单位的数据块或帧并按照编码单位进行解码,本专利技术还涉及一种解码方法,对经编码的信号进行解码,以及涉及一种语音编码/解码方法。迄今为止已有各种用于对声音信号(包括语音和音响信号)进行编码的编码方法,按照时域和频域以及人耳的心理声学特性,通过利用信号的统计特性进行信号压缩。编码方法可以粗分为时域编码、频域编码和分析/合成编码。高效的语音信号编码的实例包括正弦分析编码,例如谐波编码或多频带激励(MBE)编码、副频带编码(SBC)、线性预测编码(LPC)、离散余弦变换(DCT)、改进的DCT(MDCT)和快速傅里叶变换(FFT)。按照常规的MBE编码或谐波编码,利用噪声发生电路产生不发清辅音的语音部分。然而,这种方法存在的缺点是不能逼真地产生爆破(辅)音例如P、K或t,或者各摩擦(辅)音。此外,如果将具有完全不同特性的编码参数例如线性频谱对,内插在发声(V)部分和不发声(UV)部分之间的过渡部分处,往往会产生无关的外部声音。此外,利用常规的正弦合成编码,低音调的语音,首先是男人的声音会变成失真的“被堵塞的”语音。因此,本专利技术的一个目的是提供一种语音编码方法和装置以及语音解码方法和装置,因此能逼真地重现爆破音和摩擦音,不会在发声语声和不发声语声之间的过渡部分处产生奇异声音,从而,可以重现具有高清晰度而无“堵塞”感的语声。根据本专利技术的语音编码方法,其中输入语音信号被沿时间轴划分成预定的编码单位并按照预定的编码单位顺序地进行编码,求出该输入语声信号的短期预测余部,将如此求出的短期预测余部 ...
【技术保护点】
一种语音编码方法,其特征在于将输入的语音信号按照预定的编码单位沿时间轴进行分析并按照预定的编码单位进行编码,包含的步骤有:求出输入的语音信号的短时预测的余部;通过正弦分析编码对上述求出的短时预测的余部进行编码;以及通过波形编码对 输入的语音信号进行编码。
【技术特征摘要】
JP 1995-10-26 302129/951一种语音编码方法,其特征在于将输入的语音信号按照预定的编码单位沿时间轴进行分析并按照预定的编码单位进行编码,包含的步骤有求出输入的语音信号的短时预测的余部;通过正弦分析编码对上述求出的短时预测的余部进行编码;以及通过波形编码对输入的语音信号进行编码。2如权利要求1所述的语音编码方法,其特征在于利用谐波编码作为正弦分析编码。3如权利要求1所述的语音编码方法,其特征在于检测输入的语音信号中呈现的发声/发清辅音的语音状态,以便将输入的语音信号分为第一模式和第二模式,并且其中通过正弦分析编码对判别为第一模式的输入的语音信号部分进行编码,同时利用合成法分析对于最佳矢量进行闭环查找,对判别为第二模式的输入的语音信号其他部分通过对时域波形的矢量量化进行处理。4如权利要求1所述的语音编码方法,其特征在于将按听觉加权的矢量量化或矩阵量化用于该短期预测的余部的正弦分析编码参数的量化。5如权利要求4所述的语音编码方法,其特征在于根据由加权传递函数的冲击响应产生的参数的正交变换的结果,在进行所述的按听觉加权的矢量量化或矢量量化时计算各权重。6一种语音编码装置,其特征在于按照预定的编码单元对输入的语音信号沿时间轴进行划分并按照预定的编码单位进行编码;该装置包括用于求出输入的语音信号的短期预测的余部的装置;用于通过正弦分析编码对上述求出的短期预测的余部进行编码的装置;用于通过波形编码对输入的语音信号进行编码的装置。7如权利要求6所述的语音编码装置,其特征在于将谐波编码用作正弦分析编码。8如权利要求6所述的语音编码装置,其特征在于还包含用于鉴别输入的语音信号是发声语音部分还是不发声语音部分的装置;其中,像所述波形编码装置一样,代码激励的线性预测编码装置利用通过利用合成法分析通过闭环查找最佳矢量进行矢量量化,以及其中,在判别为发声输入语音信号部分和判别为不发声部分中,根据由所述鉴别装置产生的鉴别结果,将由所述正弦分析编码装置的编码输出,以及由所述代码激励的线性预测编码装置产生的编码输出分别取出。9如权利要求6所述的语音编码装置,其特征在于所述的正弦分析编码装置利用按听觉加权的矢量或矩阵量化,以便对所述短期分析的编码参数的正弦分析编码参数进行量化。10如权利要求6所述的语音编码装置,其特征在于所述的正弦分析编码装置根据由加权传递函数的冲击响应产生的参数的正交变换结果,在进行所述按听觉加权的矩阵或矢量量化时计算各权重。11一种语音解码方法,用于对经编码的语音信号进行解码,该经编码的语音信号是通过对利用正弦分析编码通过求出短期预测的余部对输入的语音信号的发声部分进行编码,以及通过采用短期预测的余部按照另一种编码对输入的语音信号的不发声部分进行编码得到的,该方法包括对于利用正弦合成编码的语音信号的发声语音部分来求出短期预测的余部的步骤,用以求出短期预测的余部;对于经编码的语音信号的不发声语音部分求出短期预测的余部的步骤;以及预测合成滤波,用于根据上述求出的发声和不发声语音部分的短期预测的余部,对沿时间轴的波形进行合成。12如权利要求11所述的语音解码方法,其特征在于所述的预测合成滤波步骤包括根据上述求出的发声语音部分的短期预测的余部,对发声部分的合成的沿时间轴的波形进行第一预测滤波的子步骤,以及根据上述求出的不发声语声部分的短期预测的余部,对不发声部分的沿时间轴的波形进行合成的第二预测滤波的子步骤。13如权利要求11所述的语音解码方法,还包含对说述第一预测合成滤波器的输出进入后置滤波的第一后置滤波步骤,以及对所述第二预测合成滤波器的输出进行后置滤波的第二后置滤波步骤。14如权利要求11所述的语音解码方法,其特征在于将按听觉加权的矢量或矩阵量化用对所述短期预测的余部的正弦合成参数进行量化。15一种语音解码装置,用于对经编码的语音信号进行解码,该经编码的语音信号是通过利用正弦合成编码求出短期预测的余部对输入的语音信号的发声部分进行编码,以及通过采用短期预测的余部的另一种编码对输入的语音信号的不发声部分进行编码得到的,该装置包含用于利用正弦分析编码对输入的语音信号的发声部分求出短期预测的余部的装置;一个装置,用于对所述编码的语音信号的不发声部分求出短期预测的余部,以及预测合成滤波装置,用于根据上述求出的发声和发清辅音的语音部分的所述短期预测的余部,合成沿...
【专利技术属性】
技术研发人员:西口正之,饭岛和幸,松本淳,大森士郎,
申请(专利权)人:索尼公司,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。