CELP语音编码的话音指数控制制造技术

技术编号：3045974 阅读：190 留言：0更新日期：2012-04-11 18:40

一种利用综合分析（ＡＢＳ）编码器提高语音合成质量的方法。由于浊语音信号中的周期性程度对于浊语音的不同片断而言有显著差异，在综合分析型的语音编码（例如，ＣＥＬＰ）中会产生不稳定的感知质量。因此，本发明专利技术利用指示语音信号的周期性程度的话音指数控制和改进ＡＢＳ型语音编码。所述话音指数可被用于通过控制编码器和／或解码器来提高质量稳定性，其可以用于：固定码本（３０１）短期增强，包括频谱倾斜；感知加权滤波器；子固定码本确定；ＬＰＣ插值（３０４）；固定码本音调增强；后音调增强；在解码器高频带的噪声注入；ＬＴＰ正弦窗；信号分解等。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术主要涉及语音编码，更确切地，涉及码激励线性预测(CELp)语音编码。
技术介绍
一般而言，语音信号可被限制频带为约10kHz而不会影响感知。然而，在远程通信中，语音信号带宽通常被更严格地限制。众所周知，电话网络将语音信号的带宽限制在300Hz到3400Hz之间，称为“窄带”。这样的带宽限制导致了电话语音中的特征音。300Hz的下限和3400Hz的上限均会对语音质量产生影响。在大多数数字语音编码器中，语音信号被以8kHz采样，导致最大信号带宽为4kHz。然而，在实际中，通常将信号的带宽限制为在较高频率端约为3600Hz。在较低频率端，截止频率通常在50Hz和200Hz之间。所述窄带语音信号需要8kb/s的采样频率，且提供了一种被称为长话质量的语音质量。尽管所述长活质量对于电话通信而言已经足够，但是，对于一些新兴应用，例如，电话会议，多媒体服务以及高清晰度电视，需要更好的质量。通过增加带宽，所述通信质量可以得到提高以进行上述应用。例如，通过将采样频率增加到16kHz，可提供范围从50Hz到约7000Hz的更宽的带宽，其被称为“宽带”。将较低频率范围扩展到50Hz增加了自然度、现场感和舒适度。在频谱的另一端，较高频率范围被扩展到7000Hz，可以增加可懂度，使得更易于区分摩擦音。在数字语境下，通过一种众所周知的被称为综合分析(ABS)的方法对语音进行合成。综合分析也被称为闭环方法或波形匹配方法。对于中或高比特率，其提供了比其它方法相对更好的语音编码质量。一种已知的ABS方法即为码激励线性预测(CELP)。在CELP编码中，通过利用编码的激励信息激励...

【技术保护点】
一种提高合成语音质量的方法，其包括：　　　　获取输入语音信号；　　　　利用码激励线性预测编码器对所述输入语音进行编码，以生成用于所述输入语音的合成的编码参数；以及　　　　在增强所述输入语音的所述合成时，使用表示所述输入语音的特征的话音指数。

【技术特征摘要】
【国外来华专利技术】US 2003-3-15 60/455,4351.一种提高合成语音质量的方法，其包括获取输入语音信号；利用码激励线性预测编码器对所述输入语音进行编码，以生成用于所述输入语音的合成的编码参数；以及在增强所述输入语音的所述合成时，使用表示所述输入语音的特征的话音指数。2.权利要求1的方法，其中，所述输入语音的所述特征是所述输入语音的周期性。3.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制自适应高通滤波器以在所述编码时增强高频区域。4.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制在所述码激励线性预测编码器中的自适应感知加权滤波器。5.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制在用于音调贡献的所述码激励线性预测编码器中使用的自适应正弦窗。6.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数通过所述码激励线性预测编码器的固定码本的短期增强来控制所述输入语音的频谱倾斜。7.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的感知加权滤波器。8.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的线性预测编码器。9.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的音调增强固定码本。10.权利要求1的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的后音调增强。11.权利要求1的方法，其中，所述话音指数基于所述输入语音信号的所述特征，从所述码激励线性编码器的多个子码本中选择至少一个子码本。12.一种提高合成语音质量的方法，包括获取输入语音信号的代码参数；从所述代码参数获取用于增强所述输入语音信号的合成的话音指数；以及利用由所述话音指数提供的信息，通过码激励线性预测编码器来处理所述代码参数，以生成所述输入语音信号的合成版本。13.权利要求12的方法，其中，所述话音指数提供所述输入语音信号的周期性。14.权利要求12的方法，其中，所述话音指数提供自适应高通滤波器的特征，该滤波器用于在生成所述输入语音的所述代码参数时，增强所述激励的高频区域。15.权利要求12的方法，其中，所述话音指数提供自适应感知加权滤波器的特征，该滤波器用于在生成所述输入语音的所述代码参数时，增强所述输入语音的感知质量。16.权利要求12的方法，其中，所述话音指数提供用于音调贡献的自适应正弦窗的特征，该正弦窗用于在生成所述输入语音的所述代码参数时，增强所述输入语音的感知质量。17.权利要求12的方法，其中，所述增强所述输入语音的合成在于，利用所述话音指数通过所述码激励线性预测编码器的固定码本的短期增强来控制所述输入语音的频谱倾斜。18.权利要求12的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的线性预测编码滤波器。19.权利要求12的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的音调增强固定码本。20.权利要求12的方法，其中，所述增强所述输入语音的所述合成在于，利用所述话音指数控制所述码激励线性预测编码器的后音调增强。21.权利要求12的方法，其中，所述话音指数...

【专利技术属性】
技术研发人员：高扬，
申请(专利权)人：曼德斯必德技术公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人