用于编码和解码非话音语音的方法和设备技术

技术编号：3046875 阅读：149 留言：0更新日期：2012-04-11 18:40

一种用于非话音的语音片段的低比特率编码技术。一组增益在由一个线性预测滤波器白化语音信号以后从一个残余信号获得。然后这些增益被量化并被应用到一个随机产生的稀疏的激励上。该激励被滤波，其频谱特性被分析并且和初始的残余信号的频谱特性进行比较。在该分析的基础上选择一个滤波器以成形该激励的频谱特性而达到最佳的性能。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
背景专利
所揭示的实施例涉及语音处理领域。更具体地说，所揭示的实施例涉及一种新颖的和经改进的非话音语音段的低比特率编码的方法和设备。背景通过数字技术传输话音已经得到广泛应用，尤其是在长距离的和数字的无线电电话应用方面。反过来，它在确定能通过一个信道发送的最少的信息量而同时保持经重新构造的语音的能被感知到的质量方面引起了兴趣。如果语音通过简单的采样和数字化传输，需要每秒64k比特(kbps)数量级的数据速率才能达到常规的模拟电话的语音质量。然而，通过使用语音分析，再跟以适当的编码，传输和在接收器上再综合，数据速率的显著减小是能够达到的。应用通过提取涉及人类语音生成模型的参数而压缩语音的技术的设备被叫做语音编码器。语音编码器把输入的语音信号分成几个时间大块，或分析帧。语音编码器通常包括一个编码器和一个解码器，或者一个编码解码器。编码器分析输入的语音帧以提取一定的相关参数，然后将这些参数量化为两进制的表示，即变为一组比特或一个两进制数据包。数据包通过通信信道传输到接收器和解码器。解码器处理该数据包，将其解量化以产生参数，然后用这些解量化的参数再综合成语音帧。语音编码器的功能是通过去除所有语音内在多余的自然信息而将数字化的语音信号压缩为低比特率的信号。数字化的压缩通过用一组参数表示输入的语音帧以及应用量化来用一组比特表示这些参数而达到。如果该输入的语音帧有一个比特数Ni，以及由语音编码器产生的数据包有一个比特数No，由语音编码器得到的压缩因子Cr＝Ni/No。挑战是既要保留经解码的语音的高语音质量，又要达到目标的压缩因子。语音编码器的性能取决于(1)语音模式，...

【技术保护点】
一种编码非话音语音片段的方法，其特征在于，该方法包括：将一个残余信号帧划分成多个子帧；通过为多个子帧中的每一个子帧计算一个码本增益而建立一组子帧增益；将该子帧增益组分解成子帧增益子组；标准化子帧增益子组以产生多个标准化因子，其中多个标准化因子的每一个因子都和子帧增益的标准化子组之一相关联；将多个标准化因子的每一个因子都转换成指数形式并且将经转换的多个标准化因子量化；将标准化的子帧增益子组量化，以产生多个量化码本增益，其中码本增益的每一个增益都和多个子组之一的一个码本增益指数相关联；对多个子帧中的每一个子帧产生一个包括随机数的随机噪声信号；对多个子帧中的每一个子帧选择一预定百分比的随机噪声信号的最高振幅随机数；对每一个子帧由量化的码本增益按比例缩放经选择的最高振幅随机数以产生一个按比例缩放的随机噪声信号；带通滤波和成形该按比例缩放的随机噪声信号；分析残余信号帧的能量和按比例缩放的随机信号的能量以产生能量分析；在能量分析的基础上选择第二滤波器并用该选择的滤波器进一步成形按比例缩放的随机噪声信号；以及 ...

【技术特征摘要】
US 2000-10-17 09/690,9151.一种编码非话音语音片段的方法，其特征在于，该方法包括将一个残余信号帧划分成多个子帧；通过为多个子帧中的每一个子帧计算一个码本增益而建立一组子帧增益；将该子帧增益组分解成子帧增益子组；标准化子帧增益子组以产生多个标准化因子，其中多个标准化因子的每一个因子都和子帧增益的标准化子组之一相关联；将多个标准化因子的每一个因子都转换成指数形式并且将经转换的多个标准化因子量化；将标准化的子帧增益子组量化，以产生多个量化码本增益，其中码本增益的每一个增益都和多个子组之一的一个码本增益指数相关联；对多个子帧中的每一个子帧产生一个包括随机数的随机噪声信号；对多个子帧中的每一个子帧选择一预定百分比的随机噪声信号的最高振幅随机数；对每一个子帧由量化的码本增益按比例缩放经选择的最高振幅随机数以产生一个按比例缩放的随机噪声信号；带通滤波和成形该按比例缩放的随机噪声信号；分析残余信号帧的能量和按比例缩放的随机信号的能量以产生能量分析；在能量分析的的基础上选择第二滤波器并用该选择的滤波器进一步成形按比例缩放的随机噪声信号；以及产生一个第二滤波器选择指示以识别该选择的滤波器。2.如权利要求1所述的方法，其特征在于，其中将一个残余信号帧划分成多个子帧的步骤包括将一个残余信号帧划分成10个子帧。3.如权利要求1所述的方法，其特征在于，其中将该子帧增益组分解成子帧增益子组的步骤包括将一组十个子帧增益划分成两组，每组五个子帧增益。4.如权利要求1所述的方法，其特征在于，其中残余信号帧包括以每秒八千赫兹采样20毫秒所得的每帧160个采样。5.如权利要求1所述的方法，其特征在于，其中预定的最高振幅随机数的百分比为百分之二十五。6.如权利要求1所述的方法，其特征在于，其中两个标准化因子是为两个子组产生的，该两个子组每一个都有五个子帧码本增益。7.如权利要求1所述的方法，其特征在于，其中量化子帧增益是用多级矢量量化进行的。8.一种编码非话音语音片段的方法，其特征在于，该方法包括将一个残余信号帧划分成子帧，每一个子帧有一个与其相关的码本增益；量化增益以产生指数；通过与子帧相关联的指数按比例缩放和每一个子帧相关联的某一百分比的随机噪声；对按比例缩放的随机噪声进行一次第一滤波；将经滤波的噪声和残余信号比较；以该比较为基础对随机噪声进行一次第二滤波；产生一个第二滤波器选择指示以识别所进行的第二滤波。9.如权利要求8所述的方法，其特征在于，其中将一个残余信号帧划分成子帧的步骤包括将一个残余信号帧划分成10个子帧。10.如权利要求8所述的方法，其特征在于，其中残余信号帧包括以每秒八千赫兹采样20毫秒所得的每帧160个采样。11.如权利要求8所述的方法，其特征在于，其中随机噪声的百分比为百分之二十五。12.如权利要求8所述的方法，其特征在于，其中量化增益以产生指数是用多级矢量量化进行的。13.一种用于编码非话音语音片段的语音编码器，其特征在于，该编码器包括将一个残余信号帧划分成多个子帧的装置；通过为多个子帧中的每一个子帧计算一个码本增益而建立一组子帧增益的装置；将该子帧增益组分解成子帧增益子组的装置；标准化子帧增益子组以产生多个标准化因子的装置，其中多个标准化因子的每一个因子都和子帧增益的标准化子组之一相关联；将多个标准化因子的每一个因子都转换成指数形式并且将经转换的多个标准化因子量化的装置；将标准化的子帧增益子组量化，以产生多个量化码本增益的装置，其中码本增益的每一个增益都和多个子组之一的一个码本增益指数相关联；对多个子帧中的每一个子帧产生一个包括随机数的随机噪声信号的装置；对多个子帧中的每一个子帧选择一预定百分比的随机噪声信号的最高振幅随机数的装置；对每一个子帧由量化的码本增益按比例缩放经选择的最高振幅随机数以产生一个按比例缩放的随机噪声信号的装置；带通滤波和成形该按比例缩放的随机噪声信号的装置；分析残余信号帧的能量和按比例缩放的随机信号的能量以产生能量分析的装置；在能量分析的的基础上选择第二滤波器并用该选择的滤波器进一步成形按比例缩放的随机噪声信号的装置；以及产生一个第二滤波器选择指示以识别该选择的滤波器的装置。14.如权利要求13所述的语音编码器，其特征在于，其中将一个残余信号帧划分成多个子帧的装置包括将一个残余信号帧划分成10个子帧的装置。15.如权利要求13所述的语音编码器，其特征在于，其中将该组子帧增益划分成子组的装置包括将一组十个子帧增益划分成两个组，其中每个组为五个子帧增益的装置。16.如权利要求13所述的语音编码器，其特征在于，其中选择一预定百分比的最高振幅随机数的装置包括选择百分之二十五的最高振幅随机数的装置。17.如权利要求13所述的语音编码器，其特征在于，其中标准化子组的装置包括为两组，每一组为五个子帧码本增益的子组产生两个标准化因子的装置。18.如权利要求13所述的语音编码器，其特征在于，其中量化子帧增益的装置包括进行多级矢量量化的装置。19.一种编码非话音语音片段的语音编码器，其特征在于，该编码器包括将一个残余信号帧划分成子帧的装置，每一个子帧有一个与其相关的码本增益；量化增益以产生指数的装置；通过与子帧相关联的指数按比例缩放和每一个子帧相关联的某一百分比的随机噪声的装置；对按比例缩放的随机噪声进行一次第一滤波的装置；将经滤波的噪声和残余信号比较的装置；以该比较为基础对随机噪声进行一次第二滤波的装置；产生一个第二滤波器选择指示以识别所进行的第二滤波的装置。20.如权利要求19所述的语音编码器，其特征在于，其中将一个残余信号帧划分成子帧的装置包括将一个残余信号帧划分成10个子帧的装置。21.如权利要求19所述的语音编码器，其特征在于，其中按比例缩放某一百分比的随机噪声的装置包括一个按比例缩放百分之二十五的最高振幅随机噪声的装置。22.如权利要求19所述的语音编码器，其特征在于，其中量化增益以产生指数的装置包括进行多级矢量量化的装置。23.一种编码非话音语音片段的语音编码器，其特征在于，该编码器包括一个增益计算部件，该部件配置成将一个残余信号帧划分成多个子帧，通过为多个子帧中的每一个子帧计算一个码本增益建立一组子帧增益，将该组子帧增益划分成子帧增益子组，标准化子帧增益子组以产生多个标准化因子，其中多个标准化因子中的每一个因子都和标准化的子帧增益子组中的一个子组相关联，以及将多个标准化因子中的每一个因子都转换成指数形式；一个增益量化器，该量化器配置成量化经转换的多个标准化因子以产生量化的标准化因子指数，以及量化标准化的子帧增益子组以产生多个量化的码本增益，其中码本增益中的每一个增益都和多个子组中的一个子组的一个码本增益指数相关联；一个随机数产生器，该产生器配置成对多个子帧中的每一个子帧产生一个包括随机数的随机噪声信号；一个随机数选择器，该选择器配置成对多个子帧中的每一个子帧选择一预定百分比的随机噪声信号的最高振幅随机数；一个乘法器，该乘法器配置成为每一个子帧用量化的码本增益按比例缩放经选择的最高振幅随机数，以产生按比例缩放的随机噪声信号；一个用于从按比例缩放的随机噪声信号中消除低端和高端频率的带通滤波器；一个用于感觉滤波按比例缩放的随机噪声信号的第一成形滤波器；一个非按比例缩放的带能分析器，该分析器配置成分析残余信号的能量；一个按比例缩放的带能分析器，该分析器配置成分析按比例缩放的随机信号的能量，以及产生一个和按比例缩放的随机信号的能量相比较的残余信号能量的相关能量分析；一个第二成形滤波器，该滤波器配置成在相关能量分析的基础上选择一个第二滤波器，用该选择的滤波器进一步成形按比例缩放的随机噪声信号，并且产生一个第二滤波器选择指示以识别该选择的滤波器。24.如权利要求23所述的语音编码器，其特征在于，其中带通滤波器和第一成形滤波器是固定的滤波器。25.如权利要求23所述的语音编码器，其特征在于，其中第二成形滤波器用两个固定的成形滤波器配置。26.如权利要求23所述的语音编码器，其特征在于，其中配置成产生一个第二滤波器选择指示以识别该选择的滤波器的第二成形滤波器被进一步配置成产生一个两比特滤波器选择指示。27.如权利要求23所述的语音编码器，其特征在于，其中配置成将一个残余信号帧划分成多个子帧的增益计算部件被进一步配置成将残余信号帧划分成十个子帧。28.如权利要求23所述的语音编码器，其特征在于，其中配置成将该组子帧增益划分成子组的增...

【专利技术属性】
技术研发人员：黄鹏俊，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人