强壮语音分类方法和装置制造方法及图纸

技术编号:3046612 阅读:173 留言:0更新日期:2012-04-11 18:40
用于不同语音模式强壮分类的语音分类技术(502-530),使得多模式可变比特率编码技术能得到最佳性能。语音分类器精确地将大部分语音段分类,用于以最小比特率编码以符合低比特率的要求。高度精确的语音分类产生较低平均编码的比特率,以及较高质量解码的语音。语音分类器要考虑每个语音帧的最大参数数量,为每帧产生大量精确的语音模式分类。语音分类器在变化的环境条件下正确地分类大量语音模式。语音分类器从外部组件输入分类参数,从输入参数产生内部分类参数,设定标准化的自相关系数函数阀值并根据信号环境选择参数分析器,然后分析参数以产生语音模式分类。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
背景I.领域所揭示的实施例涉及语音处理领域,特别是,揭示的实施例涉及用于强壮语音分类的新颖并改进了的方法和装置。II.背景由数字技术传输语音已经很普及了,特别在长距离和数字无线电话的应用中。这又引起了要在维持所察觉的重建语音质量的同时确定可以在信道上被发送的最少信息量。如果语音通过简单地采样和数字化而被发送,则需要65千比特每秒(kbps)数量级上的数据速率来达到常规模拟电话的语音质量。然而,通过语音分析、随后适当编码、以及接收机处再合成的使用,可以显著减少数据速率。语音分析越精确地实现,数据就越适当地被编码,从而减少数据速率。采用通过析取与人类语音产生模型相关的参数而压缩语音的技术的设备被称为语音编码器。语音编码器将进入语音信号分为时间块或分析帧。语音编码器一般包括编码器和解码器或编解码器。编码器分析进入语音帧以析取某些相关参数,然后将参数量化为二进制表示,即,量化为一组比特或二进制数据包。数据包在通信信道上被发送到接收器和解码器。解码器处理数据包,将其反量化以产生参数,然后再使用经反量化的参数再合成语音帧。语音编码器的作用是通过除去语音中固有的所有自然冗余而将经数字化的语音信号压缩本文档来自技高网...

【技术保护点】
一种语音分类方法,其特征在于包括:从外部组件将分类参数输入到语音分类器;在语音分类器内,从至少一个输入参数产生内部分类参数;设定标准化的自相关系数函数阀值并根据信号环境选择参数分析器;以及分析输入参数和内部参 数以产生语音模式分类。

【技术特征摘要】
US 2000-12-8 09/733,7401.一种语音分类方法,其特征在于包括从外部组件将分类参数输入到语音分类器;在语音分类器内,从至少一个输入参数产生内部分类参数;设定标准化的自相关系数函数阀值并根据信号环境选择参数分析器;以及分析输入参数和内部参数以产生语音模式分类。2.如权利要求1所述的方法,其特征在于,所述输入参数包括噪声抑制的语音信号。3.如权利要求1所述的方法,其特征在于,所述输入参数包括噪声抑制的语音信号的信噪比信息。4.如权利要求1所述的方法,其特征在于,所述输入参数包括声音活动信息。5.如权利要求1所述的方法,其特征在于,所述输入参数包括线性预测反射系数。6.如权利要求1所述的方法,其特征在于,所述输入参数包括标准化的自相关系数函数信息。7.如权利要求1所述的方法,其特征在于,所述输入参数包括音调信息处的标准化的自相关系数函数。8.如权利要求7所述的方法,其特征在于,所述音调信息处的标准化的自相关系数函数是一个值数组。9.如权利要求1所述的方法,其特征在于,所述内部参数包括零交叉率参数。10.如权利要求1所述的方法,其特征在于,所述内部参数包括当前帧能量参数。11.如权利要求1所述的方法,其特征在于,所述内部参数包括先行帧能量参数。12.如权利要求1所述的方法,其特征在于,所述内部参数包括带宽能量比参数。13.如权利要求1所述的方法,其特征在于,所述内部参数包括三帧平均的有声能量参数。14.如权利要求1所述的方法,其特征在于,所述内部参数包括前面三帧平均的有声能量参数。15.如权利要求1所述的方法,其特征在于,所述内部参数包括当前帧能量与前面三帧平均有声能量之比的参数。16.如权利要求1所述的方法,其特征在于,所述内部参数包括当前帧能量比三帧平均的有声能量参数。17.如权利要求1所述的方法,其特征在于,所述内部参数包括最大子帧能量索引参数。18.如权利要求1所述的方法,其特征在于,所述设定标准化的自相关系数函数阀值包括将信噪比信息参数与预定的信噪比值相比较。19.如权利要求1所述的方法,其特征在于,所述分析包括将参数应用于状态机。20.如权利要求19所述的方法,其特征在于,所述状态机包括每个语音分类模式的状态。21.如权利要求1所述的方法,其特征在于,所述语音模式分类包括瞬变模式。22.如权利要求1所述的方法,其特征在于,所述语音模式分类包括上瞬变模式。23.如权利要求1所述的方法,其特征在于,所述语音模式分类包括下瞬变模式。24.如权利要求1所述的方法,其特征在于,所述语音模式分类包括有声模式。25.如权利要求1所述的方法,其特征在于,所述语音模式分类包括无声模式。26.如权利要求1所述的方法,其特征在于,所述语音模式分类包括寂静模式。27.如权利要求1所述的方法,其特征在于还包括更新至少一个参数。28.如权利要求27所述的方法,其特征在于,所述经更新的参数包括音调参数处标准化的自相关系数函数。29.如权利要求27所述的方法,其特征在于,所述经更新的参数包括三帧平均的有声能量参数。30.如权利要求27所述的方法,其特征在于,所述经更新的参数包括先行帧能量参数。31.如权利要求27所述的方法,其特征在于,所述经更新的参数包括前三帧平均有声能量参数。32.如权利要求27所述的方法,其特征在于,所述经更新的参数包括声音活动检测参数。33.一种语音分类器,其特征在于包括用于产生分类参数的发生器;标准化的自相关系数函数阀值发生器,用于设定标准化的自相关系数函数阀值并根据信号环境选择...

【专利技术属性】
技术研发人员:P黄
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1