当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于建模语音频谱的系统和方法技术方案

技术编号:5470531 阅读:220 留言:0更新日期:2012-04-11 18:40
一种用于以话音贡献和非话音贡献二者能够共存于某频率的方式建模语音的系统和方法。在多种实施方式中,使用三种频带(或高达三种不同类型的频带)。在一个实施方式中,最低频带或频带组完全是话音的,中间频带或频带组包含话音贡献和非话音贡献两者,而最高频带或频带组是完全非话音的。可将本发明专利技术的实施方式用于语音编码和其它语音处理应用。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体涉及语音处理。更特别地,本专利技术涉及诸如语音编 码、话音转换和文本到语音合成的语音处理应用。
技术介绍
本部分意在提供在权利要求书中陈述的本专利技术的背景或上下 文。本文的描述可包括将被贯彻的概念,但前面被表达和贯彻的内 容并非是必须的。因而,除非在本文指出,在此部分所描述的并非 是在该申请中的说明书和权利要求书的现有技术,以及并非通过包 含于此部分内而承认其为现有技术。许多语音模型依赖于基于线性预测(LP)的方法,其中使用 LP系数对声道(vocal tract)进行建模。继而,使用进一步的技术对 激励信号(即,LP残差(residual))建模。下面是一些传统技术。 第一,可将激励建模为周期性脉冲(在话音语音(voiced speech )期 间)或者噪声(在非话音语音(unvoiced speech )期间)。然而,由 于话音/非话音硬决策,限制了可获得的质量。第二,可使用激励频 谱对激励建模,其将在时变的截止频率之下的激励频谱认为是话音 的,而将在该频率之上的激励频谱认为是非话音的。这种频带切分 方法能够在语音信号的许多部分上令人满意地执行,但是问题依然 出本文档来自技高网...

【技术保护点】
一种获得语音帧模型的方法,包括: 获得对所述语音帧的频谱估计; 为在所估计的频谱内的每个频点分配调声似然值; 标识包括具有第一集合的调声似然值的频点的至少一个话音频带; 标识包括具有第二集合的调声似然值的频点的至少一 个非话音频带; 标识包括具有第三集合的调声似然值的频点的至少一个混合频带; 创建针对频点的所述至少一个混合频带的调声形状。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J尼尔米南S伊玛南
申请(专利权)人:诺基亚公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利