结合韵律和发音学特征的汉语声调识别系统及方法技术方案

技术编号:8348201 阅读:234 留言:0更新日期:2013-02-21 02:12
本发明专利技术公开了一种结合韵律和发音学特征汉语声调识别方法及系统,该方法包括以下步骤:接收语音信号,并提取语音信号的倒谱特征、基频值和能量值;根据所述倒谱特征生成携带音节边界信息的语音序列;根据所述基频值、能量值和所述音节边界信息抽取每一音节对应的基频值和能量值,根据所述每一音节对应的基频值和能量值,计算每一音节的韵律特征;根据所述倒谱特征序列和所述音节边界信息,提取音节的发音方式特征;根据所述韵律特征和所述发音方式特征判断所述语音信号中每一音节的声调类型。本发明专利技术还涉及了一种相应地汉语声调识别系统。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,尤其涉及一种结合韵律和发音学特征的汉语声调识别系统和方法。
技术介绍
与英语等西方国家语言不同,汉语是一种带声调的语言。声调是汉语普通话的一种重要属性,在一定程度上承担着构字辨义的作用。同一个音节,如果其声调不同,那么其代表的含义完全不同,对应着不同的汉语字,例如妈、麻、马、骂。汉语中存在四种声调,分别是阴平、阳平、上声、去声,或者称为一声、二声、三声、四声。另外,轻声在语音识别技术中常常也被看作是一种声调。在语音识别中,对于发音相同或相似的音节,声调能够提供重要的区分性信息。汉 语语音识别中声调能够提供区分性信息主要体现两方面一是具有相同音节的不同汉语字,声调信息是区分它们的唯一属性;二是对应的音节虽然不同但发音相近的汉语字,例如对应音节的声母不同但韵母相同,声调信息同样也是区分它们的重要属性。在现有语音识别系统性能的提高已经达到一定瓶颈的情况下,近年来研究人员对如何利用声调信息来提高语音识别系统的性能进行了不同的尝试,并取得了较好的效果。目前的声调识别方法是根据音节所对应的语音信号的基频,能量以及时长等韵律信息来判断该音节的声调类型,而没有考虑到人发本文档来自技高网...

【技术保护点】
一种汉语声调识别方法,其具体包括以下步骤:步骤1、接收语音信号,并提取语音信号的倒谱特征、基频值和能量值;步骤2、根据所述倒谱特征生成携带音节边界信息的语音序列;其中,所述音节边界信息包括音节发音开始时刻和音节发音结束时刻,以及音节中的声母和韵母的发音开始时刻和发音结束时刻;步骤3、根据所述基频值、能量值和所述音节边界信息抽取每一音节对应的基频值和能量值,根据所述每一音节对应的基频值和能量值,计算每一音节的韵律特征;步骤4、根据所述倒谱特征序列和所述音节边界信息,提取音节的发音方式特征;步骤5、根据所述韵律特征和所述发音方式特征判断所述语音信号中每一音节的声调类型。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘文举晁浩
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1