基于改进声调核模型的汉语语音声调识别方法技术

技术编号:9198946 阅读:141 留言:0更新日期:2013-09-26 03:00
本发明专利技术提出了一种可以提高4种声调平均识别率的方法,该方法为:提出了一种改进的声调核模型;设计了一种自适应提取孤立音节基频曲线声调核的算法,该算法首先移除首尾部分的野值段,然后对经过Viterbi分割及T假设检验合并后的分段结果进行声调核决策,得到声调核。设计了三组利用不同方法进行声调识别的实验,实验A提取整个音节的声学特征进行声调识别,实验B基于传统声调核模型提取声调核的声学特征进行声调识别,实验C利用改进的声调核模型自适应提取声调核的声学特征进行声调识别。实验结果表明利用基于改进的声调核模型提取的声调核进行声调识别可以提高4种声调的平均识别率。

【技术实现步骤摘要】

【技术保护点】
本专利技术提出了一种改进的声调核模型,将孤立音节的基频曲线划分为起始野值段,起始过渡段,声调核,末尾过渡段,末尾野值段五部分;其中起始野值段与末尾野值段属于基频野值,是由于音节分割无法100%准确分离有音部分与无音部分而产生的随机分布的基频值;起始过渡段与末尾过渡段是由复杂的喉部机械生理结构而导致的基频曲线波动,对声调的听辨不起作用;声调核是决定声调类型的关键部分,最能体现声调基频变化的趋势。

【技术特征摘要】

【专利技术属性】
技术研发人员:毛峡魏鹏飞
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利