一种基于中文语音的病态嗓音评估方法技术

技术编号：21062716 阅读：60 留言：0更新日期：2019-05-08 08:23

本发明专利技术提供一种基于中文语音的病态嗓音评估方法，包括如下步骤：利用中文自动语言识别系统完成对输入的连续的语音信号和其对应文本的自动对齐，完成音素切分；根据所述音素切分的时间序列，将所述连续语音信号进行切分并分成元音、清辅音和浊辅音，然后进行特征的提取；所述提取的特征组成特征参数集合，所述特征参数集合经过特征选择器的筛选，然后输入分类器，得到嗓音问题的细致评分。该方法使用大规模正常语音数据库训练自动语音识别系统，按照不同音素的发声特点对切分的语音序列进行分类，分别针对不同音素类型设计特征参数，最终得到针对嗓音问题的客观整体评分及各细致评分，为临床诊断和康复治疗提供重要参考。

A Method for Evaluating Sick Voice Based on Chinese Speech

全部详细技术资料下载

【技术实现步骤摘要】
一种基于中文语音的病态嗓音评估方法
本专利技术涉及嗓音检测
，具体涉及一种基于中文语音的病态嗓音评估方法。
技术介绍
嗓音是人类语言沟通的载体。发声系统在声带振动的驱使下发出声音，并通过咽喉、口腔组成的通道传播出来。声音承载不同的信息，是人与人之间沟通必不可少的手段。发声系统发出的声音可以通过波形信号来描述，称为嗓音信号。当发声器官处于正常状态时，声带的振动带有明显的周期规律，咽喉口腔组成的传播通道也有规律的变化，因而产生的嗓音信号也很有规律可循。实际生活中，嗓音不只被用作相互交流信息，而且还用于歌唱，表演，表达情感等等目的。嗓音疾病会对我们的日常交流造成困难，降低沟通效率。嗓音障碍的主要原因有过度用嗓，发音不当，或者发声器官感染疾病。嗓音障碍在嗓音信号上有着明显的体现，例如嗓音的声调、音量、共振峰出现不规则特性，或者嗓音的音质、音色等特征出现明显与说话人的年龄、性别、母语以及文化背景不同的异常变化。在对嗓音障碍的临床诊断和治疗过程中，对嗓音信号进行人工感知评价是一个标准而且重要的无创方法。尽管人工感知评价的评价标准和操作步骤已经发展多年，但是由于缺少足够的有经验的言语治疗师，人工感知评价无法满足现代社会中的需求。基于数字信号处理技术的自动嗓音评估，对于嗓音障碍的临床诊断与治疗有着重要的实际应用价值。其优势包括非侵入性，可重复性，客观性，可靠性等。传统的嗓音分析方法一般只是分析以固定发音位置产生的长元音，这使声学信号分析变得简单，但与连续语言相比，长元音存在以下限制：(1)研究表明，嗓音信号质量受到语言因素的影响，如辅音-元音转换,而这些语言因素在长...

【技术保护点】
1.一种基于中文语音的病态嗓音评估方法，其特征在于，包括如下步骤：S1：利用中文自动语言识别系统完成对输入的连续的语音信号和其对应文本的自动对齐，完成音素切分；S2：根据所述音素切分的时间序列，将所述连续语音信号进行切分并分成元音、清辅音和浊辅音，然后进行特征的提取；S3：所述提取的特征组成特征参数集合，所述特征参数集合经过特征选择器的筛选，然后输入分类器，得到嗓音问题的细致评分。

【技术特征摘要】
1.一种基于中文语音的病态嗓音评估方法，其特征在于，包括如下步骤：S1：利用中文自动语言识别系统完成对输入的连续的语音信号和其对应文本的自动对齐，完成音素切分；S2：根据所述音素切分的时间序列，将所述连续语音信号进行切分并分成元音、清辅音和浊辅音，然后进行特征的提取；S3：所述提取的特征组成特征参数集合，所述特征参数集合经过特征选择器的筛选，然后输入分类器，得到嗓音问题的细致评分。2.如权利要求1所述的基于中文语音的病态嗓音评估方法，其特征在于，所述中文自动语言识别系统是使用正常语音数据库训练基于深度神经网络-隐马尔可夫模型的中文语音识别系统。3.如权利要求1所述的基于中文语音的病态嗓音评估方法，其特征在于，所述中文自动语言识别系统采用了说话人自适应技术。4.如权利要求1所述的基于中文语音的病态嗓音评估方法，其特征在于，所述中文自动语言识别系统使用Viterbi算法将连续的语音信号和其对应文本的音素序列强制对齐以完成音素切分工作。5.如权利要求1所述的基于中文语音的病态嗓音评估方法，其特征在于，所述步骤S2中的所述特征包括：第一类特征：基频抖动，振幅抖动，信号噪声比，音高，能量强度；第二类特征：语音中断，无声信号比值；第三类特征：梅尔倒谱系数；第四类特征：高低频能量比，基频变化量，信号噪声比变化量，连续能量差值，连续能量差值变化量，归一化能量。6.如权利要求5所述的基于中文语音的病态嗓音评估方法，其特征在于，对所述元音提取所述第一类特征、第二类特征和第四类特征的参数；对所述浊辅音提取第二类特征、第三类特征、第四类特征的参数；对所述清辅音提取第三类特征、第四类特征的参数。7.如权利要求5所述的基于中文语音的病态嗓音评估方法，其特征在于，所述第四类特征中：所述高低频能量比HiLo的计算公式为：其中，Ehi为6000HZ以上频段的能量，Elo为6000HZ以下频段的能量，E0为背...

【专利技术属性】
技术研发人员：李丹，刘媛媛，
申请(专利权)人：香港中文大学深圳研究院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人