基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法及系统技术方案

技术编号:32975028 阅读:61 留言:0更新日期:2022-04-09 11:50
本发明专利技术公开了一种基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法。步骤一、采集帕金森病患者持续稳定的元音,并记录帕金森病患者是否有冻结步态症状;步骤二、对语音信号进行去噪预处理,并去除静音片段;步骤三、提取多种语音特征;步骤四、利用CART算法对原始特征进行特征选择,筛选出能够有效表征冻结步态症状信息的关键特征;步骤五、训练AdaBoost模型;步骤六、将待测语音的特征向量输入模型,得到帕金森病冻结步态症状的关键特征参数。本发明专利技术使用AdaBoost算法来进行帕金森病冻结步态症状的分析,利用集成学习提高模型精度,降低了帕金森病冻结步态症状早期分析的成本。分析的成本。分析的成本。

【技术实现步骤摘要】
基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法及系统


[0001]本专利技术属于机器学习领域在医学方面的应用,涉及一种基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法及系统。

技术介绍

[0002]帕金森病是仅次于阿尔茨海默病的第二大神经退行性疾病,其主要症状包括运动症状和非运动症状,运动症状包含肌肉僵硬、震颤以及其他一些运动障碍,非运动症状主要包含嗅觉减退、便秘、睡眠行为异常以及抑郁等。这些症状是由大量的多巴胺能神经元的减少而引起的。
[0003]冻结步态是帕金森病最严重的运动障碍症状之一,指患者企图行走时或前进过程中步伐短暂、突然中止或明显减少,最常见的症状表现为患者起始犹豫,迈步受阻,突然难以行走。冻结步态具有致残性,大部分患者在症状出现平均五年后需要借助轮椅活动,极大地影响患者的生活质量。
[0004]已有的研究表明,帕金森病和发音障碍之间有一定的病理联系。语音损伤可能是帕金森病最早的征兆之一,其症状表现为讲话缓慢、声音嘶哑、音量低和发音震颤等。这些语音损伤是由于帕金森病患者喉部的,发音的以及呼吸肌肉的控制损失引起的。
[0005]语音主要通过体内发声器官合作产生,而人体器官之间的合作是由神经元统一协调控制的。帕金森病患者由于相关神经元损失导致无法稳定控制发声器官,使得患者均有不同程度的发声障碍。与健康人相比,帕金森病患者往往不能发出平稳准确的声音。因此可以利用语音信号对帕金森病进行早期症状分析。与传统的帕金森病分析方法相比,利用语音信号来分析帕金森病经济高效,语音的监测是非接触式的,且简单方便。对于发音,可以使用持续的元音/a/、/i/、/o/。持续的元音/a/是最容易发出的,并且经验证明它最能传达临床有用的信息。生理上,元音/a/涉及到声带和声道中各种肌肉的组合,因此它增加了神经问题能够被鉴别出的概率。利用语音信号分析帕金森病时需要通过语音信号处理算法来对待测语音信号进行分析,以提取能够表征帕金森病病理特征的语音特征信息。
[0006]基于上述情况,通过语音信号处理算法提取出语音特征后,提取得到的语音特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相关性,容易导致维数灾难。特征选择能剔除不相关或冗余的特征,选择出对当前分类任务有用的关键特征,从而达到提高模型精确度,减少模型预测的时间,提供具有一定可解释性的关键特征的目的。之后便可以利用机器学习领域的技术模型进行帕金森病冻结步态症状的分析。

技术实现思路

[0007]本专利技术针对传统的帕金森病冻结步态症状分析困难的问题,提出了一种基于AdaBoost的帕金森病冻结步态症状关键特征参数的语音分析方法及系统。对采集到的语音信号进行特征提取,并进行可解释特征选择,再结合机器学习中的集成学习算法对帕金森
病患者进行冻结步态的分析,实现帕金森病患者冻结步态症状的可解释关键特征分析,以期及时采取后续的特定治疗策略。
[0008]为了实现以上目的,本专利技术方法包括以下步骤:
[0009]步骤一、采集帕金森病患者持续稳定的元音,记录帕金森病患者是否有冻结步态症状。
[0010]步骤二、对语音信号进行去噪处理,去除静音片段。
[0011]步骤三、利用语音信号处理算法提取多种语音特征。
[0012]利用语音信号处理算法提取语音特征,提取的特征包括:基频轮廓F0_contour、平均基频F0_ave、最小基频F0_min、最大基频F0_max,四个衡量基频变化的特征Jitter、RAP、PPQ、DDP,五个衡量振幅变化的特征Shimmer、APQ3、APQ5、APQ11、DDA,噪声谐波比NHR、谐波噪声比HNR、循环周期密度熵RPDE、趋势波动分析DFA、基因周期熵PPE,以及对特征在梅尔倒谱域进行转换得到的梅尔频率倒谱系数MFCC。
[0013]步骤四、利用CART算法进行特征选择,筛选出能够有效表征冻结步态症状信息的具有可解释性的关键特征。
[0014]利用CART算法进行特征选择,具体过程为:
[0015]数据集D的基尼指数Gini(D)的具体公式为:
[0016][0017]其中p
k
表示样本点属于第k类的概率,K表示K个分类问题;
[0018]特征a的基尼指数Gini
index
(D,a)定义为:
[0019][0020]其中V代表特征a有V个可能取值;因此,选择使得划分后基尼指数最小的特征取值作为最优划分特征a
*
,即:
[0021]a
*
=argmax
a∈A
Gini
index
(D,a)(3)
[0022]步骤五、训练AdaBoost模型。
[0023]步骤六、语音分析:将待测语音的特征向量输入模型,得到待测者冻结步态症状的关键特征参数。
[0024]本专利技术还公开了一种基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析系统,所述系统包括:
[0025]语音信号采集模块,用于执行步骤一、语音信号的采集:采集帕金森病患者持续稳定的元音,记录帕金森病患者是否有冻结步态症状;
[0026]语音信号处理模块,用于执行步骤二、语音信号的预处理:对语音信号进行去噪处理,并去除静音片段;
[0027]语音特征提取模块,用于执行步骤三、语音特征提取:利用语音信号处理算法提取多种语音特征;;
[0028]语音特征选择模块,用于执行步骤四、特征选择:利用CART算法进行特征选择,筛选出能够表征冻结步态症状的关键特征;
[0029]AdaBoost分类模型训练模块,用于执行步骤五、训练模型:采用决策树作为基分类器训练AdaBoost分类模型;
[0030]语音分析模块,用于执行步骤六、语音分析:将待测语音的特征向量输入模型,得到待测者冻结步态症状的关键特征参数。
[0031]本专利技术提供的基于AdaBoost算法的帕金森病冻结步态语音分析方法,其有益效果在于:
[0032]1、降低了帕金森病患者冻结步态早期分析的成本。因为本专利技术是通过对语音信号进行特征提取,再利用机器学习方法来进行冻结步态症状分析的,避免了去医院进行诊断的较高费用,而只需要获取语音信号以及帕金森病患者步态特征信息进行模型建立,然后即可进行冻结步态症状早期分析,节省了诊断成本。
[0033]2、提高了帕金森病冻结步态症状分析的效率。传统帕金森病分析方法是通过医生对患者进行一系列运动、震颤等方面的测试并根据患者表现综合分析患者是否具有帕金森病的冻结步态症状,其患病程度以及可能的病情发展趋势,疾病分析手段复杂且费时。本专利技术则是通过机器学习方法得到的,并且通过对语音特征进行有效选择,可以降低输入语音特征向量的维度,提高了机器学习算法程序分析效率。
[0034]3、提供了可靠的帕金森病冻结步态症状关键特征参数分析手段。传统的冻结步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于AdaBoost算法的帕金森病冻结步态症状关键特征参数的语音分析方法,其特征在于,是按以下步骤进行的:步骤一、语音信号的采集:采集帕金森病患者持续稳定的元音,记录帕金森病患者是否有冻结步态症状;步骤二、语音信号的预处理:对语音信号进行去噪处理,并去除静音片段;步骤三、语音特征提取:利用语音信号处理算法提取多种语音特征;步骤四、特征选择:利用CART算法进行特征选择,筛选出能够表征冻结步态症状的关键特征;步骤五、训练模型:采用决策树作为基分类器训练AdaBoost分类模型;步骤六、语音分析:将待测语音的特征向量输入模型,得到待测者冻结步态症状的关键特征参数。2.根据权利要求1所述的方法,其特征在于,所述步骤三具体过程为:利用语音信号处理算法提取多种语音特征,提取的特征包括:基频轮廓F0_contour、平均基频F0_ave、最小基频F0_min、最大基频F0_max,四个衡量基频变化的特征Jitter、RAP、PPQ、DDP,五个衡量振幅变化的特征Shimmer、Shimmer:APQ3、Shimmer:APQ5、Shimmer:APQ11、Shimmer:DDA,噪声谐波比NHR、谐波噪声比HNR、循环周期密度熵RPDE、趋势波动分析DFA、基因周期熵PPE;以及语音在梅尔倒谱域转换得到的梅尔倒谱系数MFCC。3.根据权利要求1所述的方法,其特征在于,所述步骤四具体过程为:数据集D的基尼指数Gini(D)的具体公式为:其中p
k
表示样本点属于第k类的概率,K表示K个分类问题;特征a的基尼指数Gini
index
(D,a)定义为:其中V代表特征a有V个可能取值;因此,选择使得划分后基尼指数最小的特征取值作为最优划分特征a
*
,即:a
*
=argmax
a∈A
Gini
index
(D,a)。4.根据权利要求1所述的方法,其特征在于,所述步骤五具体过程为:1)初始化训练数据的权值分布,每一个训练样本开始时都被赋予相同的权重:1/N;其中w
1i
表示第j个训练样本开始时的权重,N表示样本总数;2)进行M次迭代,每次迭代进行以下步骤:a.使用具有权值分布D
m
的训练数据集进行学习,得到基分类器G
m
(x):G
m
(x):χ

{

1,+1}b.计算G
m

【专利技术属性】
技术研发人员:李云王晨哲季薇王传瑜杨茗淇符宇辰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1