一种基于聚类的使用语音判断帕金森严重程度检测方法技术

技术编号:20078084 阅读:35 留言:0更新日期:2019-01-15 01:33
本发明专利技术公开了一种基于聚类的使用语音判断帕金森严重程度检测方法,包括如下步骤:1、语音信号的采集;2、语音信号的预处理;3、提取所有的语音特征,包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征;4、模型及计算;5、进行预测:对于聚类的每个分类,载入分类及回归模型;得到分类结果;通过标记值进行患病者的严重程度推测。最后,将预测的结果通过接口,反馈回前端,展示给用户。本发明专利技术是使用计算机软件分析完成的,解决了临床中没有固定指标确定是否患有帕金森的难题,同时也解决了临床观察帕金森周期长,费用高等问题,具有实时,高效又低成本的特点。

A Clustering-based Parkinson Degree Detection Method Using Speech Judgment

The invention discloses a clustering-based Parkinson severity detection method using voice to judge Parkinson's severity, which includes the following steps: 1. acquisition of voice signals; 2. preprocessing of voice signals; 3. extraction of all voice features, including Pitch, Jitter, Shimmer, SNR, non-linear features; 4. model and calculation; 5. pre-processing; Measurement: For each classification of clustering, the classification and regression model are loaded; the classification results are obtained; and the severity of the patients is estimated by the marker values. Finally, the predicted results are fed back to the front end through the interface and displayed to users. The invention is completed by using computer software analysis, which solves the problem of determining whether Parkinson has Parkinson's disease without fixed indexes in clinical practice, and also solves the problems of long period and high cost of clinical observation of Parkinson, and has the characteristics of real-time, high efficiency and low cost.

【技术实现步骤摘要】
一种基于聚类的使用语音判断帕金森严重程度检测方法
本专利技术涉及机器学习、人工智能、语音诊断、数据挖掘,更具体地说,涉及一种基于聚类的使用语音判断帕金森严重程度检测方法。
技术介绍
SVM(SupportVectorMachine)是目前使用最广泛的分类器之一。SVM可以解决的基本问题是二分类问题。它的根本思想是通过凸优化算法从训练数据中找到一个或者一组可以将两类数据分开的超平面。这样,在预测时,就可以通过这组超平面来判断预测数据属于哪一类。目前已有的基于机器学习的帕金森诊断技术只是将帕金森进行诊断分类,判定疑似患者是否患有帕金森病。而帕金森病是一种不可逆转的疾病,所以在实际的生活中不能起到本质解决病人问题的效果。支持向量回归(SupportVectorRegression,SVR),是根据SVM的基本思想改良成的一种回归算法,其主要思想是寻找一个超平面对样本进行映射,与其它的回归算法不同的是其映射与真实值之间的差的绝对值如果小于一个具体的范围,就不计入损失。但是已有技术中还存在的一些缺陷或问题,比如说只能进行是否患有帕金森分类,不能给出患病程度。虽然有专利是通过UPDRS(统一帕金森病评定量表)对帕金森病人评估患病严重程度,但是是进行整体计算与预测,不能根据帕金森患者的情况进行个性化预测。加快了诊断的效率。
技术实现思路
本专利技术给出一种基于聚类的使用语音判断帕金森严重程度检测方法。为了达到上述目的,本专利技术提供一种基于聚类的使用语音判断帕金森严重程度检测方法,包括如下步骤:S1、语音信号的采集选择元音,通过采集设备,采集如下内容:病人编号、姓名、年龄、性别、是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、UPDRS(运动)、UPDRS(整体)、采集日期及时间、当天第几次采集;S2、语音信号的预处理对语音进行语音信号的预处理,包括格式转换,采样频率转换,预加重,加窗和分帧,去除无声部分,进行基频提取;S3、提取所有的语音特征包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征;S4、模型及计算基于支持向量机的分类算法,利用线性可分SVM分类器,以及非线性模型,SVM通过引入核函数建立模型;将S3所得特征数据以及医生给出的信息进行一一对应,行成数据集;使用k-means进行聚类,对于每一个聚类的类别,将数据集按3:1的比例分为训练集和测试集;针对每一个聚类行程的类别,训练集使用支持向量机的分类算法及SVM模型进行分类模型训练,使用支持向量回归SVR方法进行回归模型训练,使用网格搜索方法进行优化模型,将训练好的,每一类别的模型参数进行保存。S5、进行预测对于聚类的每个分类,载入以上训练过程中得到的分类及回归模型;输入需要判断和预测的数据,计算距离判断所属类别,使用该类别对应的模型对数据进行分类计算,得到分类结果。将分类结果再进行处理,对于预测是未患有帕金森病的测试者,将标记值置设为0,对于预测患有帕金森病的测试者,再使用SVR进行回归预测,得到计算出的标记值,通过标记值进行患病者的严重程度推测,结束进程;S6、反馈结果将预测的结果通过接口,反馈回前端,展示给用户。优选方式下,步骤S3中基频特征Pitch采用自相关法来进行基频的提取;对于确定性的信号,短时自相关函数的定义为:然后对于每一帧的自相关函数,需要找到其第一个过零点之后最大的峰值,其对应的下标k值就是该帧语音对应的基音周期,对k取倒数就是基频;一般基频用来表示,由于在语音预处理的时候对语音信号进行了分帧处理,所以每一帧都会有一个对应的,这样就可以得到一个基频序列。而基频特征就是在提取出的基频序列基础上,计算一些简单的统计学的参数。优选方式下,步骤S3中,Jitter用来表示基频的扰动,即基音周期偏离周期的程度,由于音频采用的是持续发音法,且发长元音,可以排除元辅音交替的基频扰动;Jitter计算的时候使用的不是基频,而是基音周期,基音周期定义如下:s.t.n=1,2,...,N(2.1)其中,n表示帧,N代表了帧的总数,指的是第n帧的基频,指的就是第n帧的基音周期;(1)Jitter:即基音周期的相对扰动,是相邻基音周期的差的平均绝对值,与基音周期的平均值的比值,反映了整体受试者对声带振动的相对控制能力;其公式为:(2)Jitter_abs:即基音周期的绝对扰动,就是相邻基音周期的差的平均绝对值,反映了整体受试者对声带振动的绝对控制能力;其公式为:(3)Jitter_PPQ5:即基音周期相邻5点扰动,是某一帧基音周期与其相邻5帧的平均基音周期之差的平均绝对值,一定程度反映了一段时间受试者对声带振动的控制能力;其公式为:(4)Jitter_rap:即基音周期相邻3点扰动,是某一帧基音周期与其相邻3帧的平均基音周期之差的平均绝对值,一定程度反映了一段时间受试者对声带振动的控制能力;其公式为:(5)Jitter_ddp:即基音周期相邻3点扰动之差,是相邻3帧基音周期之间的差的的差值,再求平均绝对值,一定程度反映了一小段时间内受试者对声带振动的控制能力的差值;其公式为:优选方式下,步骤S3中,Shimmer是语音的振幅的扰动,即振幅偏离平均振幅的程度:Shimmer测量的振幅的定义是:A0,n=max(Pn)-min(Pn)(3.1)s.t.n=1,2,...,N其中,序列表示第n帧的语音信号值序列,指第n帧对应的振幅;(1)Shimmer:即振幅扰动(按百分比来算),是相邻振幅的差的平均绝对值,与振幅的平均值的比值,反映了受试者对语音幅度的相对控制能力;其公式为:(2)Shimmer_dB:即振幅扰动(按分贝来算)。是相邻振幅的比值的平均值,只不过单位是分贝dB,反映了受试者对语音幅度的相对控制能力;其公式为:(3)Shimmer_APQ5:即振幅相邻5点扰动,是某一帧振幅与其相邻5帧的平均振幅之差的平均绝对值,一定程度反映了一段时间受试者对语音幅度的控制能力;其公式为:(4)Shimmer_APQ3:即振幅相邻3点扰动,是某一帧振幅与其相邻3帧的平均振幅之差的平均绝对值,一定程度反映了一段时间受试者对语音幅度的控制能力;其公式为:(5)Shimmer_dda:即振幅相邻3点扰动之差,是相邻3帧振幅之间的差值之差,再求平均绝对差值,一定程度反映了一小段时间内受试者对语音幅度的控制能力的差值;其公式为:(6)Shimmer_APQ11:即振幅相邻11点扰动,是某一帧振幅与其相邻11帧的平均振幅之差的平均绝对值,一定程度反映了一大段时间受试者对语音幅度的控制能力;其公式为:优选方式下,步骤S3中,非线性特征为有去趋势波动分析DFA、复发周期密度熵RPDE、基频周期熵PPE。本专利技术是使用计算机软件分析完成的,解决了临床中没有固定指标确定是否患有帕金森的难题,同时也解决了临床观察帕金森周期长,费用高等问题,具有实时,高效又低成本的特点。这个基于聚类的使用语音判断帕金森严重程度检测的方法,不仅能够通过语音的方式对被测试者是否患有帕金森病进行判断,还可以通过预测的UPDRS值进行被测试者患帕金森严重程度的判断,通过聚类的方法行成多个类别,小类别类进行预测和回归可以显著提高预测的准确率。可以通过预测的结果,来决策接本文档来自技高网...

【技术保护点】
1.一种基于聚类的使用语音判断帕金森严重程度检测方法,其特征在于,包括如下步骤:S1、语音信号的采集选择元音,通过采集设备,采集如下内容:病人编号、姓名、年龄、性别、是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、UPDRS(运动)、UPDRS(整体)、采集日期及时间、当天第几次采集;S2、语音信号的预处理对语音进行语音信号的预处理,包括格式转换,采样频率转换,预加重,加窗和分帧,去除无声部分,进行基频提取;S3、提取所有的语音特征包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征;S4、模型及计算基于支持向量机的分类算法,利用线性可分SVM分类器,以及非线性模型,SVM通过引入核函数建立模型;将S3所得特征数据以及医生给出的信息进行一一对应,行成数据集;使用k‑means进行聚类,对于每一个聚类的类别,将数据集按3:1的比例分为训练集和测试集;针对每一个聚类行程的类别,训练集使用支持向量机的分类算法及SVM模型进行分类模型训练,使用支持向量回归SVR方法进行回归模型训练,使用网格搜索方法进行优化模型,将训练好的,每一类别的模型参数进行保存。S5、进行预测对于聚类的每个分类,载入以上训练过程中得到的分类及回归模型;输入需要判断和预测的数据,计算距离判断所属类别,使用该类别对应的模型对数据进行分类计算,得到分类结果。将分类结果再进行处理,对于预测是未患有帕金森病的测试者,将标记值置设为0,对于预测患有帕金森病的测试者,再使用SVR进行回归预测,得到计算出的标记值,通过标记值进行患病者的严重程度推测,结束进程;S6、反馈结果将预测的结果通过接口,反馈回前端,展示给用户。...

【技术特征摘要】
2018.03.30 CN 201810276038X1.一种基于聚类的使用语音判断帕金森严重程度检测方法,其特征在于,包括如下步骤:S1、语音信号的采集选择元音,通过采集设备,采集如下内容:病人编号、姓名、年龄、性别、是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、UPDRS(运动)、UPDRS(整体)、采集日期及时间、当天第几次采集;S2、语音信号的预处理对语音进行语音信号的预处理,包括格式转换,采样频率转换,预加重,加窗和分帧,去除无声部分,进行基频提取;S3、提取所有的语音特征包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征;S4、模型及计算基于支持向量机的分类算法,利用线性可分SVM分类器,以及非线性模型,SVM通过引入核函数建立模型;将S3所得特征数据以及医生给出的信息进行一一对应,行成数据集;使用k-means进行聚类,对于每一个聚类的类别,将数据集按3:1的比例分为训练集和测试集;针对每一个聚类行程的类别,训练集使用支持向量机的分类算法及SVM模型进行分类模型训练,使用支持向量回归SVR方法进行回归模型训练,使用网格搜索方法进行优化模型,将训练好的,每一类别的模型参数进行保存。S5、进行预测对于聚类的每个分类,载入以上训练过程中得到的分类及回归模型;输入需要判断和预测的数据,计算距离判断所属类别,使用该类别对应的模型对数据进行分类计算,得到分类结果。将分类结果再进行处理,对于预测是未患有帕金森病的测试者,将标记值置设为0,对于预测患有帕金森病的测试者,再使用SVR进行回归预测,得到计算出的标记值,通过标记值进行患病者的严重程度推测,结束进程;S6、反馈结果将预测的结果通过接口,反馈回前端,展示给用户。2.根据权利要求1所述基于聚类的使用语音判断帕金森严重程度检测方法,其特征在于,步骤S3中基频特征Pitch采用自相关法来进行基频的提取;对于确定性的信号,短时自相关函数的定义为:然后对于每一帧的自相关函数,需要找到其第一个过零点之后最大的峰值,其对应的下标k值就是该帧语音对应的基音周期,对k取倒数就是基频;一般基频用来表示,由于在语音预处理的时候对语音信号进行了分帧处理,所以每一帧都会有一个对应的,这样就可以得到一个基频序列。而基频特征就是在提取出的基频序列基础上,计算一些简单的统计学的参数。3.根据权利要求1所述基于聚类的使用语音判断帕金森严重程度检测方法,其特征在于,步骤S3中,Jitter用来表示基频的扰动,即基音周期偏离周期的程度,由于音频采用的是持续发音法,且发长元音,可以排除元辅音交替的基频扰动;Jitter计算的时候使用的不是基频,而是基音周期,基音周期定义如下:其中,n...

【专利技术属性】
技术研发人员:宝颜鹏金博魏小鹏
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1