一种基于聚类的使用语音判断帕金森严重程度检测方法技术

技术编号：20078084 阅读：35 留言：0更新日期：2019-01-15 01:33

本发明专利技术公开了一种基于聚类的使用语音判断帕金森严重程度检测方法，包括如下步骤：1、语音信号的采集；2、语音信号的预处理；3、提取所有的语音特征，包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征；4、模型及计算；5、进行预测：对于聚类的每个分类，载入分类及回归模型；得到分类结果；通过标记值进行患病者的严重程度推测。最后，将预测的结果通过接口，反馈回前端，展示给用户。本发明专利技术是使用计算机软件分析完成的，解决了临床中没有固定指标确定是否患有帕金森的难题，同时也解决了临床观察帕金森周期长，费用高等问题，具有实时，高效又低成本的特点。

A Clustering-based Parkinson Degree Detection Method Using Speech Judgment

The invention discloses a clustering-based Parkinson severity detection method using voice to judge Parkinson's severity, which includes the following steps: 1. acquisition of voice signals; 2. preprocessing of voice signals; 3. extraction of all voice features, including Pitch, Jitter, Shimmer, SNR, non-linear features; 4. model and calculation; 5. pre-processing; Measurement: For each classification of clustering, the classification and regression model are loaded; the classification results are obtained; and the severity of the patients is estimated by the marker values. Finally, the predicted results are fed back to the front end through the interface and displayed to users. The invention is completed by using computer software analysis, which solves the problem of determining whether Parkinson has Parkinson's disease without fixed indexes in clinical practice, and also solves the problems of long period and high cost of clinical observation of Parkinson, and has the characteristics of real-time, high efficiency and low cost.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于聚类的使用语音判断帕金森严重程度检测方法
本专利技术涉及机器学习、人工智能、语音诊断、数据挖掘，更具体地说，涉及一种基于聚类的使用语音判断帕金森严重程度检测方法。
技术介绍
SVM(SupportVectorMachine)是目前使用最广泛的分类器之一。SVM可以解决的基本问题是二分类问题。它的根本思想是通过凸优化算法从训练数据中找到一个或者一组可以将两类数据分开的超平面。这样，在预测时，就可以通过这组超平面来判断预测数据属于哪一类。目前已有的基于机器学习的帕金森诊断技术只是将帕金森进行诊断分类，判定疑似患者是否患有帕金森病。而帕金森病是一种不可逆转的疾病，所以在实际的生活中不能起到本质解决病人问题的效果。支持向量回归(SupportVectorRegression，SVR)，是根据SVM的基本思想改良成的一种回归算法，其主要思想是寻找一个超平面对样本进行映射，与其它的回归算法不同的是其映射与真实值之间的差的绝对值如果小于一个具体的范围，就不计入损失。但是已有技术中还存在的一些缺陷或问题，比如说只能进行是否患有帕金森分类，不能给出患病程度。虽然有专利是通过UPDRS(统一帕金森病评定量表)对帕金森病人评估患病严重程度，但是是进行整体计算与预测，不能根据帕金森患者的情况进行个性化预测。加快了诊断的效率。
技术实现思路
本专利技术给出一种基于聚类的使用语音判断帕金森严重程度检测方法。为了达到上述目的，本专利技术提供一种基于聚类的使用语音判断帕金森严重程度检测方法，包括如下步骤：S1、语音信号的采集选择元音，通过采集设备，采集如下内容：病人编号、姓名、年龄、...

【技术保护点】
1.一种基于聚类的使用语音判断帕金森严重程度检测方法，其特征在于，包括如下步骤：S1、语音信号的采集选择元音，通过采集设备，采集如下内容：病人编号、姓名、年龄、性别、是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、UPDRS(运动)、UPDRS(整体)、采集日期及时间、当天第几次采集；S2、语音信号的预处理对语音进行语音信号的预处理，包括格式转换，采样频率转换，预加重，加窗和分帧，去除无声部分，进行基频提取；S3、提取所有的语音特征包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征；S4、模型及计算基于支持向量机的分类算法，利用线性可分SVM分类器，以及非线性模型，SVM通过引入核函数建立模型；将S3所得特征数据以及医生给出的信息进行一一对应，行成数据集；使用k‑means进行聚类，对于每一个聚类的类别，将数据集按3:1的比例分为训练集和测试集；针对每一个聚类行程的类别，训练集使用支持向量机的分类算法及SVM模型进行分类模型训练，使用支持向量回归SVR方法进行回归模型训练，使用网格搜索方法进行优化模型，将训练好的，每一类别的模型参数进...

【技术特征摘要】
2018.03.30 CN 201810276038X1.一种基于聚类的使用语音判断帕金森严重程度检测方法，其特征在于，包括如下步骤：S1、语音信号的采集选择元音，通过采集设备，采集如下内容：病人编号、姓名、年龄、性别、是否确诊为帕金森、是否有其他导致语音障碍的疾病、患病时间、UPDRS(运动)、UPDRS(整体)、采集日期及时间、当天第几次采集；S2、语音信号的预处理对语音进行语音信号的预处理，包括格式转换，采样频率转换，预加重，加窗和分帧，去除无声部分，进行基频提取；S3、提取所有的语音特征包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征；S4、模型及计算基于支持向量机的分类算法，利用线性可分SVM分类器，以及非线性模型，SVM通过引入核函数建立模型；将S3所得特征数据以及医生给出的信息进行一一对应，行成数据集；使用k-means进行聚类，对于每一个聚类的类别，将数据集按3:1的比例分为训练集和测试集；针对每一个聚类行程的类别，训练集使用支持向量机的分类算法及SVM模型进行分类模型训练，使用支持向量回归SVR方法进行回归模型训练，使用网格搜索方法进行优化模型，将训练好的，每一类别的模型参数进行保存。S5、进行预测对于聚类的每个分类，载入以上训练过程中得到的分类及回归模型；输入需要判断和预测的数据，计算距离判断所属类别，使用该类别对应的模型对数据进行分类计算，得到分类结果。将分类结果再进行处理，对于预测是未患有帕金森病的测试者，将标记值置设为0，对于预测患有帕金森病的测试者，再使用SVR进行回归预测，得到计算出的标记值，通过标记值进行患病者的严重程度推测，结束进程；S6、反馈结果将预测的结果通过接口，反馈回前端，展示给用户。2.根据权利要求1所述基于聚类的使用语音判断帕金森严重程度检测方法，其特征在于，步骤S3中基频特征Pitch采用自相关法来进行基频的提取；对于确定性的信号，短时自相关函数的定义为：然后对于每一帧的自相关函数，需要找到其第一个过零点之后最大的峰值，其对应的下标k值就是该帧语音对应的基音周期，对k取倒数就是基频；一般基频用来表示，由于在语音预处理的时候对语音信号进行了分帧处理，所以每一帧都会有一个对应的，这样就可以得到一个基频序列。而基频特征就是在提取出的基频序列基础上，计算一些简单的统计学的参数。3.根据权利要求1所述基于聚类的使用语音判断帕金森严重程度检测方法，其特征在于，步骤S3中，Jitter用来表示基频的扰动，即基音周期偏离周期的程度，由于音频采用的是持续发音法，且发长元音，可以排除元辅音交替的基频扰动；Jitter计算的时候使用的不是基频，而是基音周期，基音周期定义如下：其中，n...

【专利技术属性】
技术研发人员：宝颜鹏，金博，魏小鹏，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人