一种高效的帕金森病数据集分类方法技术

技术编号:23513966 阅读:36 留言:0更新日期:2020-03-18 00:50
本发明专利技术提供了一种高效的帕金森病数据集分类方法。其特征在于将测试样本分别通过健康人语音特征集和患者语音特征集进行线性表达,并计算表达之后的特征样本与原特征样本之间的误差,则测试样本的分类类别与误差较小者类别保持一致。本发明专利技术主要基于常规的矩阵线性计算,在工程实现上能够有效依赖成熟的函数库或计算单元,因此其效率极高具有很好的工程性能。

An efficient data set classification method for Parkinson's disease

【技术实现步骤摘要】
一种高效的帕金森病数据集分类方法
本专利技术涉及帕金森病数据集分类方法,特别是一种基于常规矩阵线性计算的高效帕金森病数据集分类方法。
技术介绍
帕金森病是一种多发于中老年的渐进性中枢神经系统变性疾病,在帕金森病患者中,有50%~80%的病例起病隐袭,早期难以察觉而常被忽视,检测语言障碍将有助于实现高准确性的帕金森病早期诊断,现有基于语音特征的帕金森病数据集分类方法虽然已能取得较好效果但算法复杂度较高,并不利于工程实现,本专利技术实现的方法能够有效依赖成熟的函数库或计算单元,具有很好的工程性能。
技术实现思路
针对现有技术,本专利技术提供了一种高效的帕金森病数据集分类方法。该方法包括以下步骤:(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵(2)语音特征集变换。变换后语音特征集为其中(3)零均值(z-score)标准化S′生成新集合S″;(4)将标准数据集S″按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,其中标签bm∈{0,1};(5)求解系数并满足其中训练集AH是健康人特征样本矩阵,AP是患者特征样本矩阵,则其中分别是AH,AP的伪逆;(6)计算偏差并分类:和其中估计样本若δ1<δ2则测试集属于健康人组,否则属于患者组。(7)将(6)中得到的测试集类别与测试集标签类别进行比较,并遍历M个受试者得到平均分类准确率。附图说明图1是根据本专利技术的一个实施例构成的系统方框图;具体实施方式本专利技术提出的帕金森病数据集分类方法结合附图及实施例进一步说明如下:本专利技术的方法流程如图1所示,包括以下步骤:(1)样本数据集由M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征构成;(2)样本数据集进行转换构成特征矩阵;(3)零均值(z-score)标准化训练集生成新集合;(4)将特征矩阵按留一法划分为训练集和测试集;(5)求解表达系数并重新估计样本;(6)通过比较偏差大小判决测试集类别;(7)将(6)中得到的测试集类别与测试集标签类别进行比较得到分类准确率,并遍历M个受试者得到平均分类准确率。本专利技术的上述技术方案与现有技术方案相比较,具有以下优点:A、相比已有方法计算复杂度极低;B、可利用成熟的函数库或计算单元,有利于工程实现;本专利技术上述方法各步骤的具体实施例详细说明如下:上述训练过程步骤(1)中数据集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对象包含了H0=26个语音样本,具体样本参考表1,每一个语音样本设置N=26个特征,具体特征参考[1]:B.E.Sakar,M.E.Isenkul,C.O.Sakar,A.Sertbas,F.Gurgen,S.Delil,H.Apaydin,O.Kursun.CollectionandanalysisofaParkinsonspeechdatasetwithmultipletypesofsoundrecordings.IEEEJournalofBiomedical&HealthInformatics.17,828-834(2013).来设定。表1:语音样本信息样本序列样本描述第1个持续元音aaa第2个持续元音ooo第3个持续元音uuu第4个~第13个数字1~10第14个~第17个预设的短句第18个~第26个预设的单词上述训练过程步骤(5)中伪逆求解,可先进行奇异值分解AH=UΣV*,再计算得AH的伪逆同理可计算得AP的伪逆,奇异值分解是本专利技术计算复杂度最高的部分,可依赖现成的函数模块实现。上述训练过程步骤(7)中分类准确率计算方法:当计算得到的测试集分类准确率与标签类别一致则分类准确率ratem=1,否则为ratem=0,则平均分类准确率M为受试者人数。本文档来自技高网...

【技术保护点】
1.一种高效的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:/n(1)对M个受试者(M

【技术特征摘要】
1.一种高效的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:
(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵



(2)语音特征集变换。变换后语音特征集为
其中
(3)零均值(z-score)标准化S′生成新集合S″;
(4)将标准数据集S″按留一法划分为训练集及相应...

【专利技术属性】
技术研发人员:张小恒
申请(专利权)人:重庆工商职业学院
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1