一种基于矢量空间的帕金森病数据集分类方法技术

技术编号:23446526 阅读:15 留言:0更新日期:2020-02-28 20:31
本发明专利技术提供了一种矢量空间下的帕金森病分类方法。其特征在于利用测试样本到健康人语音特征集向量空间质心与患者语音特征集向量空间质心欧式距离远近不同判别测试样本的所属类别。本发明专利技术实现了一种算法复杂度很低而不失准确率的帕金森病数据集分类方法。

A method of data set classification of Parkinson's disease based on vector space

【技术实现步骤摘要】
一种基于矢量空间的帕金森病数据集分类方法
本专利技术涉及帕金森病数据集分类方法,特别是一种矢量空间下的帕金森病数据集分类方法。
技术介绍
帕金森病是一种多发于中老年的渐进性中枢神经系统变性疾病,在帕金森病患者中,有50%~80%的病例起病隐袭,早期难以察觉而常被忽视,检测语言障碍将有助于实现高准确性的帕金森病早期诊断,现有基于语音特征的帕金森病数据集分类方法算法复杂度很高,并不利于工程实现,本专利技术实现了一种算法复杂度很低而不失准确率的帕金森病数据集分类方法。
技术实现思路
针对现有技术,本专利技术提供了一种矢量空间下算法复杂度低而不失准确率的帕金森病数据集分类方法。该方法包括以下步骤:(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵其中(2)语音特征集变换。变换后语音特征集为其中(3)将变换后的数据集S′按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,其中标签bm∈{0,1};(4)零均值(z-score)标准化训练集生成新集合xstd,并在xstd的矢量空间中计算健康人语音特征集向量空间质心及患者语音特征集向量空间质心(5)计算xt与xp,xq的欧式距离xt的所属类别为Class(min(dt,p,dt,q)),即类别与距离较近一方保持一致;(6)按留一法遍历所有样本计算帕金森病分类准确率其中Class(min(dt,p,dt,q))为测试样本预测类别,bt为测试样本实际类别;附图说明图1是根据本专利技术的一个实施例构成的系统方框图;具体实施方式本专利技术提出的矢量空间下的帕金森病数据集分类方法结合附图及实施例进一步说明如下:本专利技术的方法流程如图1所示,包括以下步骤:(1)样本数据集由M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征构成;(2)样本数据集进行转换构成特征矩阵;(3)将特征矩阵按留一法划分为训练集和测试集;(4)零均值(z-score)标准化训练集生成新集合xstd,并在xstd的矢量空间中计算健康人语音特征集向量空间质心及患者语音特征集向量空间质心计算xt与xp,xq的欧式距离xt的所属类别为class(min(xp,xq)),即类别与距离较近一方保持一致;(5)按留一法遍历所有样本计算帕金森病分类准确率本专利技术的上述技术方案与现有技术方案相比较,具有以下优点:A、相比已有方法计算复杂度极低;B、准确率较高;本专利技术上述方法各步骤的具体实施例详细说明如下:上述训练过程步骤(1)中数据集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对象包含了H0=26个语音样本,具体样本参考表1,每一个语音样本设置N=26个特征,具体特征参考[1]:B.E.Sakar,M.E.Isenkul,C.O.Sakar,A.Sertbas,F.Gurgen,S.Delil,H.Apaydin,O.Kursun.CollectionandanalysisofaParkinsonspeechdatasetwithmultipletypesofsoundrecordings.IEEEJournalofBiomedical&HealthInformatics.17,828-834(2013).来设定。表1:语音样本信息样本序列样本描述第1个持续元音aaa第2个持续元音ooo第3个持续元音uuu第4个~第13个数字1~10第14个~第17个预设的短句第18个~第26个预设的单词本文档来自技高网...

【技术保护点】
1.一种基于矢量空间的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:/n(1)对M个受试者(M

【技术特征摘要】
1.一种基于矢量空间的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:
(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵其中
(2)语音特征集变换。变换后语音特征集为
其中
(3)将变换后的数据集S′按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,其中标签bm∈{0,1};
(4)零均值(z-s...

【专利技术属性】
技术研发人员:张小恒
申请(专利权)人:重庆工商职业学院
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1