【技术实现步骤摘要】
基于集成流形降维的帕金森语音识别系统
本专利技术涉及智慧医疗技术,具体地说,是一种基于集成流形降维的帕金森语音识别系统。
技术介绍
帕金森氏病(PD)是仅次于阿尔茨海默氏病的第二大神经退行性疾病,并且患者人数逐年增加。PD给患者带来极大的不便,给患者的家庭和社会带来沉重的经济负担。帕金森氏病尚无永久性治愈方法,因此,PD的早期诊断尤为重要。声音性能下降是PD患者的常见症状,已被广泛用于PD的诊断。但是,现有的帕金森语音数据集具有冗余度高,噪声大和样本少的特点。如何提高PD诊断的准确性已成为相关领域学者或研究人员面临的科学问题。降维(DR)可以有效地处理PD语音数据,提高PD的诊断准确性和模型的泛化能力。目前,根据所选择的特征子集是否为原始特征空间的子集,用于PD语音数据集的DR方法可以分为特征选择和特征提取。PD语音数据集最早的DR方法主要集中在特征选择上,因为特征选择的特征子集是原始特征空间的子集,具有较高的可解释性,并且不会丢失单个特征与标签之间的重要信息。帕金森氏症诊断常用的特征选择算法是:最小绝对收缩和选择算 ...
【技术保护点】
1.一种基于集成流形降维的帕金森病语音识别系统,其特征在于包括:/n数据采集器:用于采集和存储训练数据、验证数据和测试数据,所述训练数据、验证数据和测试数据均为帕金森语音数据,且训练数据和验证数据中包括了代表帕金森病况的标签数据;/n分类器模块;通过所述训练数据和验证数据训练所得,并用于对所述测试数据进行分类识别,确定所述测试数据的标签类型;/n输出模块,用于输出最终的识别结果;/n所述分类器模块在训练时,先从所述训练数据中随机抽取E个子数据集X
【技术特征摘要】
1.一种基于集成流形降维的帕金森病语音识别系统,其特征在于包括:
数据采集器:用于采集和存储训练数据、验证数据和测试数据,所述训练数据、验证数据和测试数据均为帕金森语音数据,且训练数据和验证数据中包括了代表帕金森病况的标签数据;
分类器模块;通过所述训练数据和验证数据训练所得,并用于对所述测试数据进行分类识别,确定所述测试数据的标签类型;
输出模块,用于输出最终的识别结果;
所述分类器模块在训练时,先从所述训练数据中随机抽取E个子数据集X1~XE,利用流形学习降维算法对第一个训练子集X1进行映射,得到映射矩阵P1,利用经过映射矩阵P1映射后的训练子集X1训练一个分类器,并使用所述验证数据对该分类器进行测试,得到其分类误差率为e1,并将其错分的验证样本添加到训练子集X2中,然后继续对训练子集X2进行处理,并将其错分的验证样本添加到训练子集X3中,直到训练子集XE,错分的验证样本将不再被处理,从而得到E个分类器,每一个分类器对验证数据的分类误差e1~eE以及对应于每一个训练子集的映射矩阵P1~PE,然后,根据AdaBoost方法原理,计算出每一个分类器的权重α1~αE,基于映射矩阵P1~PE和每一个分类器的权重α1~αE得到加权映射矩阵P;最后使用经过加权映射矩阵P映射后的训练数据训练最终分类器,并使用经过加权映射矩阵P映射后的测试数据进行测试,将最终分类器的测试结果由所述输出模块输出。
2.根据权利要求1所述的基于集成流形降维的帕金森语音识别系统,其特征在于:所述流形学习方法通过构建映射矩阵Pi,i=1~E使其在优先最小化局部类内散度矩阵的情况下,同时保留样本的局部性和最大化类间散射矩阵来降低各个子数据集X1~XE的维度。
3.根据权利要求1所述的基于集成流形降维的帕金森语音识别系统,其特征在于:
设训练数据矩阵X=[x1,x2,...,xN]T=[X1,X2,...,XC]T∈RN×D,D代表维度,是训练数据样本的数量,C是类别数;
y=[y1,y2,…,yN]T∈RN为数据的标签;
通过映射矩阵P=(p1,p2,…,pk)∈RD×d将数据从RN×D高维空间映射...
【专利技术属性】
技术研发人员:李勇明,刘玉川,王品,谭晓衡,颜芳,李新科,黄智勇,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。