当前位置: 首页 > 专利查询>重庆大学专利>正文

基于集成流形降维的帕金森语音识别系统技术方案

技术编号:24332741 阅读:82 留言:0更新日期:2020-05-29 20:30
本发明专利技术公开一种基于集成流形降维的帕金森语音识别系统,包括:数据采集器:用于采集和存储训练数据、验证数据和测试数据,上述数据均为帕金森语音数据,且训练数据和验证数据中包括了代表帕金森病况的标签数据;分类器模块;通过训练数据和验证数据训练所得,并用于对测试数据进行分类识别,确定测试数据的标签类型;输出模块,用于输出最终的识别结果;本发明专利技术通过对分类器的训练过程进行改进,引入加权局部判别式保持投影嵌入集成方式,充分考虑了具有较大的类内差异和较小的类间方差的PD语音样本,同时引入AdaBoost方法来构造映射矩阵,提高LPP算法的稳定性,与现有的帕金森语音特征提取算法相比,本系统具有更高的分类精度。

Parkinson's speech recognition system based on integrated manifold dimension reduction

【技术实现步骤摘要】
基于集成流形降维的帕金森语音识别系统
本专利技术涉及智慧医疗技术,具体地说,是一种基于集成流形降维的帕金森语音识别系统。
技术介绍
帕金森氏病(PD)是仅次于阿尔茨海默氏病的第二大神经退行性疾病,并且患者人数逐年增加。PD给患者带来极大的不便,给患者的家庭和社会带来沉重的经济负担。帕金森氏病尚无永久性治愈方法,因此,PD的早期诊断尤为重要。声音性能下降是PD患者的常见症状,已被广泛用于PD的诊断。但是,现有的帕金森语音数据集具有冗余度高,噪声大和样本少的特点。如何提高PD诊断的准确性已成为相关领域学者或研究人员面临的科学问题。降维(DR)可以有效地处理PD语音数据,提高PD的诊断准确性和模型的泛化能力。目前,根据所选择的特征子集是否为原始特征空间的子集,用于PD语音数据集的DR方法可以分为特征选择和特征提取。PD语音数据集最早的DR方法主要集中在特征选择上,因为特征选择的特征子集是原始特征空间的子集,具有较高的可解释性,并且不会丢失单个特征与标签之间的重要信息。帕金森氏症诊断常用的特征选择算法是:最小绝对收缩和选择算子(LASSO)、粒本文档来自技高网...

【技术保护点】
1.一种基于集成流形降维的帕金森病语音识别系统,其特征在于包括:/n数据采集器:用于采集和存储训练数据、验证数据和测试数据,所述训练数据、验证数据和测试数据均为帕金森语音数据,且训练数据和验证数据中包括了代表帕金森病况的标签数据;/n分类器模块;通过所述训练数据和验证数据训练所得,并用于对所述测试数据进行分类识别,确定所述测试数据的标签类型;/n输出模块,用于输出最终的识别结果;/n所述分类器模块在训练时,先从所述训练数据中随机抽取E个子数据集X

【技术特征摘要】
1.一种基于集成流形降维的帕金森病语音识别系统,其特征在于包括:
数据采集器:用于采集和存储训练数据、验证数据和测试数据,所述训练数据、验证数据和测试数据均为帕金森语音数据,且训练数据和验证数据中包括了代表帕金森病况的标签数据;
分类器模块;通过所述训练数据和验证数据训练所得,并用于对所述测试数据进行分类识别,确定所述测试数据的标签类型;
输出模块,用于输出最终的识别结果;
所述分类器模块在训练时,先从所述训练数据中随机抽取E个子数据集X1~XE,利用流形学习降维算法对第一个训练子集X1进行映射,得到映射矩阵P1,利用经过映射矩阵P1映射后的训练子集X1训练一个分类器,并使用所述验证数据对该分类器进行测试,得到其分类误差率为e1,并将其错分的验证样本添加到训练子集X2中,然后继续对训练子集X2进行处理,并将其错分的验证样本添加到训练子集X3中,直到训练子集XE,错分的验证样本将不再被处理,从而得到E个分类器,每一个分类器对验证数据的分类误差e1~eE以及对应于每一个训练子集的映射矩阵P1~PE,然后,根据AdaBoost方法原理,计算出每一个分类器的权重α1~αE,基于映射矩阵P1~PE和每一个分类器的权重α1~αE得到加权映射矩阵P;最后使用经过加权映射矩阵P映射后的训练数据训练最终分类器,并使用经过加权映射矩阵P映射后的测试数据进行测试,将最终分类器的测试结果由所述输出模块输出。


2.根据权利要求1所述的基于集成流形降维的帕金森语音识别系统,其特征在于:所述流形学习方法通过构建映射矩阵Pi,i=1~E使其在优先最小化局部类内散度矩阵的情况下,同时保留样本的局部性和最大化类间散射矩阵来降低各个子数据集X1~XE的维度。


3.根据权利要求1所述的基于集成流形降维的帕金森语音识别系统,其特征在于:
设训练数据矩阵X=[x1,x2,...,xN]T=[X1,X2,...,XC]T∈RN×D,D代表维度,是训练数据样本的数量,C是类别数;
y=[y1,y2,…,yN]T∈RN为数据的标签;
通过映射矩阵P=(p1,p2,…,pk)∈RD×d将数据从RN×D高维空间映射...

【专利技术属性】
技术研发人员:李勇明刘玉川王品谭晓衡颜芳李新科黄智勇
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1