基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法技术方案

技术编号:19062426 阅读:24 留言:0更新日期:2018-09-29 13:18
本发明专利技术公开了一种基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法,该系统包括多特征输入器和处理器,处理器具有多维特征选择模块、支持向量机构建模块和支持向量机模型测试模块;多维特征选择模块建立第一样本,通过基于粗糙集的最大依赖度算法对第一样本进行特征降维,得到若干个主特征子集,建立以若干个主特征子集构成的样本集合作为第二样本;支持向量机构建模块构建支持向量机模型;支持向量机模型测试模块将所述第二样本随机分为训练集和预测集,生成训练器,根据支持向量机模型预测通过降维得到的第二样本是否表现为慢性阻塞性肺疾病。本发明专利技术基于支持向量机模型,使得慢性阻塞性肺疾病与病患的各项生理指标建立联系,测试准确度高。

【技术实现步骤摘要】
基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法
本专利技术涉及医疗数据挖掘领域,具体为利用支持向量机的方法,构建基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法。
技术介绍
慢性阻塞性肺疾病(COPD)是一种可导致患者呼吸功能逐渐下降的疾病,其已成为全球第四大致死疾病,全球目前约有超过1.7亿COPD患者,而肺功能病理特征及生理指标对诊断COPD具有重要意义。COPD的病情发展是渐进性的过程:早期,COPD症状并不明显,主要是咳嗽、咳痰,患者不易察觉,是最佳治疗时机;中期,随着病情的加重,患者可能出现活动后呼吸困难,气道阻塞加重、肺组织弹性损坏,达到不可逆转阶段,各种药物都难以发挥作用;晚期,可出现肺心病、呼吸衰竭等并发症,治疗若不及时,会严重影响患者的生活质量和身心健康。所以COPD的早期发现非常重要,如果不预防不管理,随着疾病的进一步发展,特别是发生急性加重就会给患者带来更大的危害。目前,基于数据挖掘和机器学习相关理论,探索基于肺功能病理症状及生理指标对COPD多维特征提取系统尚未出现。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供了基于支持向量机的慢性阻塞性肺疾病诊断辅助系统及方法,基于支持向量机模型,使得慢性阻塞性肺疾病与病患的各项生理指标建立联系,测试准确度高。本专利技术所采用的技术方案是:一种基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,该系统包括:多特征输入器,用于获取被测者肺部机能检测项目及其测量值;处理器,与多特征输入器相连,具有数据预处理模块、多维特征选择模块、支持向量机构建模块和支持向量机模型测试模块;所述数据预处理模块,用于对被测者肺部机能检测测量值的噪声数据、缺失数据进行清洗,对部分特征属性进行数据转换和归一化处理;所述多维特征选择模块,用于建立与被测者肺部机能检测项目测量值相对应的原始多维特征项作为第一样本,通过基于粗糙集的最大依赖度算法对所述第一样本进行特征降维,得到基于被测者肺部机能检测项目测量值的若干个主特征子集,建立以若干个主特征子集构成的样本集合作为第二样本;所述支持向量机构建模块,用于采用双向耦合概率估计方法,构建支持向量机模型;所述支持向量机模型测试模块,用于将所述第二样本随机分为训练集和预测集,训练集用于生成训练器,在训练器的基础上,利用预测集对支持向量机模型进行测试。进一步的,所述处理器还包括支持向量机优化模块,用于采用直接模拟退火算法对支持向量机模型参数组合进行优化,通过交叉验证方法选取最优参数组合的支持向量机模型。进一步的,所述支持向量参数优化模块是在支持向量机模型局部参数周围建立一个虚拟窗口,并设置参数阈值直到参数为所接受范围趋于稳定。进一步的,所述数据预处理模块包括数据筛选模块、数据填充模块和数据转换模块;所述数据筛选模块,用于对所述被测者肺部机能检测项目测量值进行筛选,剔除被测者肺部机能非重要测试项目中的测量缺失值及噪音值;所述数据填充模块,用于对所述被测者肺部机能重要检测项目中的测量缺失值进行填充;所述数据转换模块,用于对经筛选和填充后的被测者肺部机能检测项目测量值进行格式转换。进一步的,所述数据归一化模块,用于采用被测者肺部机能检测项目测量值的最大值和最小值对格式转换后的被测者肺部机能检测项目测量值进行归一化处理。进一步的,所述多维特征选择模块包括粗糙集模块和特征依赖度模块;所述粗糙集模块,用于构建相似特征的知识系统,对被测者肺部机能检测项目测量值的多维特征进行等价类归约;所述特征依赖度模块,结合通过特征依赖度将归约后的被测者肺部机能检测项目测量值的等价类特征中对分类不重要的特征剔除。进一步的,所述多维特征选择模块还包括多维特征最大依赖度模块,其针对每个特征利用不可辨识关系计算等价类,利用依赖度计算公式计算每个特征的特征依赖度;选取每个特征的最大依赖度,根据特征属性的依赖度选出依赖度最大的属性作为分类特征属性,获得最终分类的主特征子集。一种基于支持向量机的慢性阻塞性肺疾病诊断辅助方法,包括以下步骤:获取被测者肺部机能检测项目及其测量值,对被测者肺部机能检测测量值的噪声数据、缺失数据进行清洗,对部分特征属性进行数据转换和归一化处理;建立与被测者肺部机能检测项目测量值相对应的原始多维特征项作为第一样本,通过基于粗糙集的最大依赖度算法对所述第一样本进行特征降维,得到基于被测者肺部机能检测项目测量值的若干个主特征子集,建立以若干个主特征子集构成的样本集合作为第二样本;采用双向耦合概率估计方法,构建支持向量机模型,并对支持向量机模型进行优化,将所述第二样本随机分为训练集和预测集,训练集用于生成训练器,在训练器的基础上,利用预测集对支持向量机模型进行测试。进一步的,所述对支持向量机模型进行优化包括:采用直接模拟退火算法对支持向量机模型参数组合进行优化,通过交叉验证方法选取最优参数组合的支持向量机模型,其中,所述交叉验证方法包括:随机将样本集划分成多个不相交的子集,对于每个支持向量机模型,将多个不相交的子集作为训练集,建立训练模型,计算每个支持向量机模型的平均泛化误差,选择平均泛化误差最小的支持向量机模型。进一步的,所述通过基于粗糙集的最大依赖度算法对所述第一样本进行特征降维的方法包括:构建相似特征的知识系统,对被测者肺部机能检测项目测量值的多维特征进行等价类归约;通过特征依赖度将归约后的被测者肺部机能检测项目测量值的等价类特征中对分类不重要的特征剔除;针对每个特征利用不可辨识关系计算等价类,并利用依赖度计算公式计算每个特征的特征依赖度;选取每个特征的最大依赖度,根据特征属性的依赖度选出依赖度最大的属性作为分类特征属性,获得最终分类的主特征子集。与现有技术相比,本专利技术的有益效果是:本专利技术提出的基于支持向量机的慢性阻塞性肺疾病诊断辅助系统机方法针对单一特征进行数据分析预测慢性阻塞性肺疾病的特点,提出了多特征诊断方法;其次,提出了一种最大依赖度算法实现对原始的多维特征提取及降维,通过MDF-RS提取特征子集的作为主特征,提高了利用经验学习进行特征提取的弊端,使可以对特征子集进行交叉验证获取最优的特征组;最后,针对支持向量机机器学习在参数优化方面的局限性,结合分类器的结构风险最小化和现有的调参方法,并利用双向耦合概率估计的学习方法,提出基直接模拟退火的支持向量机算法,实现了基于多维特征的疾病诊断识别,可以在不破坏原始数据结构的前提下,充分挖掘患者电子病例的原有信息,提高模式分类精度,可以极大地降低治疗成本,并有效地保证了疾病诊断的实时性。本专利技术可用于慢性阻塞性肺疾病前期的预测及后期的风险评估、慢性阻塞性肺疾病与抑郁症的关联、呼吸器官发育异常与肺部机能相关联的疾病分析和预测方面,同时本专利技术也可以用于正常人的肺部相关疾病的预防和健康护理方面。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本专利技术基于支持向量机的慢性阻塞性肺疾病诊断辅助系统结构图;图2为本专利技术特征选择图;图3为本专利技术特征重要度排序图;图4为本专利技术似然比检验图;图5为本专利技术参数优化C图;图6为本专利技术参数优化γ图;图7为本专利技术DSA-SVM分类模型图;图8为本专利技术参数C与γ准确率对比图;图9为本文档来自技高网...

【技术保护点】
1.一种基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,包括:多特征输入器,用于获取被测者肺部机能检测项目及其测量值;处理器,与多特征输入器相连,具有数据预处理模块、多维特征选择模块、支持向量机构建模块和支持向量机模型测试模块;所述数据预处理模块,用于对被测者肺部机能检测测量值的噪声数据、缺失数据进行清洗,对部分特征属性进行数据转换和归一化处理;所述多维特征选择模块,用于建立与被测者肺部机能检测项目测量值相对应的原始多维特征项作为第一样本,通过基于粗糙集的最大依赖度算法对所述第一样本进行特征降维,得到基于被测者肺部机能检测项目测量值的若干个主特征子集,建立以若干个主特征子集构成的样本集合作为第二样本;所述支持向量机构建模块,用于采用双向耦合概率估计方法,构建支持向量机模型;所述支持向量机模型测试模块,用于将所述第二样本随机分为训练集和预测集,训练集用于生成训练器,在训练器的基础上,利用预测集对支持向量机模型进行测试。

【技术特征摘要】
1.一种基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,包括:多特征输入器,用于获取被测者肺部机能检测项目及其测量值;处理器,与多特征输入器相连,具有数据预处理模块、多维特征选择模块、支持向量机构建模块和支持向量机模型测试模块;所述数据预处理模块,用于对被测者肺部机能检测测量值的噪声数据、缺失数据进行清洗,对部分特征属性进行数据转换和归一化处理;所述多维特征选择模块,用于建立与被测者肺部机能检测项目测量值相对应的原始多维特征项作为第一样本,通过基于粗糙集的最大依赖度算法对所述第一样本进行特征降维,得到基于被测者肺部机能检测项目测量值的若干个主特征子集,建立以若干个主特征子集构成的样本集合作为第二样本;所述支持向量机构建模块,用于采用双向耦合概率估计方法,构建支持向量机模型;所述支持向量机模型测试模块,用于将所述第二样本随机分为训练集和预测集,训练集用于生成训练器,在训练器的基础上,利用预测集对支持向量机模型进行测试。2.根据权利要求1所述的基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,所述处理器还包括支持向量机优化模块,用于采用直接模拟退火算法对支持向量机模型参数组合进行优化,通过交叉验证方法选取最优参数组合的支持向量机模型。3.根据权利要求2所述的基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,所述支持向量参数优化模块是在支持向量机模型局部参数周围建立一个虚拟窗口,并设置参数阈值直到参数为所接受范围趋于稳定。4.根据权利要求1所述的基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,所述数据预处理模块包括数据筛选模块、数据填充模块和数据转换模块;所述数据筛选模块,用于对所述被测者肺部机能检测项目测量值进行筛选,剔除被测者肺部机能非重要测试项目中的测量缺失值及噪音值;所述数据填充模块,用于对所述被测者肺部机能重要检测项目中的测量缺失值进行填充;所述数据转换模块,用于对经筛选和填充后的被测者肺部机能检测项目测量值进行格式转换。5.根据权利要求4所述的基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,所述数据归一化模块,用于采用被测者肺部机能检测项目测量值的最大值和最小值对格式转换后的被测者肺部机能检测项目测量值进行归一化处理。6.根据权利要求1所述的基于支持向量机的慢性阻塞性肺疾病诊断辅助系统,其特征是,所述多维特征选择模块包括粗糙集模块和特征依赖度模块;所述粗糙集模块,用于构建相似特征的知识系统,对被...

【专利技术属性】
技术研发人员:王红房有丽狄瑞彤周莹王露潼刘海燕王倩宋永强
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1