一种基于多分类器融合的阿尔兹海默症分类预测方法技术

技术编号:29205379 阅读:33 留言:0更新日期:2021-07-10 00:40
本发明专利技术涉及一种基于多分类器融合的阿尔兹海默症分类预测方法。本发明专利技术首先对所获得数据中含有的缺失数据和异常数据进行处理和评估,确保数据的有效性;然后结合专家知识和特征选择算法,从k个特征指标中选择出n个特征子集,n≤k,去掉冗余特征和无关特征,提高最终模型的预测效果;提出基于多分类器融合的预测模型;将经过预处理的数据集输入到所提出的模型中,通过多种评估方法评估模型的性能。本发明专利技术对阿尔兹海默症的分类预测具有更好的效果和普适性。性。

【技术实现步骤摘要】
一种基于多分类器融合的阿尔兹海默症分类预测方法


[0001]本专利技术涉及一种基于多分类器融合的阿尔兹海默症分类预测方法,该方法在阿尔兹海默症分类预测方面有着很好的应用。

技术介绍

[0002]阿尔兹海默症是一种破坏性神经退行性疾病,其病因学特征不完全,目前尚无有效的治疗方法,阿尔兹海默症及其前驱阶段

轻度认知障碍,与多种发病机制、标志物和风险相关,例如,年龄是发生阿尔兹海默症的著名风险指标,神经系统疾病的病史也与较高的阿尔兹海默症风险有关。
[0003]目前对于阿尔兹海默症早期诊断的方式主要集中在神经心理学测验、神经影像学检查、脑电图分析,以及脑脊液检测等,最近几年随着计算机技术和影像技术的发展,利用机器学习方法对阿尔兹海默症核磁共振图像进行分析,从而辅助医生前期诊断已经成为主流趋势,近年来,使用机器学习方法分析MRI图像来预测患者病症阶段取得了较好的效果,如随机森林,支持向量机,boosting算法等,对MRI的分析起到了很重要的作用,现已经开发出许多用于阿尔兹海默症诊断的预测方法,其中大多数使用Cox回归和Logistic回归得出,在过去的十年中,人们对随机森林,支持向量机以及用于阿尔兹海默症诊断的深度神经网络模型的应用也越来越感兴趣,上述研究通过各种方法展开对阿尔兹海默症预测的研究,也取得了较为完整的研究成果,但是单一的机器学习算法可能会存在过拟合问题,泛化能力较弱的问题,因此采用模型融合方法能够有效的避免单一算法产生的过拟合问题,其泛化能力和准确率也有很大的保障,基于卷积神经网络和集成学习的多切片集成分类模型用于阿尔兹海默症早期诊断,更充分地利用MRI包含的有效信息,从而提高分类的准确率和稳定性,虽然大多数深度学习模型在诊断分类方面表现出很好的表现,但它们的解释仍然是一个新兴的研究领域。

技术实现思路

[0004]为了解决阿尔兹海默症分类预测问题,本专利技术公开了一种基于多分类器融合的阿尔兹海默症分类预测方法。
[0005]为此,本专利技术提供了如下技术方案:
[0006]1.基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,该方法包括以下步骤:
[0007]步骤1:对所获得数据中含有的缺失数据和异常数据进行处理和评估,确保数据的有效性。
[0008]步骤2:结合专家知识和特征选择算法,从k个特征指标中选择出n个特征子集,n≤k,去掉冗余特征和无关特征,提高最终模型的预测效果。
[0009]步骤3:提出基于多分类器融合的预测模型,该模型利用Stacking集成学习的思想,将bagging集成方法和boosting集成方法相结合并作为基分类器,通过超参数优化自适
应选择基分类器的数量和元分类器,最终提高模型的普适性和预测能力。
[0010]步骤4:将经过预处理的数据集输入到所提出的模型中,通过多种评估方法评估模型的性能。
[0011]2.根据权利要求1所述的基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,所述步骤1中,对所获得数据中含有的缺失数据和异常数据进行处理,具体步骤为:
[0012]步骤1

1判断数据集的类型,是属于数值型,字符型还是混合类型。
[0013]步骤1

2对于缺失比例较大的数据直接进行删除,缺失比例不大的根据数据类型找到相对应的缺失值插补方法进行插值。
[0014]步骤1

3用异常值检测方法找出数据集中的异常值并删除。
[0015]3.根据权利要求1所述的基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,所述步骤2中,结合专家知识和特征选择算法,具体步骤为:
[0016]步骤2

1通过专家知识选择与AD相关的认知衰退的潜在预测因子,包括评估/生物标志物和危险因素。
[0017]步骤2

2将递归特征消除法和随机森林相结合,评估最优的特征组合。
[0018]步骤2

3通过交叉验证选择出含有k个特征的数据子集。
[0019]4.根据权利要求1所述的基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,所述步骤3中,提出基于多分类器融合的预测模型,具体步骤为:
[0020]步骤3

1首先利用超参数优化算法重复多次计算bagging算法和boosting算法中每个超参数的取值,最终生成每个超参数的一个最优集合。
[0021]步骤3

2然后用Stacking集成思想生成n个bagging基分类器和m个boosting基分类器,并给每个基分类器中的超参数在得到的最优集合进行随机采样,以及选择i个不同元分类器。
[0022]步骤3

3再利用超参数优化确定n和m的值以及元分类器的最终选择。
[0023]5.根据权利要求1所述的基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,所述步骤4中,多种评估方法评估模型的性能,具体步骤为:
[0024]步骤4

1将经过特征选择确认的特征分为5种模式类型:1.CFA 2.MRI3.PET 4.CSF 5.年龄,将特征分组的原因是为了确定是否具有成本效益和非侵入性的AD标记。
[0025]步骤4

2分析使用5种类型以及它们不同组合构建预测模型的性能。
[0026]步骤4

3将数据集分为80%训练集和20%测试集,通过交叉验证,以R

平方和均方根误差作为回归模型的度量标准,以准确度,灵敏度,特异性,AUC面积作为分类模型的度量标准。
[0027]有益效果:
[0028]1.本专利技术是一种基于多分类器融合的阿尔兹海默症分类预测方法,提出的多分类器融合方法是一种新方法,目前用于阿尔兹海默症的机器学习算法容易过拟合且泛化能力较弱,深度学习算法又缺乏可解释性,但这种新方法具有优秀的预测能力和泛化能力,可解释性也较强。
[0029]2.本专利技术简单易行,不仅限于适用于阿尔兹海默症数据集,在其它数据集上面也同样适用。
附图说明:
[0030]图1为本专利技术实施方式中的一种基于多分类器融合的阿尔兹海默症分类预测流程图。
[0031]图2为本专利技术实施中基于多分类器融合的流程图。
具体实施方式:
[0032]为了使本专利技术的实施例中的技术方案能够清楚和完整地描述,以下结合实施例中的附图,对本专利技术进行进一步的详细说明。
[0033]以ADNI数据集为例,本专利技术实施例一种基于多分类器融合的阿尔兹海默症分类预测方法的流程,如图1所示,包括以下步骤。
[0034]步骤1缺失数据和异常数据处理过程如下:
[0035]步骤1

1判断ADNI数据集的类型,是属于混合类型。
[0036]步骤1

2对于超过30%缺本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,该方法包括以下步骤:步骤1:对所获得数据中含有的缺失数据和异常数据进行处理和评估,确保数据的有效性。步骤2:结合专家知识和特征选择算法,从k个特征指标中选择出n个特征子集,n≤k,去掉冗余特征和无关特征,提高最终模型的预测效果。步骤3:提出基于多分类器融合的预测模型,该模型利用Stacking集成学习的思想,将bagging集成方法和boosting集成方法相结合并作为基分类器,通过超参数优化自适应选择基分类器的数量和元分类器,最终提高模型的普适性和预测能力。步骤4:将经过预处理的数据集输入到所提出的模型中,通过多种评估方法评估模型的性能。2.根据权利要求1所述的基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,所述步骤1中,对所获得数据中含有的缺失数据和异常数据进行处理,具体步骤为:步骤1

1判断数据集的类型,是属于数值型,字符型还是混合类型。步骤1

2对于缺失比例较大的数据直接进行删除,缺失比例不大的根据数据类型找到相对应的缺失值插补方法进行插值。步骤1

3用异常值检测方法找出数据集中的异常值并删除。3.根据权利要求1所述的基于多分类器融合的阿尔兹海默症分类预测方法,其特征在于,所述步骤2中,结合专家知识和特征选择算法,具体步骤为:步骤2

1通过专家知识选择与AD相关的认知衰退的潜在预测因子,包括评估/生物标志物和危险因素。步骤2

2将递归特征消除法和随机...

【专利技术属性】
技术研发人员:郑旭阳苗世迪程可李静
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1