基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法技术

技术编号:33199514 阅读:39 留言:0更新日期:2022-04-24 00:33
本发明专利技术为基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,公开了所述方法包括:基于动态信息价值准则对采集的数据集进行筛选,分为最优特征集和残留特征集;基于机器学习算法将最优特征集与残留特征集作为基分类器A、基分类器B;根据基分类器A、基分类器B建立预测模型A和预测模型B;将最优特征集和残留特征集输入预测模型A和预测模型B,将所得到的预测结果加权集成,输出最终集成学习预测结果,本发明专利技术在使用机器学习算法进行动脉粥样硬化风险预测的基础上,由模型预测效果优劣来进行特征筛选,挑选出数据冗余度低、有代表性的特征,考虑到了更为优秀的特征、提高了模型预测效果。型预测效果。型预测效果。

【技术实现步骤摘要】
基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法


[0001]本专利技术涉及基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,属于心血管疾病预测领域


技术介绍

[0002]心血管疾病是当今世界上致死率最高的病症,已经被世界卫生组织视为首要人类健康问题,究其根源其主要是由动脉粥样硬化(Atherosclerosis,AS)导致。目前,医学界对AS的致病机理还没有完全解释清楚,其经典的评估指标是颈动脉内膜中层厚度(carotid intima

media thickness,cIMT)为代表的一系列影像指标与由理化性质得出的动脉硬化指数,当cIMT超过一定的阈值则认为AS已发生,其风险可通过胆固醇和高密度脂蛋白计算得来。然而该评价依据并不完全,AS是一个漫长形成的过程,属于慢性进展性疾病,多位学者先后研究出,不仅低密度脂蛋白胆固醇(Low

density lipoprotein

cholesterol,LDL

C)、高密度脂蛋白胆固醇(High本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,其特征在于,所述方法包括:基于动态信息价值准则对采集的数据集进行筛选,分为最优特征集和残留特征集;基于机器学习算法将最优特征集与残留特征集作为基分类器A、基分类器B;根据基分类器A、基分类器B建立预测模型A和预测模型B;将最优特征集和残留特征集输入预测模型A和预测模型B,将所得到的预测结果加权集成,输出最终集成学习预测结果。2.根据权利要求1所述的基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,其特征在于,所述数据集采集的方法包括:选择有关引发动脉粥样硬化的因素作为原始特征集,并采集有动脉粥样硬化症状及健康人员样本作为动脉粥样硬化风险组与对照组,构成训练样本集并保留测试集。3.根据权利要求2所述的基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,其特征在于,所述动态信息价值准则包括步骤:基于机器学习算法,将样本集输入预先构建的动脉粥样硬化预测模型,计算出KS统计量;通过KS统计量来衡量模型的整体预测效果;基于原始特征集计算各特征对于目标变量是否有动脉粥样硬化风险的信息价值指标IV;选择最大的IV值特征作为中心特征,将其从原始特征集中纳入中心特征集中;响应于原始特征集中特征不数量大于0,建立预测模型;计算剩余特征对中心特征的IV值,将对中心特征IV值最高的特征移出原始特征集,纳入残留特征集中;将中心特征集与筛去残留特征的原始特征集合并为联合特征集,基于机器学习算法,建立联合特征集与目标变量的动脉粥样硬化预测模型;比较各联合特征集所构建的动脉粥样硬化预测模型KS统计量结果,选择最优KS值组,将其作为最优特征集;输出最优特征集,完成基于动态信息价值准则的特征筛选。4.根据权利要求3所述的基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法,其特征在于,所述KS值利用TPR、FPR两个指标指出最优划分阈值,即:KS
max
=max(TPR

FPR)其纵坐标为false positive rate(FPR)、true p...

【专利技术属性】
技术研发人员:刘文军尤欢黄辉白雪陈子涵杨旻荟蒋松言温宇航
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1