一种II型糖尿病因果特征选择方法技术

技术编号:43661698 阅读:30 留言:0更新日期:2024-12-13 12:52
本发明专利技术涉及一种II型糖尿病因果特征选择方法。方法执行流程描述如下:①对原始数据进行预处理并且标准化;②引入II型糖尿病危险因素强化学习因果发现方法,构建II型糖尿病特征因果结构;③执行向前选择阶段,采用因果信息增益作为选择策略,将策略函数得分高的特征集作为其输出数据集;④执行向后删除阶段,采用相关系数作为删除策略,删除重复冗余特征,得到最终特征集。现有特征选择方法大多依据变量间的相关性,难以反映变量间因果关系的不足。本发明专利技术设计了基于因果信息增益和相关系数相结合的II型糖尿病特征选择新方法,该方法可有效减少模型训练时间,提高了模型鲁棒性,可为II型糖尿病的诊断与预防研究提供新的思路。

【技术实现步骤摘要】

本专利技术涉及生物诊断工程领域,尤其涉及一种ii型糖尿病因果特征选择方法。


技术介绍

1、ii型糖尿病是一种病因复杂且高发的慢性疾病,其患病率呈现逐年上升趋势。如果没有得到及时治疗与控制,患者可能产生一系列并发症,所以ii型糖尿病早期诊断和预测对其治疗和避免并发症具有重要意义。

2、近年来,研究人员发现机器学习算法有助于疾病的早期检测与分析,且随着机器学习研究的不断深入,面向ii型糖尿病的机器学习预测模型应用也越来越多。但当样本数据量较大时,模型训练就变得十分困难,通常需要对数据进行预处理。

3、特征选择是数据预处理方法的重要环节,可以起到剔除无用数据、减少模型训练时间和提高机器学习模型精度的作用。ii型糖尿病预测模型的构建首要考虑的是特征选择方法的设计合理性。现有特征选择算法往往根据预测特征之间的相关性、预测特征与类变量之间的相关性来选择特征,其并不试图捕捉它们之间的因果关系。事实证明,了解变量之间的因果关系对建立可解释且稳健的预测模型具有潜在好处,这是因为因果关系直接反映了系统的内在机制。因此,基于因果关系的ii型糖尿病危险因素本文档来自技高网...

【技术保护点】

1.一种II型糖尿病因果特征选择方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的II型糖尿病因果特征选择方法,其特征在于,对原始数据进行预处理并且进行Z-score标准化计算如下:

3.根据权利要求2所述的II型糖尿病因果特征选择方法,其特征在于,构建II型糖尿病特征因果结构的方法包含以下步骤:

4.根据权利要求3所述的II型糖尿病因果特征选择方法,其特征在于,在执行向前选择阶段,采用因果信息增益作为选择策略,将策略函数得分高的特征集作为其输出数据集,将原始数据集中的特征,按照信息增益大小的顺序依次判断添加到输出数据集中,添加的条件为判断策略...

【技术特征摘要】

1.一种ii型糖尿病因果特征选择方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的ii型糖尿病因果特征选择方法,其特征在于,对原始数据进行预处理并且进行z-score标准化计算如下:

3.根据权利要求2所述的ii型糖尿病因果特征选择方法,其特征在于,构建ii型糖尿病特征因果结构的方法包含以下步骤:

4.根据权利要求3所述的ii型糖尿病因果特征选择方法,其特征在于,在执行向前选择阶段,采用因果信息增益作为选择策略,将策略函数得分高的特征集作为其输出数据集,将原始数据集中的特征,按照信息增益大小的顺序依次判断添加到输出数据集中,添加的条件为判断策略得分是否增大,如果策略得分增大,则将当前特征添加到输出数据集中;否则就跳过当前特征,判断其他特征,即计算每个特征相对于分类变量c的信息增益,并根据信息增益大小对特征进行排序;结合因果发现生成的因果结构,计算当前特征的因果信息增益;依据策略得分函数对当前特征进行判断,是否添加到输出数据集。

5.根据权利要求4所述的ii型糖尿病因果特征选择方法,其特征在于,信息增益计算公式如下:

6.根据权利要求5所述的ii...

【专利技术属性】
技术研发人员:陈波谢文学胡建刚高秀娥袁子怡陈世峰
申请(专利权)人:岭南师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1