当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于集成学习融合模型的异常空腹血糖值预警方法技术

技术编号:20428686 阅读:34 留言:0更新日期:2019-02-23 09:45
本发明专利技术公开了一种基于集成学习融合模型的异常空腹血糖值预警方法。本发明专利技术通过结合个体的血常规、肝功能、血脂、肾功能等体检数据,使用集成学习的方法,融合梯度回归树、随机森林、线性回归等模型来对空腹血糖值进行预测;通过大量训练数据训练预测模型,从而提高预测模型的精确度、普适性和鲁棒性。能及时对没有进行空腹血糖检查的个体进行空腹血糖预测,对糖尿病高风险患者进行有效预警。

【技术实现步骤摘要】
一种基于集成学习融合模型的异常空腹血糖值预警方法
本专利技术涉及智慧医疗、机器学习领域,具体涉及一种基于集成学习融合模型的异常空腹血糖值预警方法。
技术介绍
随着经济高速发展和工业化进程的加速,生活方式的改变和老龄化进程的加速,是我国糖尿病的患病率正呈快速上升的趋势,称为继心脑血管疾病、肿瘤之后另一个严重危害人民健康的重要慢性非传染性疾病。由中国2型糖尿病防止指南(2013年版)估计,在2005-2015年里,中国由于糖尿病及相关心血管疾病导致的经济损失达5577亿美元,糖尿病不仅给患病个体带来了肉体和精神上的损害并导致寿命的缩短,还给个人和国家带来了沉重的经济负担。根据糖尿病的发病机理不同,糖尿病主要分为1型糖尿病、2型糖尿病、其他特殊类型糖尿病和妊娠糖尿病、继发性糖尿病。现阶段糖尿病的治愈相当困难,因此预防与及时干预是应对糖尿病最好的手段。血糖异常的检测是糖尿病预警的重要环节,血糖异常的判断方式一般为检测空腹血糖或餐后血糖,当空腹血糖≥7.0mmol/L或餐后血糖≥11.1mmol/L,即可怀疑个体患有糖尿病,应对其进行预警。考虑到人体的各项生理指标相互联系,基于其他生理数据对空腹血糖的预测成为一种可能。现有的一种基于体检数据建模的空腹血糖预测方法,是使用随机森林利用体检者的体检信息对体检者未来一年的空腹血糖值进行预测,进而得出该体检者对比上一年的空腹血糖值的变化情况,从而判断体检者的糖尿病发病情况,在糖尿病发病前期进行有效的预防或阻断,其中体检者的体检信息包括基本体检信息、血常规检测、血生化检测、尿常规检测、内科、心电图科目下的一种或多种信息共50个体检指标。该技术首先从海量体检数据中提取出需要的每个体检者的体检信息,并对数据进行清洗和格式化,得到包含所有特征集合的数据集。随后该技术结合序列后向选择算法选择出最优特征子集来作为预测空腹血糖值的特征集合,该步骤首先利用随机森林对特征集合中的每一个特征计算其特征重要性,然后根据序列后向选择算法,将数据集的全部特征集合进行建模,计算其在测试集上的空腹血糖值预测的得分效果,然后依次去掉得分最低的特征后计算其在测试集上的空腹血糖预测的得分效果,直至特征集合中只含有一个体检项,选取具有最大的得分效果的特征集为最优特征子集。最后该技术使用选择了最优特征子集的数据集训练随机森林模型,对血糖的预测值是随机森林中各决策树的血糖预测值的均值。此时,空腹血糖值预测的回归模型建立完毕。该技术能达到一定的预测效果。但在人体的生理机制上,空腹血糖与其他生理指标具有复杂的关系,用于训练随机森林模型的体检指标(特征)不足,存在的空腹血糖值预测偏差较大的风险。其次使用的随机森林模型作为单一预测模型在连续值的预测上结果的偏差较大,预测精度需要进一步提高。另外,该技术根据下一年的空腹血糖值和当前空腹血糖值的差值作为判断糖尿病病发的风险,并未考虑到空腹血糖值具体值与糖尿病之间的量化关系。
技术实现思路
本专利技术的目的是克服现有方法的不足,提出了一种基于集成学习融合模型的异常空腹血糖值预警方法。本专利技术通过结合个体的血常规、肝功能、血脂、肾功能等体检数据,使用集成学习的方法,融合梯度提升决策树、随机森林、模型线性回归来实现对体检者的空腹血糖值进行预测;通过大量训练数据训练预测模型,从而提高预测模型的精确度、普适性和鲁棒性。为了解决上述问题,本专利技术提出了一种基于集成学习融合模型的异常空腹血糖值预警方法,所述方法包括:从医院获取体检者群体的体检数据,作为原始训练集。对原始训练集进行数据的缺失值处理、标准化处理。对处理后的训练集进行特征选取,去除无关特征与冗余特征。利用所选取的特征,分别作为梯度回归树模型、随机森林模型、线性回归模型的训练集,之后选择线性回归作为元模型来融合训练完成的梯度回归树、随机森林、线性回归预测模型,将三种预测模型的输出作为元模型的输入,再次训练作为元模型的线性回归模型,从而建立完整的预测模型。使用已训练好的预测模型对用户输入的体检数据进行预测,获得体检数据的空腹血糖预测值,根据预设的阈值判断是否为异常空腹血糖值,并把结果反馈给用户。优选地,所述获取体检者群体的体检数据,具体包括:性别、年龄、舒张压、天门东氨酸转移酶、丙氨酸氨基转移酶、碱性磷酸酶、r-谷氨酰基转移酶、淋巴细胞总数、总蛋白、白蛋白、球蛋白、白球比例、甘油三酯、总胆固醇、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇、尿素、肌酐、尿酸、乙肝表面抗体、乙肝表面抗原、乙肝e抗原、乙肝抗体、乙肝核心抗体、白细胞计数、红细胞计数、血红蛋白、红细胞压积、红细胞平均体积、红细胞平均血红蛋白量、红细胞平均血红蛋白浓度、红细胞体积分布宽度、血小板计数、血小板平均体积、血小板体积分布宽度、血小板比积、中性粒细胞%、淋巴细胞%、单核细胞%、嗜酸细胞%、嗜碱细胞%、氯、二氧化碳、钠、钾、钙、镁、磷、尿胆红素、直接胆红素、总胆红素、胆碱酯酶、乳酸脱氢酶、总胆汁酸、胱抑素C、血管紧张素转换酶、超氧化物歧化酶、肌酸激酶同工酶MB、a-羟丁酸脱氢酶、肌酸激酶、超敏C反应蛋白、淀粉酶、载脂蛋白E、免疫球蛋白M、免疫球蛋白A、免疫球蛋白C、免疫球蛋白G、肝胆酸、游离脂肪酸、同型半胱氨酸、转铁蛋白、腺苷脱氨酶、心电图、心率。优选地,所述建立完整的预测模型,具体包括:引入具有良好非线性拟合能力的梯度回归树模型作为融合模型的基础模型,根据训练集得到梯度回归树空腹血糖值预测模型;由于梯度回归树应对过拟合能力较弱,因此引入随机森林模型作为融合模型的另一基础模型,根据训练集得到随机森林空腹血糖值预测模型;考虑到集成学习中融合的模型差异越大则融合效果越好,因此也引入与上述模型差异较大的线性回归作为融合模型的基础模型,根据训练集得到线性回归空腹血糖值预测模型;在引入基础模型后,选择线性回归作为元模型来融合训练完成的梯度回归树、随机森林、线性回归预测模型,将三种预测模型的输出作为元模型的输入,再次训练作为元模型的线性回归模型,从而建立完整的预测模型。本专利技术提出的一种基于集成学习融合模型的异常空腹血糖值预警方法,结合个体的血常规、肝功能、血脂、肾功能等体检数据,使用集成学习的方法,融合梯度回归树、随机森林、线性回归等模型来对空腹血糖值进行预测,能及时对没有进行空腹血糖检查的个体进行空腹血糖预测,对糖尿病高风险患者进行有效预警。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术实施例的异常空腹血糖值预警方法流程图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1是本专利技术实施例的异常空腹血糖值预警方法流程图,如图1所示,该方法包括:S1,从医院获取体检者群体的体检数据,作为原始训练集。S2,对原始训练集进行数据的缺失值处理、标准本文档来自技高网
...

【技术保护点】
1.一种基于集成学习融合模型的异常空腹血糖值预警方法,其特征在于,所述方法包括:从医院获取体检者群体的体检数据,作为原始训练集。对原始训练集进行数据的缺失值处理、标准化处理。对处理后的训练集进行特征选取,去除无关特征与冗余特征。利用所选取的特征,分别作为梯度回归树模型、随机森林模型、线性回归模型的训练集,之后选择线性回归作为元模型来融合训练完成的梯度回归树、随机森林、线性回归预测模型,将三种预测模型的输出作为元模型的输入,再次训练作为元模型的线性回归模型,从而建立完整的预测模型。使用已训练好的预测模型对用户输入的体检数据进行预测,获得体检数据的空腹血糖预测值,根据预设的阈值判断是否为异常空腹血糖值,并把结果反馈给用户。

【技术特征摘要】
1.一种基于集成学习融合模型的异常空腹血糖值预警方法,其特征在于,所述方法包括:从医院获取体检者群体的体检数据,作为原始训练集。对原始训练集进行数据的缺失值处理、标准化处理。对处理后的训练集进行特征选取,去除无关特征与冗余特征。利用所选取的特征,分别作为梯度回归树模型、随机森林模型、线性回归模型的训练集,之后选择线性回归作为元模型来融合训练完成的梯度回归树、随机森林、线性回归预测模型,将三种预测模型的输出作为元模型的输入,再次训练作为元模型的线性回归模型,从而建立完整的预测模型。使用已训练好的预测模型对用户输入的体检数据进行预测,获得体检数据的空腹血糖预测值,根据预设的阈值判断是否为异常空腹血糖值,并把结果反馈给用户。2.如权利要求1所述的一种基于集成学习融合模型的异常空腹血糖值预警方法,其特征在于,所述获取体检者群体的体检数据,具体包括:性别、年龄、舒张压、天门东氨酸转移酶、丙氨酸氨基转移酶、碱性磷酸...

【专利技术属性】
技术研发人员:廖贤艺王荣政陈湘萍林格周凡
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1