一种妊娠期代谢综合征早期风险预测评估模型构建方法技术

技术编号:34722582 阅读:20 留言:0更新日期:2022-08-31 18:08
本发明专利技术公开了一种妊娠期代谢综合征早期风险预测评估模型的构建方法,包括步骤:(1)获取多源异构数据,并对其进行预处理,得到代谢相关数据;(2)筛选与Gms高度关联的不良妊娠结局;(3)采用极端梯度提升(XGBoost)结合Stacking框架建立预测模型,根据(2)中确定的不良妊娠结局作为预测标签输入预测模型;(4)基于Shapley值计算预测模型中每个建模因子的特征重要性;(5)根据(4)中建模因子的特征重要性,基于聚类算法建立风险分层模型,得到Gms风险等级。通过本发明专利技术,可实现临床GMS的早期预测,尽早发现GMS相关预测指标,将风险规避到新生儿时期,进而降低子代远期代谢性疾病的患病风险,对预防和降低GMS的发生具有重要意义。对预防和降低GMS的发生具有重要意义。对预防和降低GMS的发生具有重要意义。

【技术实现步骤摘要】
一种妊娠期代谢综合征早期风险预测评估模型构建方法


[0001]本专利技术属于疾病风险评估
,涉及一种妊娠期代谢综合征早期风险预测评估模型的构建方法。

技术介绍

[0002]代谢综合征(metabolic syndrome,MS)是指人体的蛋白质、脂肪、碳水化合物等物质发生代谢紊乱的病理状态,包括胰岛素抵抗、肥胖、血压升高、糖代谢异常、脂代谢异常等多重代谢异常聚集的一组症候群,是导致糖尿病心脑血管疾病和代谢性疾病的危险因素,而妊娠期代谢综合征(gestational metabolic syndrome,GMS)则是在妊娠期特发的多重代谢异常聚集。随着经济发展和生活水平的提高,孕产妇代谢性疾病在世界各地的发生率高达5%~10%,2020年我国育龄妇女数大约3.34亿,以此推算,我国育龄妇女中现有7515万MS患者;同时,我国目前每年约有1600万育龄妇女妊娠,以此推算,每年约有360万妊娠期间的MS人群。因此,GMS将造成巨大的疾病负担和经济负担,已经成为全球不可忽略的公共卫生问题。
[0003]妊娠期代谢综合征不仅直接影响当前妊娠结局,还潜在作用于孕产妇及子代的远期生理健康状况,子代成年后发生代谢综合征和心血管疾病的几率也明显增加。依据DOHAD理论即健康和疾病的发育起源学说,GMS早期干预得当与否直接影响产妇的妊娠结局以及子代的远期生理健康状况,早期的GMS风险评估并施以科学的健康管理可打断代谢异常在母子间的恶性循环,将风险规避到新生儿时期,进而降低子代远期代谢性疾病的患病风险,因此对推进国民素质有着重要意义。
[0004]临床上对GMS的评估大致分为二类研究。一是GMS风险因素研究,Niu等人的研究证明超重/肥胖、妊娠期高甘油三酯、低高密度脂蛋白胆固醇、高血糖和高血压等代谢危险因素的聚集越多,早产、小/大胎龄、子痫、妊娠期糖尿病、新生儿窒息和胎儿死亡等不良妊娠结局风险值越大。而现有GMS诊断标准即是在此基础上结合2004年中华医学会糖尿病学分会制定的代谢综合征诊断标准和2009年美国Wiznitzer等的研究结果所制定的,其包括:

孕前BMI≥25kg/m2;

血压≥140/90mmHg;

血糖升高,诊断为妊娠期糖尿病;

甘油三酯(Triglyceride,TG)≥3.23mmol/L。二是对GMS的预测模型研究,如Nitzan等人利用以色列国家数据库构建妊娠期糖尿病预测模型,孕前血糖测量是可有效筛查高危人群;Jong等人利用孕中期实验室化验构建晚发型PE的早预测模型研究认为早期血压、肌酐水平等是其重要建模;Tao等人利用孕妇在孕期内的连续体重变化,更加精准的预测胎儿体重和甄别大/小于胎龄儿。
[0005]以往研究重点关注的通常是探究多重代谢危险因素与GMS之间的相关性,或是代谢危险因素与某一妊娠期代谢性疾病的预测模型研究。此外,相关研究大多依据已设定实验方案、选定人群和纳入可能的风险因素进行跟踪发现,并不能全面完整有效把握致病因素,具有一定的局限性。GMS的诊断标准也缺乏严重程度的分级,更缺乏有效的早期风险预测评估模型,所以GMS在产前多不能被及时诊断和发现,导致临床对GMS未引起足够重视,缺
乏干预而造成不良妊娠结局。
[0006]因此,亟需建立一套有效的风险预测评估模型,针对医学临床真实场景选择并改进合适的机器学习模型;开发整体和有意义的可解释架构,将学习模型和医学可解释性相结合是该领域的关键问题,基于大数据的机器学习算法往往会缺乏可解释性;基于得到的风险评估模型发现高关联性危险因子,并探究适宜的高危分级标准。帮助医生快速全面地评估多重代谢异常聚集的风险程度,为GMS的早预警、早诊断、早干预、早预防提供精准的临床决策支持。

技术实现思路

[0007]本专利技术的目的在于针对现有技术的不足,提供一种妊娠期代谢综合征早期风险预测评估模型的构建方法。
[0008]本专利技术采用的技术方案如下:
[0009]一种妊娠期代谢综合征早期风险预测评估模型的构建方法,包括如下步骤:
[0010](1)获取多源异构数据,并对其进行预处理,得到代谢相关数据;
[0011](2)筛选与Gms高度关联的不良妊娠结局;
[0012](3)采用极端梯度提升(XGBoost)结合Stacking框架建立预测模型,根据(2)中确定的不良妊娠结局作为预测标签输入预测模型;
[0013](4)基于Shapley值计算预测模型中每个建模因子的特征重要性;
[0014](5)根据(4)中建模因子的特征重要性,基于聚类算法建立风险分层模型,得到Gms风险等级。
[0015]上述技术方案中,进一步的,所述多源异构数据包括门诊病历、实验室检验、超声影像检查、住院病历病程记录,所述预处理包括离群值剔除、缺失值填补、归一化。
[0016]进一步的,所述的代谢相关数据包括:血红蛋白,红细胞压积,血小板,中性粒细胞,淋巴细胞,嗜酸性粒细胞铁蛋白,部分凝血活酶时间,凝血酶原时间,纤维蛋白原,D

二聚体,葡萄糖,甘油三酯,总胆固醇,高密度脂蛋白胆固醇,低密度脂蛋白胆固醇,APOA1,APOB,同型半胱氨酸,尿酸,丙氨酸氨基转移酶,天门冬氨酸氨基转移酶,总蛋白,白蛋白,总胆红素直接胆红素肌酐,乳酸脱氢酶,血淀粉酶,总胆汁酸,甘胆酸,游离三碘甲状腺原氨酸,游离甲状腺素人促甲状腺激素,总三碘甲状腺原氨酸,总甲状腺素,甲状腺球蛋白抗体,抗甲状腺过氧化物酶抗体。
[0017]进一步的,步骤(2)筛选的不良妊娠结局为:
[0018]妊娠期高血压(HDP):妊娠20周后新发的高血压,BP≥140/90mmHg;
[0019]妊娠期糖尿病(GDM):妊娠期24至28周期间妇女接受OGTT被诊断为妊娠期糖尿病,基于IADPSG标准;
[0020]早产(PB):妊娠满37周以内的分娩;
[0021]小于胎龄儿(SGA):出生体重小于婴儿性别和胎龄的估计第10百分位数;大于胎龄儿(SGA):出生体重大于婴儿性别和胎龄的估计第90百分位数。
[0022]进一步的,所述预测模型是将Stacking框架融合应用于三个不同极端梯度提升元模型的集成,第一层为三个元模型XGB1、XGB2、XGB3,第二层为逻辑回归LR模型,利用不同的XGB模型生成训练集与测试集的预测值,三组XGB元模型层生成训练集与测试集的3组预测
值,每组XGB元模型将训练集划分为5份,按4:1逐一对训练集进行训练,得到预测值,并在测试集测试,3组XGB元模型反复此操作,最终将构建的新的训练集和测试集输入LR模型,分类输出GMS风险。
[0023]进一步的,步骤(5)中基于shapley值对特征重要性排序,选取最大的建模因子贡献值的10%作为阈值,筛选大于阈值的特征,作为聚类的输入变量。
[0024]本专利技术的有益效果在于:
[0025]通过本专利技术,可实现临床GM本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种妊娠期代谢综合征早期风险预测评估模型的构建方法,其特征在于,包括如下步骤:(1)获取多源异构数据,并对其进行预处理,得到代谢相关数据;(2)筛选与Gms高度关联的不良妊娠结局;(3)采用极端梯度提升(XGBoost)结合Stacking框架建立预测模型,根据(2)中确定的不良妊娠结局作为预测标签输入预测模型;(4)基于Shapley值计算预测模型中每个建模因子的特征重要性;(5)根据(4)中建模因子的特征重要性,基于聚类算法建立风险分层模型,得到Gms风险等级。2.根据权利要求1所述的妊娠期代谢综合征早期风险预测评估模型的构建方法,其特征在于,所述多源异构数据包括门诊病历、实验室检验、超声影像检查、住院病历病程记录,所述预处理包括离群值剔除、缺失值填补、归一化。3.根据权利要求1所述的妊娠期代谢综合征早期风险预测评估模型的构建方法,其特征在于,所述的代谢相关数据包括:血红蛋白,红细胞压积,血小板,中性粒细胞,淋巴细胞,嗜酸性粒细胞铁蛋白,部分凝血活酶时间,凝血酶原时间,纤维蛋白原,D

二聚体,葡萄糖,甘油三酯,总胆固醇,高密度脂蛋白胆固醇,低密度脂蛋白胆固醇,APOA1,APOB,同型半胱氨酸,尿酸,丙氨酸氨基转移酶,天门冬氨酸氨基转移酶,总蛋白,白蛋白,总胆红素直接胆红素肌酐,乳酸脱氢酶,血淀粉酶,总胆汁酸,甘胆酸,游离三碘甲状腺原氨酸,游离甲状腺素人促甲状腺激素,总三碘甲状腺原氨酸,总甲状腺素,甲状腺球...

【专利技术属性】
技术研发人员:胡文胜卢莎江泓马聿嘉
申请(专利权)人:杭州市妇产科医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1