System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于疾病风险预测,尤其涉及一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法及系统。
技术介绍
1、子痫前期是一类常见的妊娠期多系统疾病,发病率约为3~8%。子痫前期的主要特征为孕妇高血压与蛋白尿,重度患者伴随全身多器官损害或功能衰竭,严重者可出现孕妇抽搐、昏迷、甚至死亡,约占导致孕妇死亡的直接或间接原因的10~15%。虽然子痫前期的病因并不明确,且除终止妊娠外并无有效治疗方法,但若能尽早发现,及时干预,可以有效降低相关并发症对孕妇的伤害,从而有效预防子痫前期导致的孕妇死亡。
2、当前构建子痫前期的预测模型一直是子痫前期预防的研究热点。预测模型的研究主要分两个方向:一方面是关于新的预测因子或标志物的开发。孕妇的基线因素如孕妇的高龄、未曾生育过的初产妇、既往子痫前期病史、怀孕间隔时间、使用辅助生殖技术、子痫前期家族史、肥胖、妊娠期高血糖、既往慢性高血压、肾脏疾病以及自身免疫疾病,如系统性红斑狼疮和抗磷脂综合征等,都与子痫前期的发生有关。但传统的早孕期筛查子痫前期高风险人群的方法是通过母体特征和病史进行评估,只能识别30%-40%的子痫前期孕妇,预测效果不佳。因此,母体基线联合生物物理或生化标志物如平均动脉压(map)、子宫动脉搏动指数(uta-pi)、血清胎盘生长因子(plgf)和妊娠相关血浆蛋白a(papp-a)等构建pe的预测模型已成为当前的主要趋势,在预测因子的选择时不仅要考虑对预测效能或模型属性的提升,也需要考虑预测因子大规模推广时的成本效益和实际应用价值,例如uta-pi需要为超声科医生提供
技术实现思路
1、本专利技术针对现有技术中的不足,提供一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法及系统。
2、第一方面,本专利技术提供一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,包括:
3、获取患者母体因素数据与早期孕期生物标志物数据;所述母体因素数据包括孕期年龄、身高、孕期体重、生育史、子痫前期史、糖尿病史、高血压史、辅助生殖、子痫前期家族史、系统性红斑狼疮或抗磷脂综合征和结局情况;所述早期孕期生物标志物数据包括平均动脉压、子宫动脉搏动指数、血清胎盘生长因子和血浆蛋白a;
4、以患者母体因素与早期孕期生物标志物为输入,患者结局是否为子痫前期为输出,利用机器学习方法的投票分类器对输入数据进行训练;
5、重复目标次数采用五折交叉验证确定机器学习模型超参数的过程,并加以自助法计算目标百分比的置信区间,以得到稳定的结果评估;
6、对机器学习模型进行效果评估和解释,以预测子痫前期风险。
7、进一步地,所述以患者母体因素与早期孕期生物标志物为输入,患者结局是否为子痫前期为输出,利用机器学习方法的投票分类器对输入数据进行训练,包括:
8、在随机森林分类器模型中,根据以下公式计算每个输入变量的信息增益:
9、
10、其中,d为决策树上当前节点的数据集;xi为输入变量,包括患者母体因素与早期孕期生物标志物;ig(d,xi)为输入变量xi的信息增益;entropy(d)为d的熵;p(y)为数据集d中输出变量y为子痫前期的概率;y为输出变量集合;dv为xi上值为v的子集;entropy(dv)为dv的熵;values(xi)为输入变量xi的值的集合;
11、选择最大信息增益的输入特征xbest分割数据集d,得到多个子数据集;
12、对每个子数据集进行分割,直至达到预设分割次数阈值;
13、根据以下公式计算每个叶节点的预测类别yleaf:
14、yleaf=mode{y|(x,y)∈dleaf};
15、其中,x为数据集中的样本,包含所有特征值的向量;dleaf为叶节点集合;
16、在极端随机树分类器模型中,对每个特征随机选择一个切分点,将最好的切分点作为节点的切分规则;
17、根据以下公式计算切分点的信息增益:
18、
19、其中,ig(dp,f)为选定的切分点的信息增益;i为不纯度度量;dp为父节点的数据集;nleft为切分后左子节点的样本数;nright为切分后右子节点的样本数;np为父节点的样本数;dleft为切分后左子节点的数据集;dright为切分后右子节点的数据集。
20、进一步地,所述所述对机器学习模型进行效果评估和解释,以预测子痫前期风险,包括:
21、利用roc曲线与roc曲线下与坐标轴围成的面积评估机器学习模型的性能;
22、利用灵敏度衡量机器学习模型识别正例的能力;
23、利用特异度衡量机器学习模型识别负例的能力;
24、利用正确率衡量机器学习模型正确分类的样本占总样本的比例;
25、利用假阳性率10%时的真阳性率与假阳性率20%时的真阳性率,评估在目标假阳性率水平下,机器学习模型的真阳性率;
26、利用校正曲线、校正曲线截距与校正曲线斜率衡量机器学习模型的预测概率准确性;
27、利用brier分数衡量机器学习模型的概率预测的准确性。。
28、进一步地,所述对机器学习模型进行效果评估和解释,以预测子痫前期风险,还包括:
29、采用shapleyadditive explanations进行模型解释,并根据以下公式计算shap值:
30、
31、其中,φi为第i个特征的shap值;s为不包含特征i的特征集合;n为所有特征的集合;|s|为集合s中的特征数量;|n|为集合n中的特征数量;fx(s)为考虑特征集合s时的模型预测值,fx(s∪{i})为考虑特征集合s并加上特征i时的模型预测值。
32、第二方面,本专利技术提供一种基于母体因素和早期孕期生物标志物的子痫前期风险预测系统,包括:
33、获取模块,用于获取患者母体因素数据与早期孕期生物标志物数据;所述母体因素数据包括孕期年龄、身高、孕期体重、生育史、子痫前期史、糖尿病史、高血压史、辅助生殖、子痫前期家族史、系统性红斑狼疮或抗磷脂综合征和结局情况;所述早期孕期生物标志物数据包括平均动脉压、子宫动脉搏动指数、血本文档来自技高网...
【技术保护点】
1.一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,包括:
2.根据权利要求1所述的基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,所述以患者母体因素与早期孕期生物标志物为输入,患者结局是否为子痫前期为输出,利用机器学习方法的投票分类器对输入数据进行训练,包括:
3.根据权利要求1所述的基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,所述所述对机器学习模型进行效果评估和解释,以预测子痫前期风险,包括:
4.根据权利要求1所述的基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,所述对机器学习模型进行效果评估和解释,以预测子痫前期风险,还包括:
5.一种基于母体因素和早期孕期生物标志物的子痫前期风险预测系统,其特征在于,包括:
6.一种计算机设备,其特征在于,包括处理器和存储器;其中,处理器执行存储器中保存的计算机程序时实现权利要求1-4任一项所述的基于母体因素和早期孕期生物标志物的子痫前期风险预测方法的步骤。
7.一种计算机可读存
...【技术特征摘要】
1.一种基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,包括:
2.根据权利要求1所述的基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,所述以患者母体因素与早期孕期生物标志物为输入,患者结局是否为子痫前期为输出,利用机器学习方法的投票分类器对输入数据进行训练,包括:
3.根据权利要求1所述的基于母体因素和早期孕期生物标志物的子痫前期风险预测方法,其特征在于,所述所述对机器学习模型进行效果评估和解释,以预测子痫前期风险,包括:
4.根据权利要求1所述的基于母体因素和早期孕期生物标志物的子痫前期风险...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。