System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于常规检查早期预测胆道闭锁的机器学习方法技术_技高网

一种基于常规检查早期预测胆道闭锁的机器学习方法技术

技术编号:41291328 阅读:4 留言:0更新日期:2024-05-13 14:42
本发明专利技术涉及一种基于常规检查早期预测胆道闭锁的机器学习方法。目前,BA诊断的金标准是术中胆管造影术。这是一种侵入性手术,技术难度很大,而且仅限于大型医疗中心使用。本发明专利技术包括数据收集和数据预处理,将数据保存成数据库文件,还包括对数据进行模型训练,模型训练是收集五个重要特征数据,分别是γ‑谷氨酰转移酶、肝门纤维块、体重、胆囊异常和粪便颜色,再将四个模型包括支持向量机(SVM)、逻辑回归(LR)、随机森林RF和梯度增强决策树(GBDT)集成为一个集合,命名为胆道闭锁预测模型(BAPM),胆道闭锁的预测风险是通过该四个模型的输出概率的加权投票过程得出。本发明专利技术使用常规检查来帮助患者早期无创预测胆道闭锁,促进临床决策。

【技术实现步骤摘要】

本专利技术涉及一种基于常规检查早期预测胆道闭锁的机器学习方法,筛选并利用重要特征帮助医疗专业人员更有效地预测胆道闭锁,从而促进临床决策。


技术介绍

1、胆道闭锁(ba)是一种严重的新生儿疾病,可导致胆汁淤积和进行性肝衰竭。ba发生率约为8000至18000活产中的1例,如果不进行干预,将导致患儿在生后两年内死亡。婴儿预后在很大程度上取决于早期转诊和kasai门肠造口术的及时实施。当在生后45天内进行kasai肝门肠吻合术时,2岁时存活率可分别达到65.5%和15岁时的40.5%。因此,早期诊断很重要。目前,ba诊断的金标准是术中胆管造影术。这是一种侵入性手术,技术难度很大,而且仅限于大型医疗中心使用。

2、制定ba早期检测策略很重要。在一些国家和地区,粪便颜色分布图已被广泛。这有助于加快早期转诊,减少kasai门肠造口术的时间。然而,在一个月的检查中,粪便色卡筛查的敏感性仅为76.5%。在一项美国队列研究中,直接/结合血清胆红素测量用于ba筛查,但灵敏度估计具有较宽的95%置信区间(ci),并且这些筛查工具不能保证完全识别假阴性结果。γ-谷氨酰转移酶(ggt)是早期诊断(ba)中使用最广泛的生物标志物,但其在不同亚群中的诊断功效值得怀疑。研究人员还确定了几种可能有助于诊断胆道闭锁的新的潜在生物标志物,如循环微小rna、基质金属蛋白酶-7、粪便蛋白、白细胞介素33、th17相关细胞因子、尿液代谢组学、抗平滑肌抗体、热休克蛋白90和阳性胆管上皮细胞cd56。然而,这些测试在医疗基础设施不发达的国家和地区可能不切实际。此外,b超发现门静脉前面的回声纤维组织(称为三角索征)是一个很重要的影像学指标,但这取决于操作人员的水平,灵敏度从49%到73%不等。


技术实现思路

1、本专利技术针对上述问题,提供一种基于常规检查早期预测胆道闭锁的机器学习方法,使用常规检查来帮助患者早期无创预测胆道闭锁,做到及时转诊。

2、为此,本专利技术采取如下技术方案:一种基于常规检查早期预测胆道闭锁的机器学习方法,包括数据收集和数据预处理,将数据保存成数据库文件,其特征在于还包括对数据进行模型训练,所述的模型训练是收集五个重要特征数据,分别是γ-谷氨酰转移酶、肝门纤维块、体重、胆囊异常和粪便颜色,再将四个模型包括支持向量机(svm)、逻辑回归(lr)、随机森林rf和梯度增强决策树(gbdt)集成为一个集合,命名为胆道闭锁预测模型(bapm),胆道闭锁的预测风险是通过该四个模型的输出概率的加权投票过程得出。

3、作为优选,所述的加权投票中各模型的权重svm、lr、rf和gbdt分别为0.2、0.2、0.35和0.25,其中胆道闭锁预测模型(bapm)的预测概率低于0.58被确定为胆道闭锁低风险,输出等于或高于0.58则被预测为胆道闭锁高风险。

4、作为优选,所述的数据划分为训练集和测试集,测试集是未参与模型训练的数据,用于模拟模型在实际应用中的性能。

5、作为优选,所述的五个重要特征数据是通过lasso线性回归选择得出的。lasso(最小绝对收缩和选择算子)线性回归是一种使用l1范数作为正则化项的线性回归方法。在lasso回归中,损失函数包括两个部分:数据拟合项(即最小二乘误差)和l1范数的正则化项。l1范数是指向量中各个元素绝对值之和,用于度量向量中非零元素的数量。在lasso回归中,通过引入l1范数正则化项,模型的训练过程中会使一些特征的权重趋向于零,从而实现特征的稀疏性。换句话说,lasso通过将一些不重要特征的权重收缩为零,实现了特征选择的效果。

6、作为优选,所述的数据收集是通过电子健康记录系统(ehr)获取病历和临床数据、通过医疗设备获取实时数据,或者从实验室数据库中获取的实验室结果数据。采集患者的相关信息。是在确保获得合法的数据获取权限,遵守医疗数据保护法规的前提下能获取相应数据。

7、作为优选,所述的数据预处理包括对于接收的数据进行删除无用数据、数据清洗、标准化和错误修正。

8、数据预处理是一个重要的步骤,旨在清洗、转换和准备原始数据,以便更好地适应机器学习算法的要求。

9、本专利技术是一种基于常规无创检测的多变量筛查模型,有助于胆道闭锁的早期识别,促进临床决策。本专利技术开发的bapm模型在内部验证队列xhv中获得了0.93439的auc,95%置信区间(ci)为0.8927~0.9685。外部验证队列ch中获得了0.94969的auc,95%置信区间(ci)为0.9220~0.9725。表明我们开发的bapm模型成功实现对婴儿胆道的精确预测闭锁。

本文档来自技高网...

【技术保护点】

1.一种基于常规检查早期预测胆道闭锁的机器学习方法,包括数据收集和数据预处理,将数据保存成数据库文件,其特征在于还包括对数据进行模型训练,所述的模型训练是收集五个重要特征数据,分别是γ-谷氨酰转移酶、肝门纤维块、体重、胆囊异常和粪便颜色,再将四个模型包括支持向量机(SVM)、逻辑回归(LR)、随机森林RF和梯度增强决策树(GBDT)集成为一个集合,命名为胆道闭锁预测模型(BAPM),胆道闭锁的预测风险是通过该四个模型的输出概率的加权投票过程得出。

2.根据权利要求1所述的一种基于常规检查早期预测胆道闭锁的机器学习方法,其特征在于所述的加权投票中支持向量机(SVM)、逻辑回归(LR)、随机森林RF和梯度增强决策树(GBDT)的权重分别为0.2、0.2、0.35和0.25,其中胆道闭锁预测模型(BAPM)的预测概率低于0.58被确定为胆道闭锁低风险,输出等于或高于0.58则被预测为胆道闭锁高风险。

3.根据权利要求1所述的一种基于常规检查早期预测胆道闭锁的机器学习方法,其特征在于所述的数据划分为训练集和测试集,测试集是未参与模型训练的数据,用于模拟模型在实际应用中的性能。

4.根据权利要求1-3任一所述的一种基于常规检查早期预测胆道闭锁的机器学习方法,其特征在于所述的五个重要特征数据是通过LASSO线性回归选择得出的。

5.根据权利要求1所述的一种基于常规检查早期预测胆道闭锁的机器学习方法,其特征在于所述的数据收集是通过电子健康记录系统(EHR)获取病历和临床数据、通过医疗设备获取实时数据,或者从实验室数据库中获取的实验室结果数据。

6.根据权利要求1所述的一种基于常规检查早期预测胆道闭锁的机器学习方法,其特征在于所述的数据预处理包括对于接收的数据进行删除无用数据、数据清洗、标准化和错误修正。

...

【技术特征摘要】

1.一种基于常规检查早期预测胆道闭锁的机器学习方法,包括数据收集和数据预处理,将数据保存成数据库文件,其特征在于还包括对数据进行模型训练,所述的模型训练是收集五个重要特征数据,分别是γ-谷氨酰转移酶、肝门纤维块、体重、胆囊异常和粪便颜色,再将四个模型包括支持向量机(svm)、逻辑回归(lr)、随机森林rf和梯度增强决策树(gbdt)集成为一个集合,命名为胆道闭锁预测模型(bapm),胆道闭锁的预测风险是通过该四个模型的输出概率的加权投票过程得出。

2.根据权利要求1所述的一种基于常规检查早期预测胆道闭锁的机器学习方法,其特征在于所述的加权投票中支持向量机(svm)、逻辑回归(lr)、随机森林rf和梯度增强决策树(gbdt)的权重分别为0.2、0.2、0.35和0.25,其中胆道闭锁预测模型(bapm)的预测概率低于0.58被确定为胆道闭锁低风险,输出等于或高于0.5...

【专利技术属性】
技术研发人员:陈旭婷钱继红赵冬莹张拥军
申请(专利权)人:上海交通大学医学院附属新华医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1