一种慢性肾病辅助筛查模型构建方法、筛查方法及系统技术方案

技术编号:38562867 阅读:13 留言:0更新日期:2023-08-22 21:02
本发明专利技术提供一种慢性肾病的辅助筛查模型构建方法、筛查方法及筛查系统。所述构建方法包括:从经病理证实患有慢性肾病患者的电子病历中提取预训练样本,并从所述预训练样本中筛选重要性高的医学评估指标参数以及诊断结果构成训练样本,所述诊断结果为患慢性肾病的风险等级;将训练样本用于训练多种机器学习模型,对训练后的多个机器学习模型进行验证后进行模型融合得到慢性肾病辅助筛查模型。通过本发明专利技术的技术方案得到的慢性肾病辅助筛查模型,能够准确地、高效地辅助医生,基于待诊患者在检测过程中已经得到的医学评估指标数据提前给出该待诊患者患慢性肾病的风险等级,而不用等待该待诊患者24小时尿蛋白定量的检测结果完全给出。完全给出。完全给出。

【技术实现步骤摘要】
一种慢性肾病辅助筛查模型构建方法、筛查方法及系统


[0001]本专利技术所属的
为智慧医疗领域,具体涉及一种慢性肾病(CKD)辅助筛查模型构建方法、筛查方法及系统。

技术介绍

[0002]现今慢性肾脏病(chronic kidney disease,CKD)已成为世界上一个突出的公共卫生问题;其具有高发病率与高死亡率等临床特点,并且通常治疗费用高昂、带给患者相当大的经济负担。24小时尿蛋白定量是评估CKD严重程度主要方法之一,医生需要根据就诊者24小时尿蛋白检测结果判断其患CKD的风险以及严重程度。但是24小时尿蛋白定量需要就诊者在一天中持续多次进行相关指标的检测,显然这样会增加了门诊随访的难度。
[0003]在Asif等人的研究中利用K最近邻(k

Nearest Neighbor,kNN)分类算法、随机森林(Random Forests,RF)和神经网络(Neural Network,NN)构建了检测CKD的模型,并提出了一种新的CKD检测方法(诊断是否有CKD)。Chih

Yin Ho等人提出了一种基于超声图像分析的计算机辅助诊断系统,从CKD患者中收集数千个超声图像数据集,并应用所挑选的典型CKD图像进行预分析处理和训练以进行评估,为医生提供CKD识别和分类的可视化辅助诊断工具。Chase等人使用除肾小球滤过率(estimated glomerular filtration rate,EGFR)之外的6项实验室数据,分别利用朴素贝叶斯(Naive Bayes,NB)、逻辑回归(Logistic Regression,LR)模型对CKD患者由3期向4期进展的概率进行预测。Chase所构建的预测模型的敏感性(sensitivity)表现最高仅72%,且其构建模型所使用训练样本数据大多来源于年龄较大的女性,所获得模型的预测适应性不强。并且目前的CKD预测模型缺乏可靠、稳定且透明的全局解释框架。
[0004]另外,Khannara等人通过分析共同风险因素,利用NN、k

NN、NB构建模型,研究了高血压、糖尿病对CKD进展的影响。但此类研究更多的是使用基于数据挖掘或者单一的统计模型和机器学习算法来对CKD患者进行分析预测。但是由于分析数据的多样性以及样本的异质性,单一的统计模型或者机器学习算法无法充分挖掘出数据中所隐含的信息。

技术实现思路

[0005]本专利技术的目的在于提供一种预测适应能力强,能够充分挖掘出数据之间的所隐含的信息的慢性肾病辅助筛查模型构建方法、筛查方法及系统。并且通过本专利技术提供的方法构建的慢性肾病辅助筛查模型能够解释其在CKD预测过程中的风险因素,其预测结果有助于指导治疗决策以减缓肾脏疾病的进展并预防其并发症,指导制定透析和肾脏移植计划。
[0006]本专利技术的第一方面提供一种慢性肾病筛查模型的构建方法,所述构建方法包括以下步骤:
[0007]S1,从经病理证实患有慢性肾病患者的电子病历中,提取慢性肾病相关的医学评估指标参数值组和诊断结果构成预训练样本,经病理证实患有慢性肾病患者、电子病历、预训练样本为一一对应关系,所述诊断结果为慢性肾病的风险等级;慢性肾病高风险对应的
确诊标准为24小时尿蛋白定量大于1g,慢性肾病低风险对应的确诊标准为24小时尿蛋白定量小于/等于1g;
[0008]S2,对所述预训练样本进行特征数据标准化及特征数据清洗处理;
[0009]S3,基于步骤S2处理后的预训练样本进行医学评估指标筛选;
[0010]S4,从每条预处理后的预训练样本中提取步骤S3筛选得到的医学评估指标对应的参数值、并按序存储构成对应的一条训练样本;
[0011]S5,基于所述训练样本构成的数据集对多个机器学习模型进行训练;
[0012]S6,对训练后的多个机器学习模型进行模型融合得到慢性肾病辅助筛查模型。
[0013]进一步地,所述步骤S2具体实现为:
[0014]步骤S2.1,将预训练样本进行编码,并对编码后的预训练样本进行归一化处理;
[0015]步骤S2.2,对归一化处理后的预训练样本,采用KMeans聚类算法检测异常值并剔除极端离群值;
[0016]步骤S2.3,对剔除极端离群值的预训练样本进行SMOTE处理,并基于随机森林算法对预训练样本中缺失的数据进行填充。
[0017]进一步地,所述步骤S3实现为:采用基于逻辑回归的递归特征消除改进算法计算出每个医学评估指标对应慢性肾病筛查的重要性;从预处理后的预训练样本中选择所述重要性靠前的若干医学评估指标以及对应的诊断结果构成训练样本。这一步主要是由于跟CKD相关的医学评估指标比较多,但是每个风险参考因素参考权重是不一样的,通过基于逻辑回归的递归特征消除改进算法对相关医学评估指标进行重要性排序,仅选择重要性权重之和大于一定阈值的医学评估指标构成训练样本。这样做不仅能减少训练样本的数据量,而且还能排除一些不重要的医学评估指标对预测的干扰。例如,仅选择重要性权重之和大于95%的前N个医学评估指标构成训练样本,N为大于1的正整数。
[0018]进一步地,所述S5中基于所述训练样本构成的数据集对多个机器学习模型进行训练,包括:基于交叉验证方法将训练样本构成的样本数据集划分为训练样本集和测试数据集;利用所述训练样本集分别对所述多个机器学习模型进行训练,并采用所述测试样本集对训练好的机器学习模型进行测试验证。优选地,所述训练样本集和所述测试样本集的训练样本数的比例为5:1。
[0019]在所述步骤S6中,采用所述测试样本集对训练好的机器学习哦模型进行测试验证,从所述训练好的多个机器学习模型中选取ROC曲线下面积(AUC)得分最高的两个或三个机器学习模型,基于投票法进行模型融合得到所述慢性肾病辅助筛查模型。
[0020]进一步地,所述构建方法还包括:步骤S7,采用机器学习可解释性工具(Shapley Additive exPlanations,SHAP)解析所述慢性肾病辅助筛查模型对慢性肾病的预测过程。所述解析包括:通过计算SHAP值解释每个医学评估指标对CKD风险预测的贡献。
[0021]本专利技术的第二方面提供一种慢性肾病的辅助筛查方法。所述辅助筛查方法包括:采集筛查者的相关医学评估指标并处理成慢性肾病辅助筛查模型预测时所需要的输入序列,将所述输入序列输入到所述性肾病辅助筛查模型进行慢性肾病风险预测;所述慢性肾病辅助筛查模型通过上述慢性肾病辅助筛查模型的构建方法构建。
[0022]本专利技术的第三方面提供一种慢性肾病的辅助筛查系统。所述辅助筛选系统包括运行在虚拟机上的慢性肾病辅助筛查模型,所述慢性肾病辅助筛查模型基于上述慢性肾病辅
助筛查模型的构建方法构建。
[0023]另外,与上述构建方法相对应,本专利技术还提供一种计算机可读存储介质,其指标在于,所述计算机可读存储介质上存储有程序代码,所述程序代码在被处理器执行时,实现上述慢性肾病辅助筛查模型的构建方法。
...

【技术保护点】

【技术特征摘要】
1.一种慢性肾病筛查模型构建方法,其特征在于,所述构建方法包括:S1,从经病理证实患有慢性肾病患者的电子病历中,提取慢性肾病相关的医学评估指标参数值组和诊断结果构成预训练样本;经病理证实患有慢性肾病患者、电子病历、预训练样本为一一对应关系;所述诊断结果为慢性肾病的风险等级;S2,对所述预训练样本进行特征数据标准化及特征数据清洗处理;S3,基于步骤S2处理后的预训练样本进行医学评估指标筛选;S4,从每条预处理后的预训练样本中提取步骤S3筛选得到的医学评估指标对应的参数值、并按序存储构成对应的一条训练样本;S5,基于所述训练样本构成的数据集对多个机器学习模型进行训练;S6,对训练后的多个机器学习模型进行模型融合得到慢性肾病辅助筛查模型。2.如权利要求1所述的构建方法,其特征在于,所述慢性肾病的风险等级分为高风险和低风险;其中,高风险对应的确诊标准为24小时尿蛋白定量大于1g,慢性肾病低风险对应的确诊标准为24小时尿蛋白定量小于/等于1g。3.如权利要求2所述的构建方法,其特征在于,所述步骤S2中对所述预训练样本进行预处理,包括:步骤S2.1,将预训练样本进行编码,并对编码后的预训练样本进行归一化处理;步骤S2.2,对归一化处理后的预训练样本,采用KMeans聚类算法检测异常值并剔除极端离群值;步骤S2.3,对剔除极端离群值的预训练样本进行SMOTE处理,并基于随机森林算法对预训练样本中缺失的数据进行填充。4.如权利要求3所述的构建方法,其特征在于,所述步骤S4实现为:采用基于逻辑回归的递归特征消除改进算法计算出每个医学评估指标对应慢性肾病筛查的重要性;从预处理后的预训练样本中选择所述重要性靠前的若干医学评估指标以及对应的诊断结果构成训练样本。5.如权利要求4...

【专利技术属性】
技术研发人员:宋娜娜陆雨菲赵栓张伟东张健杨炎陈威泽颜芷昕陈安南孙滢雪孙凯璘林静袁敏丁小强
申请(专利权)人:复旦大学附属中山医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1