当前位置: 首页 > 专利查询>南通大学专利>正文

一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法技术

技术编号:26480763 阅读:26 留言:0更新日期:2020-11-25 19:26
本发明专利技术提供了一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,包括如下步骤:S10数据采集,使用自然语言处理方法从系统性红斑狼疮患者电子病历中抽取了表型数据以及人口统计学数据;S20将所述表型数据以及所述人口统计学数据通过01矩阵转换为特征向量;S30模型训练,使用部分所述特征向量对所述狼疮性肾炎预测模型进行训练,获得所述狼疮性肾炎预测模型。本发明专利技术的一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,使用大量现有的电子病历数据建立狼疮性肾炎预测模型,将所述狼疮性肾炎预测模型应用于所述红斑狼疮患者并发症的研究,可针对高危人群采取恰当措施,辅助医生诊疗,降低狼疮性肾炎的发病率。

【技术实现步骤摘要】
一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法
本专利技术涉及智慧医疗
,具体涉及一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法。
技术介绍
系统性红斑狼疮(systemiclupuserythematosus,SLE)是一种全身性的自身免疫疾病,病变累及多个器官和系统,包括皮肤、关节、血液和心脏等。SLE常常伴随着各种并发症,狼疮性肾炎(Lupusnephritis,LN)是其中的一种,严重时可导致肾脏衰竭甚至患者死亡。因此,若能提前预测肾脏损害,对可能发生狼疮性肾炎的高危人群及时采取临床措施,将会大大提高狼疮性肾炎患者的治愈率。近些年来,随着电子病历的普及,电子病历中累积的数据也在不断增加。其中包括患者从入院到出院的大量诊断、用药、检查和手术等反映病人身体状况和疾病发展的描述性信息。如果我们能从这些大量的描述性信息中挖掘出潜在有价值的信息,就可以辅助进而指导临床治疗。然而,电子病历中的信息都是非结构化的文本数据,不能直接利用,需要我们将其转化为目前机器学习和深度学习模型可识别的数据,才能进一步做一些疾病诊断、预测的工作。之前的一些学者做了这方面的一些研究,如严小倩等人使用中西医结合的研究方法,寻找狼疮性肾炎复发的风险因素,发现尿VCAM-1及尿Periostin与疾病活动度密切相关。甘雅端分析不同类型的狼疮性肾炎,建立了狼疮性肾炎的逻辑回归预测模型,结果发现不同类型的狼疮性肾炎临床表现和实验室指标存在差异,模型性能也不相同,如弥漫增生型AUC值(areaunderthereceiveroperatingcharacteristiccurve,AUC)为0.797,膜型狼疮性肾炎AUC值为0.769。丁蓓蓓等建立了Cox风险比例回归分析模型,探讨血清抗α-辅肌动蛋白抗体(anti-alpha-actininantibody,AαA)、补体水平及血清蛋白对狼疮性肾炎发病的预测价值,结论是血清AαA与LN组白蛋白与球蛋白的比值(albumintoglobulinratio,AGR)水平降低与狼疮性肾炎的发生存在强相关性。Youzhou等人使用随机森林和多元线性回归的方法,分别建立了狼疮性肾炎病理分类预测模型和慢性急性病理指数预测模型,并获得了与狼疮性肾炎病理分类相关性很高的多个变量。根据组织学活动和慢性指数,狼疮性肾炎被分为6类,每一类的治疗方法都不相同。JIMC.OATES的人建立了人工神经网络模型,来预测狼疮性肾炎蛋白标志物,从而对LN进行分类,结果显示神经网络AUC值为0.85-0.95。然而,大多数存在的模型使用的数据量都很少,患者总数只有几百例;研究的变量较为单一,很多实验都针对特定的狼疮性肾炎变量探讨,因此,结果不具有普遍意义。同时,这些研究使用的模型较为单一,并没有对比多个机器学习或深度学习模型的性能,得出的结论没有足够强的说服力。随着机器学习和深度学习的发展,这些技术已经可以处理越来越大的数据量,越来越复杂的问题,因此,我们可以使用性能更好的算法来建立预测模型,获得更好的预测效果。
技术实现思路
为了解决上述问题,本专利技术提供一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,使用大量现有的电子病历数据建立狼疮性肾炎预测模型,将所述狼疮性肾炎预测模型应用于所述红斑狼疮患者并发症的研究,可针对高危人群采取恰当措施,辅助医生诊疗,降低狼疮性肾炎的发病率。为了实现以上目的,本专利技术采取的一种技术方案是:一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,包括如下步骤:S10数据采集,使用自然语言处理方法从系统性红斑狼疮患者电子病历中抽取了表型数据以及人口统计学数据;S20特征抽取,将所述表型数据以及所述人口统计学数据通过01矩阵转换为特征向量;以及S30模型训练,使用部分所述特征向量对所述狼疮性肾炎预测模型进行训练,同时使用另一部分所述特征向量对所述狼疮性肾炎预测模型进行测试,获得所述狼疮性肾炎预测模型。进一步地,所述表型数据包括诊断结果、使用药物、症状和化验结果;所述人口统计学数据包括年龄、性别。进一步地,所述表型数据以及所述人口统计学数据包括观察期、第一预测期以及第二预测期的数据,所述观察期为患者首次被诊断为系统性红斑狼疮时间点之前,所述第一预测期从患者首次被确诊为系统性红斑狼疮到一年之内,所述第二预测期为所述第一预测期结束之后到第二年之内称为第二预测期。进一步地,所述步骤S10中删除所述电子病历中临床医生已经判断患有肾炎的电子病历数据。进一步地,所述狼疮性肾炎预测模型为逻辑回归、SVM、XGBoost或LightGBM模型中的一种。本专利技术的上述技术方案相比现有技术具有以下优点:本专利技术的一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,使用大量现有的电子病历数据建立狼疮性肾炎预测模型,将所述狼疮性肾炎预测模型应用于所述红斑狼疮患者并发症的研究,可针对高危人群采取恰当措施,辅助医生诊疗,降低狼疮性肾炎的发病率。附图说明下面结合附图,通过对本专利技术的具体实施方式详细描述,将使本专利技术的技术方案及其有益效果显而易见。图1所示为本专利技术一实施例的一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法流程图;图2所示为本专利技术一实施例的四个模型在第一预测期测试集ROC曲线图;图3所示为本专利技术一实施例的四个模型在第二预测期测试集ROC曲线图;图4所示为本专利技术一实施例的四个模型在两个预测期上测试集AUPRC对比;图5所示为本专利技术一实施例的四个模型在第二预测时间所用时间对比。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本实施例提供了一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,如图1所示,包括如下步骤:S10数据采集,使用自然语言处理方法从系统性红斑狼疮患者电子病历中抽取了表型数据以及人口统计学数据。S20特征抽取,将所述表型数据以及所述人口统计学数据通过01矩阵转换为特征向量。以及S30模型训练,使用部分所述特征向量对所述狼疮性肾炎预测模型进行训练,同时使用另一部分所述特征向量对所述狼疮性肾炎预测模型进行测试,获得所述狼疮性肾炎预测模型。所述步骤S10中,所述表型数据包括诊断结果、使用药物、症状和化验结果;所述人口统计学数据包括年龄、性别。所述表型数据以及所述人口统计学数据包括观察期、第一预测期以及第二预测期的数据,所述观察期为患者首次被诊断为系统性红斑狼疮时间点之前,所述第一预测期从患者首次被确诊为系统性红斑狼疮到一年之内,所述第二预测期为所述第一预测期结束之后到第二年之内称为第二预测期。删除所述电子病历中临床医生已经判断患有肾炎的电子病历数据。所述步骤S30中,所述狼疮性肾炎预测模型为逻辑回归、SVM、XGBoost或LightGBM模本文档来自技高网
...

【技术保护点】
1.一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,其特征在于,包括如下步骤:/nS10数据采集,使用自然语言处理方法从系统性红斑狼疮患者电子病历中抽取了表型数据以及人口统计学数据;/nS20特征抽取,将所述表型数据以及所述人口统计学数据通过01矩阵转换为特征向量;以及/nS30模型训练,使用部分所述特征向量对所述狼疮性肾炎预测模型进行训练,同时使用另一部分所述特征向量对所述狼疮性肾炎预测模型进行测试,获得所述狼疮性肾炎预测模型。/n

【技术特征摘要】
1.一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法,其特征在于,包括如下步骤:
S10数据采集,使用自然语言处理方法从系统性红斑狼疮患者电子病历中抽取了表型数据以及人口统计学数据;
S20特征抽取,将所述表型数据以及所述人口统计学数据通过01矩阵转换为特征向量;以及
S30模型训练,使用部分所述特征向量对所述狼疮性肾炎预测模型进行训练,同时使用另一部分所述特征向量对所述狼疮性肾炎预测模型进行测试,获得所述狼疮性肾炎预测模型。


2.根据权利要求1所述的红斑狼疮患者的狼疮性肾炎预测模型的建模方法,其特征在于,所述表型数据包括诊断结果、使用药物、症状和化验结果;所述人口统计学数据包括年龄、性别。


3.根据权利要求2所述...

【专利技术属性】
技术研发人员:王理白鹤鸣潘文洁杨永杰张远鹏
申请(专利权)人:南通大学南通先进通信技术研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1