患者长期预后定量预测和干预系统及方法技术方案

技术编号:19217419 阅读:41 留言:0更新日期:2018-10-20 07:19
本发明专利技术公开了一种患者长期预后定量预测和干预方法,包括:录入新增患者信息以更新数据库;利用训练数据库选择危险因素;将COX危险分级和LCA危险分级结合得到患者的综合危险分级,并确定患者的危险评分计算方法;计算患者的综合危险分级和危险评分,在患者出院时,医生根据综合分级和危险评分进行干预。本发明专利技术还提供了一种患者长期预后定量预测和干预系统。本发明专利技术的有益效果:变量选取充分考虑了估计的随机性,模型更可靠,采用LCA危险分级对COX危险分级作校正和补充,使分级更侧重患者本身特征,分级方法更可靠,有效克服在长期内患者发生不良事件的可靠性较差的影响,并有针对性地对患者进行出院教育和医生干预,有效降低患者出院后面临的危险。

【技术实现步骤摘要】
患者长期预后定量预测和干预系统及方法
本专利技术涉及一种患者长期预后定量预测和干预系统及方法。
技术介绍
病人在出院后依然面临着危险。研究指出,在美国大约有20%的病人会在出院后的30天内再入院,中国心力衰竭患者1年内的再入院或死亡率达34.3%。病人出院时缺乏有效的干预措施以及出院后缺乏连续系统的护理是发生不良事件一个主要根源。因而,研究病人出院后的危险因素并采取系统的干预措施是很必要的。现有的关于病人出院后危险的研究,局限于建立预测模型,且主要是关于死亡的短期预测模型。采用这种方法的缺陷在于:(1)一般使用传统的logistic回归模型逐步法来选择危险因素,一旦一个变量在某一步被剔除,有可能没有机会再次进入模型,因而变量选取的好坏与剔除变量的准则和允许变量进入的准则有关,有可能会遗漏重要的变量,导致该方法选择模型不稳定;(2)利用病人出院后是否发生不良事件的实际观测值来建立模型,前提假设是所有观测到的不良事件都是合理的,而在长期模型中,这种假设本身有很大的局限性,相比于短期,患者在长期是否发生不良事件具有更大的不确定性,很有可能出院时身体状况比较好的患者发生了不良事件,而出院时身体状况不佳的患者没有发生不良事件。仅根据观测到的结局事件建立模型,没有考虑到在长期发生不良事件本身的不确定性,导致所建模型有可能无法抓住数据的本质特征。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种患者长期预后定量预测和干预系统及方法,变量选取充分考虑了估计的不确定性,使建立的模型更加可靠,采用基于人工智能的无监督的机器学习LCA危险分级对传统的基于COX回归模型的危险分级作校正和补充,使得危险分级更加侧重患者本身的特征,分级方法更可靠,有效克服了在长期内患者发生不良事件的不确定性的影响。在患者出院时,能更有针对性地对患者进行出院教育和医生干预,有效降低患者出院后面临的危险。本专利技术提供了一种患者长期预后定量预测和干预方法,该方法包括以下步骤:步骤1,将新患者信息补充到数据库以更新数据库;步骤2,利用训练数据库,通过COX回归模型和马尔可夫链蒙特卡洛模拟方法得到影响结局变量的危险因素;步骤3,利用训练数据库和步骤2得到的危险因素,采用基于无监督机器学习方法的LCA危险分级对基于COX回归模型的危险分级进行校正和补充,得到综合危险分级,并确定危险评分计算方法;步骤4,根据步骤3确定的危险分级和危险评分算法,计算患者的危险分级和危险评分,将患者按照发生不良事件的危险大小划分为高危、中危、低危,在患者出院时,医生根据患者的危险分级和危险评分进行干预。作为本专利技术进一步的改进,步骤2包括:步骤21,从训练数据库中确定备选变量、结局事件和预测期限;步骤22,采用COX回归模型从备选变量中初筛变量:假设患者在时刻t发生结局事件的强度为λ(t),即为危险函数,COX回归模型假设危险函数λ(t)与解释变量x=(x1,x2,...,xp)有关,记为λ(t;x),λ(t;x)=λ0(t)exp(xTβ),式中λ0(t)为基线危险函数,即在时刻t当x=0时的危险函数,x为p维解释向量,β为未知参数即为备选变量;记Tsurv为生存时间,Tcens为删失时间,T=min(Tsurv,Tcens),D=1表示发生了事件,D=0表示删失,x=(x1,x2,...,xp)为p维解释向量,假设(t1,d1,x1),(t2,d2,x2),...,(tn,dn,xn)为3维随机向量(T,D,X)的n个不相关的观测值,则COX回归模型的部分对数似然函数为:其中R(ti)为在ti时刻前既未发生事件也未删失的在危人群,求出上述部分对数似然函数的极大似然估计作为相应解释变量的回归系数估计值求出回归系数估计值的标准差,构造卡方分布并得到相应的P值;根据P值大小并结合预先设定的阈值,从备选变量中初步筛选出初筛变量;步骤23,采用马尔可夫链蒙特卡洛算法对步骤22得到的初筛变量进行精选,获得精选变量:假设训练数据库中的样本量为N,经COX回归模型初步筛选出的变量共有M个,依次记为(x1,x2,...,xM),其对应的系数记为(β1,β2,...,βM);采用Metropolis-Hastings抽样算法进行抽样,将(β0,β1,...,βM)的初始值设为0,从(β0,β1,...,βM)的后验分布抽取10000个随机样本;如果某个解释变量xi对应的系数βi大于0,表示此解释变量与结局变量正相关,小于0表示与结局变量负相关,等于0表示与结局变量不相关,其中(i=1,2,...,M),在系数βi的10000次随机抽样中,如果大于0的概率在0.9以上,或者小于0的概率在0.9以上,则说明此解释变量与结局变量的关系稳定且显著,将该系数所对应的解释变量保留,否则剔除,如此获取最终的精选变量;步骤24,加入特色变量;步骤25,将步骤23中的精选变量和步骤24中的特色变量合并,得到最终确定的危险因素,假设有Q个,记为X=(X1,X2,...,XQ);步骤26,采用Test和Validation数据库验证最终确定的危险因素。作为本专利技术进一步的改进,步骤3包括:步骤31,利用训练数据库和步骤2得到的危险因素建立COX回归模型,获取COX危险分级的参数:假设训练数据库的样本量为N,总共有Q个危险因素,计算每个危险因素对应的回归系数,记为其中T表示矩阵的转置;计算每个患者在预测期限内没有发生结局事件的预测概率,记为则发生结局事件的预测概率为其中,和均为N×1维的列向量;计算在预测期限末的基线危险函数的值,记为将所有N个预测概率从大到小排序,求出其9个10分位点,记为步骤32,建立COX危险分级算法,获取患者的COX危险分级:当增加新患者时,假设其Q个危险因素的取值为X=(X1,X2,...,XQ);计算其中T表示矩阵的转置;计算新患者在预测期限内没有发生结局事件的预测概率此新患者发生结局事件的预测概率为计算此新患者的COX危险分级,记为COX_RANK:当时,COX_RANK=1;当且时,COX_RANK=2;当且时,COX_RANK=3;当且时,COX_RANK=4;当且时,COX_RANK=5;当且时,COX_RANK=6;当且时,COXRANK=7;当且时,COXRANK=8;当且时,COX_RANK=9;当时,COX_RANK=10;步骤33,利用训练数据库和步骤2得到的危险因素,建立LCA模型,获取患者LCA危险分级的参数:假设共有Q个解释变量,将患者分为R组,估计出患者来自第r组的概率,记为估计出第p个变量来自第r组的概率,记为其中,p=1,2,...,Q,r=1,2,...,R;步骤34,建立LCA危险分级算法,获取患者的LCA危险分级:增加新患者时,假设其Q个危险因素的取值为X=(X1,X2,...,XQ)T,计算此患者在第r组的后验概率找到使取最大的r值,即为此患者的LCA危险分级,记为LCA_RANK步骤35,利用训练数据库中患者的COX_RANK和LCA_RANK,建立LCA模型,获取将患者综合危险分级的参数:以训练数据库中患者的COX_RANK和LCA_RANK为变量,建立LCA模型,将患者分为3组,记为RISK_RANK,取值1/2/3,估计出患者来自第r组的本文档来自技高网...

【技术保护点】
1.一种患者长期预后定量预测和干预方法,其特征在于,该方法包括以下步骤:步骤1,将新患者信息补充到数据库以更新数据库;步骤2,利用训练数据库,通过COX回归模型和马尔可夫链蒙特卡洛模拟方法得到影响结局变量的危险因素;步骤3,利用训练数据库和步骤2得到的危险因素,采用基于无监督机器学习方法的LCA危险分级对基于COX回归模型的危险分级进行校正和补充,得到综合危险分级,并确定患者的危险评分计算方法;步骤4,根据步骤3确定的危险分级和危险评分计算方法,在新患者出院时,计算此患者的危险分级和危险评分,将患者按照发生不良事件的危险大小划分为高危、中危、低危,在患者出院时,医生根据患者的危险分级和危险评分进行干预。

【技术特征摘要】
1.一种患者长期预后定量预测和干预方法,其特征在于,该方法包括以下步骤:步骤1,将新患者信息补充到数据库以更新数据库;步骤2,利用训练数据库,通过COX回归模型和马尔可夫链蒙特卡洛模拟方法得到影响结局变量的危险因素;步骤3,利用训练数据库和步骤2得到的危险因素,采用基于无监督机器学习方法的LCA危险分级对基于COX回归模型的危险分级进行校正和补充,得到综合危险分级,并确定患者的危险评分计算方法;步骤4,根据步骤3确定的危险分级和危险评分计算方法,在新患者出院时,计算此患者的危险分级和危险评分,将患者按照发生不良事件的危险大小划分为高危、中危、低危,在患者出院时,医生根据患者的危险分级和危险评分进行干预。2.根据权利要求1所述的患者长期预后定量预测和干预方法,其特征在于,步骤2包括:步骤21,从训练数据库中确定备选变量、结局事件和预测期限;步骤22,采用COX回归模型从备选变量中初筛变量:假设患者在时刻t发生结局事件的强度为λ(t),即为危险函数,COX回归模型假设危险函数λ(t)与解释变量x=(x1,x2,...,xp)有关,记为λ(t;x),λ(t;x)=λ0(t)exp(xTβ),式中λ0(t)为基线危险函数,即在时刻t当x=0时的危险函数,x为p维解释向量,β为未知参数即为备选变量;记Tsurv为生存时间,Tcens为删失时间,T=min(Tsurv,Tcens),D=1表示发生了事件,D=0表示删失,x=(x1,x2,...,xp)为p维解释向量,假设(t1,d1,x1),(t2,d2,x2),...,(tn,dn,xn)为3维随机向量(T,D,X)的n个不相关的观测值,则COX回归模型的部分对数似然函数为:其中R(ti)为在ti时刻前既未发生事件也未删失的在危人群,求出上述部分对数似然函数的极大似然估计作为相应解释变量的回归系数估计值求出回归系数估计值的标准差,构造卡方分布并得到相应的P值;根据P值大小并结合预先设定的阈值,从备选变量中初步筛选出初筛变量;步骤23,采用马尔可夫链蒙特卡洛算法对步骤22得到的初筛变量进行精选,获得精选变量:假设训练数据库中的样本量为N,经COX回归模型初步筛选出的变量共有M个,依次记为(x1,x2,...,xM),其对应的系数记为(β1,β2,...,βM);采用Metropolis-Hastings抽样算法进行抽样,将(β0,β1,...,βM)的初始值设为0,从(β0,β1,...,βM)的后验分布抽取10000个随机样本;如果某个解释变量xi对应的系数βi大于0,表示此解释变量与结局变量正相关,小于0表示与结局变量负相关,等于0表示与结局变量不相关,其中(i=1,2,...,M),在系数βi的10000次随机抽样中,如果大于0的概率在0.9以上,或者小于0的概率在0.9以上,则说明此解释变量与结局变量的关系稳定且显著,将该系数所对应的解释变量保留,否则剔除,如此获取最终的精选变量;步骤24,加入特色变量;步骤25,将步骤23中的精选变量和步骤24中的特色变量合并,得到最终确定的危险因素,假设有Q个,记为X=(X1,X2,...,XQ);步骤26,采用Test和Validation数据库验证最终确定的危险因素。3.根据权利要求1所述的患者长期预后定量预测和干预方法,其特征在于,步骤3包括:步骤31,利用训练数据库和步骤2得到的危险因素建立COX回归模型,获取COX危险分级的参数:假设训练数据库的样本量为N,总共有Q个危险因素,计算每个危险因素对应的回归系数,记为其中T表示矩阵的转置;计算每个患者在预测期限内没有发生结局事件的预测概率,记为则发生结局事件的预测概率为其中,和均为N×1维的列向量;计算在预测期限末的基线危险函数的值,记为将所有N个预测概率从大到小排序,求出其9个10分位点,记为步骤32,建立COX危险分级算法,获取患者的COX危险分级:当增加新患者时,假设其Q个危险因素的取值为X=(X1,X2,...,XQ);计算其中T表示矩阵的转置;计算新患者在预测期限内没有发生结局事件的预测概率此新患者发生结局事件的预测概率为计算此新患者的COX危险分级,记为COX_RANK:当时,COX_RANK=1;当且时,COX_RANK=2;当且时,COX_RANK=3;当且时,COX_RANK=4;当且时,COX_RANK=5;当且时,COX_RANK=6;当且时,COXRANK=7;当且时,COXRANK=8;当且时,COX_RANK=9;当时,COX_RANK=10;步骤33,利用训练数据库和步骤2得到的危险因素,建立LCA模型,获取患者LCA危险分级的参数:假设共有Q个解释变量,将患者分为R组,估计出患者来自第r组的概率,记为估计出第p个变量来自第r组的概率,记为其中,p=1,2,...,Q,r=1,2,...,R;步骤34,建立LCA危险分级算法,获取患者的LCA危险分级:增加新患者时,假设其Q个危险因素的取值为X=(X1,X2,...,XQ)T,计算此患者在第r组的后验概率r=1,2,...,R;找到使取最大的r值,即为此患者的LCA危险分级,记为LCA_RANK;步骤35,利用训练数据库中患者的COX_RANK和LCA_RANK,建立LCA模型,获取将患者综合危险分级的参数:以训练数据库中患者的COX_RANK和LCA_RANK为变量,建立LCA模型,将患者分为3组,记为RISK_RANK,取值1/2/3,估计出患者来自第r组的概率,记为估计出第p个变量来自第r组的概率,记为其中r=1,2,3,p=1,2;在训练数据库中计算RISK_RANK每组的结局事件发生率,结局事件发生率最高的RISK_RANK组为高危组,结局事件发生率最低的RISK_RANK组为低危组,其余为中危组,如此建立起RISK_RANK的取值1/2/3与高危、中危、低危的对应关系;步骤36,建立患者综合危险分级算法,获取患者综合危险分级:增加新患者时,按照步骤32的算法计算其COX_RANK,按照步骤34的算法计算其LCA_RANK,然后根据步骤35得到的患者综合危险分级的参数,获取患者综合危险分级,具体步骤为:以COX_RANK和LCA_RANK为变量,计算此患者在第r组的后验概率r=1,2,3;Q=2;找到使取最大的r值,即为此患者的RISK_RANK;按照步骤35确定的RISK_RANK与高危/中危/低危的对应关系,获取此患者的综合危险分级;步骤37,计算患者的危险评分:将COX回归模型中每一个危险因素的系数除以所有系数绝对值的总和,得到S1;S1乘以100,得到S2;将S2取整数部分,得到对应于此危险因素的危险评分;将患者的每个危险因素的取值与此危险因素对应的危险评分相乘,并将所有危险评分相加,得到此患者的危险评分。4.根据权利要求2所述的患者长期预后定量预测和干预方法,其特征在于,步骤2中:备选变量包括:患者的人口学特征、病史、入院特征、院内并发症、治疗和出院带药;结局事件包括:患者在出院后366天内发生的死亡、再发心梗、心衰和卒中,如果某患者在出院后发生了以上4种终点事件的任何一种,则这位患者的终点事件记为1,否则记为0;预测期限:出院后366天内。5.根据权利要求1所述的患者长期预后定量预测和干预方法,其特征在于,步骤2中:从训练数据库中确定备选变量时,对于频率<1%的变量、缺乏临床意义的变量、与结局事件的双边分析认为质量不可靠的变量以及难于获取的变量均剔除。6.一种患者长期预后定量预测和干预系统,其特征在于,包括:数据收集系统,其用于将新患者信息补充到数据库以...

【专利技术属性】
技术研发人员:蒋立新李静胡爽郑昕蒋子涵李希路甲鹏苏萌白雪珂吴超群王茜颖李冶铜邢超王云哈伦·克鲁姆霍兹莎朗丽萨·诺曼德
申请(专利权)人:中国医学科学院阜外医院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1