建立基于诊断时效的COVID-19分诊系统的方法、该系统及分诊方法技术方案

技术编号:39259972 阅读:14 留言:0更新日期:2023-10-30 12:11
本发明专利技术公开了一种建立基于诊断时效的COVID

【技术实现步骤摘要】
建立基于诊断时效的COVID

19分诊系统的方法、该系统及分诊方法
[0001]本申请是申请号为202110432543.0、申请日为2021年04月21日、专利技术名称为“建立基于诊断时效的COVD

19分诊系统的方法、该系统及分诊方法”的专利技术专利申请的分案申请。


[0002]本专利技术涉及疾病的分诊,更具体地,涉及建立基于诊断时效的COVID

19分诊系统的方法、该方法所建立的基于诊断时效的COVID

19分诊系统以及相关的基于诊断时效的COVID

19分诊方法。

技术介绍

[0003]从影像学检查的角度来看,数项研究已经记录了就诊或检查的COVID

19患者(在症状发作后6

14天内进行影像学检查)更可能有加重的异常肺部CT表现和病变。迄今为止,COVID

19预后与诊断时效(time

efficiency)之间的关系和COVID

19诊断时效在不同人群中的重要性有待得到更深入的分析。
[0004]提高COVID

19的诊断时效,意味着要缩短从症状发作到确诊的时间,其中包括:由患者主导的从症状发作到首次就诊的时长,以及医疗机构主导的从首次就诊到确诊的时长。一方面,我们需要患者识别出最早的症状并尽快就诊,但是目前该时间间隔因人而异。另一方面,医院应提高确诊效率,目前在患者中确诊COVID

19所需的时间和逆转录聚合酶链反应(RT

PCR)的核酸检测的次数不尽相同。有些患者需要做2次以上核酸检测才能确诊,大多数患者在2天之内确诊,最长可达7天。
[0005]需要对COVID

19的可疑就诊者进行高效的分诊,避免不良预后的高危患者拖延诊断和治疗。此外,还需要适用于不同人群样本的用于建立高效分诊系统的方法和系统,以建立适合各国或各地区具体情况的分诊系统。

技术实现思路

[0006]本专利技术分析了诊断时效相关时长的分布和截断值,对不同的诊断时效组进行生存分析和比较,以弥补其他研究中被忽视的方面,更好地公证诊断时效的作用。本专利技术基于诊断时效和分析中有意义的临床特征进行模型构建,找出需要更高诊断时效的高危人群。本专利技术的系统的数据接收模块的指标选取及数据处理模块的节点选取,由下文所述分诊系统建立方法推算获得。
[0007]基于上述研究,本申请提出了基于诊断时效的COVID

19分诊系统,及用于全新人群样本的建立该种分诊系统的方法和系统。相应地,在一方面,本专利技术还提供了一种建立基于诊断时效的COVID

19的分诊系统的方法,所述方法包括:(a)收集包括COVID

19确诊者的年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期的信息;(b)计算每个确诊者的诊断时效相关时长,单位以天数计算,包括症状
发作日期至确诊日期时长、症状发作日期至首次就诊日期时长和首次就诊日期至确诊日期时长;计算入院日期至不良结局最早发生日期时长,若该时长为负数或大于31天则直接排除该病例;(c)确定诊断时效相关时长的95%分位数,并排除数值大于95%分位数的数据异常病例;(d)以诊断时效相关时长为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,通过Maxstat最大统计量法(maximally selected rank statistics)分析来确定诊断时效相关时长转化为二分类变量的最佳截断值(cutoff),并将原为连续型变量的诊断时效相关时长变量直接替换为二分类变量,以减小极端或异常的时效相关时长对分诊模型稳定性的影响,并强化变量效应从而增强分诊模型的应用推广性;(e)以包括但不限于二分类转化后的诊断时效相关时长、年龄、性别、吸烟史、慢性病史为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行单变量对数秩检验(log

rank test),分别得到所述自变量的对数秩检验p值;(f)以包括二分类转化后的诊断时效相关时长、对数秩检验p值低于设定阈值的变量、年龄、性别、吸烟史、慢性病史共同作为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行多变量Cox比例风险回归生存分析,得到各自变量的Cox回归p值;(g)以包括二分类转化后的诊断时效相关时长以及Cox回归p值低于设定阈值的变量为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行条件推理树分析,得到决策树模型;(h)根据得到的决策树模型建立用于COVID

19的分诊系统。
[0008]在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,将minprop(the minimal proportion of observations per group,即每组观测的最小比例)参数值设置为0.15。在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,break.time.by参数值为5。
[0009]在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,在R语言编程中使用surv_cutpoint()函数进行计算,将minprop参数值设置为0.15,将progressbar参数值设置为TRUE,variables参数值命名为“timeStoD”,data参数用于调用包含生存资料(时间,事件)和待分割的连续变量的数据框结构数据集,time参数调用生存时间指标,设定为入院至不良结局发生所需时间,event参数调用生存结局指标,设定为不良结局是否发生的状态,事件值设定为0或1。
[0010]在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,通过surv_categorize()函数,根据以上surv_cutpoint()函数返回的切割点(cutpoint),分割每个变量值,更新“timeStoD”的变量取值,继而通过summary()函数获得输出的cutpoint值取值,即最佳截断值cutoff。
[0011]在一个具体实施方式中,对于所述步骤(d)中的Maxstat最大统计量法,对cutoff有效性进行验证。通过Surv()函数构建生存函数,time、event、data的设定同之前步骤;“~predictors”参数取用上个步骤生成的“timeStoD”指标,设置为“~timeStoD”;使用ggsurvplot()函数,针对上述函数绘制生存曲线,其中data设定不做改变,pval参数值设置为TRUE,risk.table参数值设置为TRUE,conf.int参数值设置为TRUE,surv.median.line参数值设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立基于诊断时效的COVID

19的分诊的系统的方法,所述方法包括:(a)收集包括COVID

19确诊者的年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期的信息;(b)计算每个确诊者的诊断时效相关时长,单位以天数计算,包括症状发作日期至确诊日期时长、症状发作日期至首次就诊日期时长和首次就诊日期至确诊日期时长;计算入院日期至不良结局最早发生日期时长,若该时长为负数或大于31天则直接排除该病例;(c)确定诊断时效相关时长的95%分位数,并排除数值大于95%分位数的数据异常病例;(d)以诊断时效相关时长为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,通过Maxstat最大统计量法分析来确定诊断时效相关时长转化为二分类变量的最佳截断值,并将原为连续型变量的诊断时效相关时长变量直接替换为二分类变量;(e)以包括二分类转化后的诊断时效相关时长、年龄、性别、吸烟史、慢性病史为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行单变量对数秩检验,分别得到所述自变量的对数秩检验p值;(f)以包括二分类转化后的诊断时效相关时长、对数秩检验p值低于设定阈值的变量、年龄、性别、吸烟史、慢性病史共同作为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行多变量Cox比例风险回归生存分析,得到各自变量的Cox回归p值;(g)以包括二分类转化后的诊断时效相关时长和Cox回归p值低于设定阈值的变量为自变量,以不良结局是否发生以及入院日期至不良结局最早发生日期时长的生存资料为因变量,进行条件推理树分析,得到决策树模型;和(h)根据得到的决策树模型建立用于COVID

19的分诊系统;其中对于所述步骤(d)中的Maxstat最大统计量法,在R语言编程shan中使用surv_cutpoint()函数进行计算,将minprop参数值设置为0.15,将progressbar参数值设置为TRUE,variables参数值命名为“timeStoD”,data参数用于调用包含生存资料和待分割的连续变量的数据框结构数据集,time参数调用生存时间指标,设定为入院至不良结局发生所需时间,event参数调用生存结局指标,设定为不良结局是否发生的状态,事件值设定为0或1。2.根据权利要求1所述的方法,其中对于所述步骤(d)中的Maxstat最大统计量法,通过surv_categorize()函数,根据所述surv_cutpoint()函数返回的切割点,分割每个变量值,更新“timeStoD”的变量取值,继而通过summary()函数获得输出的cutpoint值取值,即最佳截断值。3.根据权利要求2所述的方法,其中对于所述步骤(d)中的Maxstat最大统计量法,对最佳截断值有效性进行验证:通过Surv()函数构建生存函数,time、event、data的设定同surv_cutpoint()函数中的设定;“~predictors”参数取用surv_categorize()函数生成的“timeStoD”指标,设置为“~timeStoD”;使用ggsurvplot()函数,针对surv()函数绘制生存曲线,其中data函数的设定不做改变,pval参数值设置为TRUE,risk.table参数值设置为TRUE,conf.int参数值设置为TRUE,surv.median.line参数值设置为"hv",linetype参数
值设置为"strata";设定break.time.by参数值为5,以达到最佳绘制效果;ggtheme、palette等风格主题或颜色面板的参数不作限定;获得两组生存曲线不存在交错走向,则诊断时效相关指标的二分类切割点取值有效。4.根据权利要求1至3中任一项所述的方法,其中所述不良结局包括ICU、重症肺炎、有创通气、死亡中的一种或多种。5.根据权利要求1至3中任一项所述的方法,其中所述对数秩检验p值的设置阈值和所述Cox回归p值的设置阈值都为0.05至0.1。6.根据权利要求1至3中任一项所述的方法,其中所述异常病例为缺失年龄、慢性病史、症状发作日期、首次就诊日期、确诊日期、入院日期、不良结局、不良结局最早发生日期中的一个或多个信息的病例。7.一种基于诊断时效的COVID

19的分诊的计算机系统,其特征在于,包括:数据接收模块,用于接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;数据处理模块,用于将所接收的信息与预设的优先就诊条件进行比对,所述优先就诊包括优先开立医嘱、优先采样、优先送样和优先检测中的一个或多个;以及输出模块,用于突出显示符合所述预设的优先就诊条件的就诊者,提示优先就诊;其中,所述预设的优先就诊条件根据权利要求1至6的任一项的方法确定,并且选自以下条件中的一个或多个:(a)患有慢性病并且年龄大于61岁,(b)患有慢性病并且症状发作日至首次就诊日大于4天,以及(c)无慢性病但年龄大于51岁。8.根据权利要求7所述的分诊的计算机系统,其特征在于,所述输出模块被进一步配置成按以下规则设定优先级:(1)将患有慢性病并且年龄大于61岁的就诊者设为第一优先级;(2)将患有慢性病并且症状发作日至首次就诊日大于4天的就诊者设为第二优先级;(3)将无慢性病但年龄大于55岁的就诊者设为第三优先级;并且(4)将无慢性病但年龄大于51岁的就诊者设为第四优先级。9.根据权利要求7所述的分诊的计算机系统,其特征在于,所述输出模块被进一步配置成:当就诊者无慢性病但年龄大于51岁时,提示建议在从症状发作日起不超过5天内提供COVID

19核酸检验诊断结果;或者当就诊者无慢性病但年龄大于55岁时,提示建议在从首次就诊当日起不超过3天内提供COVID

19核酸检验诊断结果。10.一种基于诊断时效的COVID

19的分诊方法,其包括:(S1)接收包括就诊者的年龄、慢性病史、症状发作日期和首次就诊日期的信息;(S2)将所接收...

【专利技术属性】
技术研发人员:陈一君简文华梁振宇关伟杰梁文华李时悦张挪富郑劲平何建行钟南山
申请(专利权)人:广州医科大学附属第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1