用于临床决策的反倾向预测的协同标记制造技术

技术编号:37246711 阅读:21 留言:0更新日期:2023-04-20 23:26
提供了一种算法,基于现有标记或特征之间的关联中治疗组和对照组之间的偏差,来生成协同标记。使用用于预测治疗选项的协同标记解决了治疗选项倾向于个体水平的协变量(诸如患者个人信息、临床信息和肿瘤特征)的问题。在临床决策支持中使用该协同标记与为预测治疗选项而开发的结果预测模型,其享有以下优点。首先,协同标记基于协变量间的关联水平而不是个体协变量的大小来预测治疗选项。此类预测消除了某些协变量影响临床决策的倾向。其次,使用非参数方法生成具有许多协变量的协同标记,避免了由参数模型导致的维数灾难和过拟合问题。了由参数模型导致的维数灾难和过拟合问题。了由参数模型导致的维数灾难和过拟合问题。

【技术实现步骤摘要】
用于临床决策的反倾向预测的协同标记
[0001]相关申请的交叉引用
[0002]本申请要求2021年10月8日提交的美国临时专利申请第63/262,258号和2022年9月30日提交的美国非临时专利申请第17/936,892号的优先权和权益,其公开内容通过引用整体并入本文。
[0003]缩写列表
[0004]AUROC 受试者操作特性曲线下的面积
[0005]CT 计算机断层摄影术
[0006]KM 卡普兰

梅尔分析(Kaplan

Meier)
[0007]NSCLC 非小细胞肺癌
[0008]PET 正电子发射断层摄影术
[0009]POB 术后观察
[0010]RBF 径向基函数
[0011]ROC 受试者操作特性
[0012]SVC 支持向量分类器
[0013]SVM 支持向量机
[0014]TCIA 癌症影像档案


[0015]本申请总体上涉及用于辅助医疗决策制定的数据驱动临床决策支持。特别地,本申请涉及经由使用用于预测治疗选项的治疗效果的协同标记来提供临床决策支持的方法和系统。

技术介绍

[0016]癌症治疗选项(诸如辅助治疗)的数据驱动临床决策支持通常依赖于常用的统计分析,包括KM估计值、Cox回归模型和逻辑回归模型,所有这些都检查治疗对临床结果或益处的因果效应。
[0017]在生存率分析中,绘制两个或更多个治疗水平的KM曲线并且通过对数秩检验进行比较。辅助治疗和POB(即无辅助治疗)可以表示两种治疗水平。结果可能是生存率或疾病复发时间。可以通过生存率分析来检验治疗水平之间临床结果的显著差。例如,它是由M.C.SALAZAR等人发现的(“延迟辅助化疗与肺癌手术后生存率的关联(Association of Delayed Adjuvant Chemotherapy with Survival after Lung Cancer Surgery)”,JAMA肿瘤学(JAMA Oncology),2017年5月1日;3(5):610

619),与仅接受手术治疗的患者相比,后来接受辅助化疗的NSCLC患者具有显著更好的生存率。然而,此类分析不能量化由于治疗引起的患者的生存率或复发时间的变化,因此不能指示个体的获益。
[0018]为了根据持续时间或二分法预测个性化治疗结果,诸如生存率或复发率,Cox回归或二项式多重回归是基于一组选择的协变量进行建模和实现的。候选协变量包括但不限于
治疗选项、患者个人信息、临床信息和肿瘤特征,并且根据其对结果的影响进行分类。协变量按照它们的影响顺序进入或离开模型,并且选择过程被终止,直到指定的成本函数达到阈值。选择的协变量,除了治疗选项,通常被认为是预后的标记或因素(R.J.LITTLE和D.B.RUBIN,“通过潜在的结果在临床和流行病学研究中的因果效应:概念和分析方法(Causal effects in clinical and epidemiological studies via potential outcomes:concepts and analytical approaches),”公共卫生年度回顾(Annu.Rev.Public Health)2000;21:121

45)。最近的一些研究没有假设协变量对结果的比例影响,而是探索和评估了对应的机器学习和深度学习模型对相同目标的应用,例如,S.A.SAPUTRO等人,“糖尿病微血管并发症的预后模型:系统综述和荟萃分析(Prognostic models of diabetic microvascular complications:a systematic review and meta

analysis)”,BMC医学研究方法学(BMC Medical Research Methodology)2018.18:24;Sci Rep 2021.11,1571。
[0019]在治疗分配是随机的并且独立于训练数据集中的其他协变量的情况下,上述模型,与作为协变量的治疗选项合并,可以容易地训练并且推断是直接的。在实践中,特别是对于观察性研究,治疗不是随机的,而是由临床审议参考其他协变量分配的。此类相关性是从观察治疗组和对照组之间的协变量分布可能显著不同而实现的。如图1所示,由此获得的模型会偏向于其他协变量,而不是阐明治疗对结果的真正影响。
[0020]为了应对该偏差,研究人员开发了用于通过对协变量的治疗选项进行判别分析或逻辑回归来估计每个受试者的倾向得分的方法。倾向评分意图通过实现配对研究设计、在训练模型中对病例进行加权或作为模型中的另外的协变量来获得有效的因果推断(R.J.LITTLE和D.B.RUBIN,如上所述;A.A.MOKDAD等人的“胃食管癌术前放化疗和切除术后的辅助化疗与术后观察:倾向评分

匹配分析(Adjuvant Chemotherapy vs Postoperative Observation Following Preoperative Chemoradiotherapy and Resection in Gastroesophageal Cancer:A Propensity Score

Matched Analysis)”,JAMA肿瘤学(JAMA Oncology)2018年1月4日(1):31

38)。然而,在小样本或不平衡样本中,倾向得分的估计容易受到参数模型泛化误差的影响,并且忽略了协变量之间的交互作用,该交互作用在治疗决策中也是需要考虑的。
[0021]因此,至关重要的是开发一种算法方法,用于协同一组协变量,其可潜在影响治疗决策,以生成区分治疗组和对照组之间组内协变量关联的标记,以便消除对个体协变量的倾向。需要推导出协同标记来代替治疗选项,并且在结果预测模型中充当代表真实治疗效果的附加协变量。推导出的协同标记可用于为辅助医疗决策制定提供临床决策支持。

技术实现思路

[0022]可以在具体实施方式中找到此
技术实现思路
中引用的数学等式。
[0023]本专利技术的第一方面是提供一种计算机实现的方法,用于提供临床决策支持以辅助医疗决策制定。
[0024]该方法包括开发结果预测模型,该结果预测模型用于预测作为该模型的结果的治疗选项的治疗效果。
[0025]在开发结果预测模型时,获得了用于训练和测试模型的协变量数据。协变量数据
被布置成由第一维中的多个协变量和第二维中的多个受试者索引的二维数据阵列。多个受试者被分成其受试者已经用治疗选项治疗的治疗组和其受试者没有治疗的非治疗组。
[0026]将跨多个受试者的个体协变量的协变量数据的分布对称化并且集中到标准正态分布,使得跨多个受试者的个体协变量的协变量数据被归一化,以产生跨多个受试者的个体协变量的归一化协变量数据。由治疗组中的受本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于提供临床决策支持以辅助医疗决策制定的计算机实现的方法,所述方法包括:开发结果预测模型,所述结果预测模型用于预测作为所述模型的结果的治疗选项的治疗效果,其中所述结果预测模型的所述开发包括:获得用于训练和测试所述模型的协变量数据,所述协变量数据被布置成由第一维中的多个协变量和第二维中的多个受试者索引的二维数据阵列,其中所述多个受试者被分成其受试者已经用所述治疗选项治疗的治疗组和其受试者没有用所述治疗选项治疗的非治疗组;将跨所述多个受试者的个体协变量的协变量数据的分布对称化并且集中到标准正态分布,使得跨所述多个受试者的所述个体协变量的所述协变量数据被归一化,以产生跨所述多个受试者的所述个体协变量的归一化协变量数据,由所述治疗组中的受试者索引的相应归一化协变量数据共同形成治疗组数据集,并且由所述非治疗组中的受试者索引的相应归一化协变量数据共同形成非治疗组数据集;以总体关联水平的降序对所述治疗组数据集和非治疗组数据集进行排序,从而产生较高关联数据集和较低关联数据集,其中所述较高关联数据集在总体关联水平上高于所述较低关联数据集;对所述多个协变量进行分类,以按照所述较高关联数据集和所述较低关联数据集之间的累积关联水平的差的降序来形成有序的协变量列表;基于所述较高关联数据集和较低关联数据集,确定用于截断协变量的所述有序的协变量列表的最优协变量数量,以产生协变量的最优列表,使得在协变量的数量的不同选择中,使用通过对所述最优列表中的相应协变量获得的归一化协变量数据进行组合而计算的协同标记,最大化预测所述多个受试者的所述治疗选项的性能,所述性能被计算为所述多个受试者的平均性能;以及配置所述结果预测模型以使用所述协同标记来表示所述治疗选项,使得在预测对患者个性化的所述治疗效果时,所述结果预测模型接收患者数据和根据与所述最优列表中的相应协变量相关的所述患者数据计算的协同标记,并且输出所预测的结果。2.根据权利要求1所述的方法,其中对所述多个协变量进行所述分类以形成协变量的所述有序列表包括:生成协变量关联水平差的矩阵;以及迭代地计算累积关联水平差的候选值,用于对协变量进行优先排序,以进入协变量的所述有序列表。3.根据权利要求2所述的方法,其中确定协变量的所述最优数量包括:计算与协变量的所述有序列表中的协变量子集的累积关联水平相对应的协同标记;以及确定协变量的数量,使得由所确定的协变量数量生成的协同标记在协变量数量的所有可能选择中实现预测所述治疗选项的最大性能。4.根据权利要求1所述的方法,其中所述治疗组数据集和所述非治疗组数据集的总体关联水平分别由下式计算:
和其中:m是所述多个协变量中的协变量数量;C
T
(i,j)是所述治疗组数据集的第i个协变量和第j个协变量之间的关联水平,由下式给出:其中n
T
是所述治疗组数据集中受试者的数量,π
T
(k
T
)给出了在与所述治疗组中第k
T
个受试者相对应的二维阵列的第二维中使用的索引,并且z
l
(k)表示所述多个受试者中第k个受试者的第l个协变量的归一化协变量数据;并且C
N...

【专利技术属性】
技术研发人员:陈颖志
申请(专利权)人:香港理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1