基于多个机器学习模型的临床预测因子制造技术

技术编号：36584003 阅读：27 留言：0更新日期：2023-02-04 17:45

一种方法，包括：接收与患者的多个数据类别相对应的数据；从多个经训练的机器学习模型中并基于多个数据类别选择第一机器学习模型和第二机器学习模型，该第一机器学习模型是使用多个数据类别的第一子集的第一数据进行训练的并具有指示第一性能度量值的第一权重，第二机器学习模型是使用多个数据类别的第二子集的第二数据进行训练的并具有指示第二性能度量值的第二权重；分别使用第一模型和第二模型生成第一预测结果和第二预测结果；以及基于第一预测结果、第二预测结果、第一权重和第二权重生成组合预测结果。权重生成组合预测结果。权重生成组合预测结果。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于多个机器学习模型的临床预测因子
相关专利申请的交叉引用
[0001]本申请要求于2020年5月11日提交的美国专利申请第16/871，933号的优先权权益，该专利申请通过引用被并入本文以用于所有目的。

技术介绍

[0002]使用真实世界临床数据训练的预测机器学习模型提供用于为患者及其临床医生提供有关诊断、预后或最佳治疗过程的患者特定信息的巨大潜力。例如，可以训练机器学习模型来根据诊断(例如，晚期癌症)预测作为时间的函数的患者存活的可能性。也可以基于患者将接受的治疗对存活预测进行分层。随后医生可以部分地基于预测做出临床决策，诸如对患者施用的治疗(例如，医生通常将偏好具有最长预测存活期的治疗)。预后信息也可以被提供给患者，以例如提高患者规划其未来的能力，这可以改善患者的生活质量。
[0003]可以训练机器学习模型以基于包括多个数据类别的患者数据执行针对患者的预测。当患者数据中缺少某些数据类别时，机器学习模型在执行预测中的应用可受到限制。需要来自一个数据类别集合的预测因子(predictor)数据的机器学习模型可能无法使用仅包括所需类别的子集的真实患者数据执行预测。例如，基于血液学和分子实验室测试结果进行预测的模型可能无法对具有血液学数据但没有分子测试结果的患者进行预测。

技术实现思路

[0004]本文公开的是用于基于包括多个机器学习模型的元模型执行临床预测的技术。临床预测可以包括，例如，预测患者在自疾病诊断以来的一时间点处的存活率。每个机器学习模型可以使用不同的数据类别集合进行训练，该不同的数据类别集合...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种执行临床预测的计算机实现的方法，包括：接收与患者的多个数据类别相对应的数据；从多个经训练的机器学习模型中并基于所述多个数据类别选择第一机器学习模型和第二机器学习模型，所述第一机器学习模型是使用所述多个数据类别的第一子集的第一数据进行训练的并具有第一性能度量值，所述第二机器学习模型是使用所述多个数据类别的第二子集的第二数据进行训练的并具有第二性能度量值，所述多个数据类别的所述第二子集不同于所述多个数据类别的所述第一子集；将与所述多个类别的所述第一子集相对应的数据的第一子集输入到所述第一机器学习模型，以生成第一预测结果；将与所述多个类别的所述第二子集相对应的数据的第二子集输入到所述第二机器学习模型，以生成第二预测结果；基于所述第一预测结果、所述第二预测结果、指示所述第一性能度量值的第一权重、和指示所述第二性能度量值的第二权重生成组合预测结果，所述第二性能度量值不同于所述第一性能度量值；以及基于所述组合预测结果执行针对所述患者的临床预测。2.根据权利要求1所述的方法，其特征在于，所述多个数据类别的所述第一子集和所述多个数据类别的所述第二子集包括至少一个通用数据类别。3.根据权利要求1或2所述的方法，其特征在于，所述数据类别包括以下各项中的至少一项：所述患者的传记数据、所述患者的一个或多个化学测试的结果、所述患者的活检图像数据、所述患者的分子生物标志物、所述患者的肿瘤部位、或所述患者的肿瘤分期。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述多个机器学习模型包括使用第三数据类别的第三数据进行训练的第三机器学习模型，所述第三数据类别不是所述多个数据类别的一部分；并且其中，所述第三预测模型不是基于不存在于所述患者的所述多个数据类别中的所述第三数据类别针对所述患者选择的。5.根据权利要求1
‑
4中任一项所述的方法，其特征在于，所述临床预测包括预测所述患者在从所述患者被诊断为具有处于晚期的肿瘤时起的预定时间处的存活率。6.根据权利要求5所述的方法，进一步包括基于所预测的存活率确定针对所述患者的治疗。7.根据权利要求5或6所述的方法，其特征在于，所述多个数据类别包括与由所述患者接收的治疗有关的类别；并且其中，所述临床预测包括预测所述患者响应于所述治疗在所述预定时间处的存活率。8.根据权利要求5
‑
7中任一项所述的方法，其特征在于，所述第一机器学习模型和所述第二机器学习模型包括以下各项中的至少一项：随机森林模型或危险函数。9.根据权利要求8所述的方法，其特征在于，所述第一机器学习模型和所述第二机器学习模型包括随机森林模型，所述随机森林模型包括多个决策树，每个决策树被配置成用于处理数据的所述第一子集的子集，以生成累积危险函数(CHF)值；并且其中，所述患者在所述预定时间处...

【专利技术属性】
技术研发人员：J，
申请(专利权)人：豪夫迈，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人