达沙替尼响应预测模型及其方法技术

技术编号:21487409 阅读:30 留言:0更新日期:2019-06-29 07:12
预期的系统和方法使用先验已知的细胞系基因组学和药物响应数据来构多种不同细胞类型和药物的响应预测器库。然后采用所选响应预测器的统计分析来识别相对于其他药物具有显著的预测能力增益的响应预测器的药物。然后将如此识别的响应预测器的实体系数应用于基于实际患者的组学特征的途径模型的输出。

【技术实现步骤摘要】
【国外来华专利技术】达沙替尼响应预测模型及其方法本申请要求2016年8月03日提交的序列号为62/370657的美国临时专利申请的优先权。
本专利技术的领域是基于用响应预测器的实体系数(优选高准确度增益)进一步处理的途径模型信息来预测患者对药物的药物响应的系统和方法。背景本领域已知对途径进行计算建模的各种系统和方法。例如,一些算法(例如,GSEA、SPIA和PathOlogist)能够使用从文献中获取的途径成功地识别被改变的感兴趣的途径。更进一步的工具已经由获取的文献中的相互作用构建了因果图,并使用这些图来解释表达谱。例如ARACNE、MINDy和CONEXIC的算法采用基因转录信息(和拷贝数,在CONEXIC的情况下)以识别一组癌症样品中可能的转录驱动子。然而,这些工具没有尝试将不同的驱动子分组到鉴别单个感兴趣靶标的功能网络中。一些较新的途径算法,如NetBox和癌症中的互斥模块(MutualExclusivityModulesinCancer,MEMo)试图解决癌症中数据整合的问题,从而识别作为样品致癌潜力的关键的多种数据类型间的网络。虽然这些工具使途径间能够进行至少一些有限的整合以找到网络,但是它们通常不能提供调节信息,也不能将这些调节信息与相关途径或途径网络中的一种或多于一种生理效应相关联。为了提高性能,GIENA在单一生物途径中寻找失调的基因相互作用,但没有考虑该途径的拓扑结构或关于相互作用的方向或性质的先验知识。此外,由于这些建模系统的相对不完整的性质,通常不可能进行预测分析,尤其是在多个途径和/或途径元件的相互作用正处于研究中的情况下。最近,已经描述了改进的系统和方法以获得体内途径的经由计算机的途径模型,并且示例性系统和方法描述于WO2011/139345和WO2013/062505中。在WO2014/059036(在此统称为“PARADIGM”)中对这种模型进行了进一步改进,公开了帮助识别不同途径元件和途径之间的互相关的方法。虽然这些模型针对例如各种信号途径的互联性和通过各种途径的信号流提供了有价值的见解,但是使用这种建模的许多方面尚未被认可或甚至未被认识到。本文中的所有出版物和专利申请均通过引用并入,其程度如同每个单独的出版物或专利申请被特别地和单独地指出通过引用并入。如果并入的参考文献中术语的定义或用法与本文提供的术语的定义不一致或相反,则适用本文中该术语的定义并且不适用该术语在该参考文献中的定义。使用WO2014/193982中所述的PARADIGM的见解取得了更进一步的进展。这里,从机器学习系统获得多个模型,该机器学习系统接收多个不同的数据集并从不同数据集中识别与患病细胞的治疗参数(例如,用药物治疗)的状态(例如,敏感性或耐药性)相关联的关键途径元件。这种系统有利地提供了关于潜在治疗方式的见解。然而,从机器学习系统获得的大量潜在有效模型将使得难以对治疗结果进行简单地预测。另一方面,如US2004/0193019中所述,采用基于判别分析的模式识别来生成使一些生物学谱信息与治疗结果信息相关联的模型。然后使用预测模型对可能的治疗响应进行分级。虽然这些方法有助于基于患者特异性谱信息来评估可能的结果,但是分析通常因为判别分析中使用的参数而产生偏差。此外,这种分析仅考虑相应药物和疾病状况的历史数据,因此限制了仅在其他非相关疾病状况中已知有效的药物的发现。此外,相应药物和疾病状况的历史数据的可获得性常常进一步限制了这些方法的可用性。因此,应当理解的是,大多数(如果不是全部的话)经由计算机的模拟预测系统和方法基于所选择的途径活性中的干扰与治疗选择的已知相关性(例如,鉴定特定激酶活性的过高活性和对特定的激酶抑制剂的可能响应),或基于来自非患者来源的经验性体外数据。此外,在使用机器学习来识别模式的情况下,学习系统的固有偏差常常以与患者特定情况不一定一致的方式使输出发生偏离。因此,即使用于预测特定药物响应的各种系统和方法在本领域中是已知的,也仍然需要能够以高置信度对药物进行简单且稳健的治疗预测并且还能够以患者特异性方式预测治疗响应的系统和方法。
技术实现思路
本专利技术的主题涉及各种装置、系统和方法,其中使用多个先验已知的细胞系基因组学和药物响应数据来构建具有多个实体系数的大量响应预测器。然后使用表现最佳的响应预测器的实体系数来调整途径模型的输出,从而预测治疗结果。有利地,这样的系统和方法能够整合可以基于患者数据的多个途径元件和互联,并且避免由于使用单一预选模型而导致的分析偏差。在本专利技术主题的一个方面,专利技术人考虑了一种处理多个响应预测器的方法,该方法包括提供多个响应预测器的步骤,其中每个响应预测器与药物相关联并且具有多个途径元件和相关实体系数。在另一步骤中,计算每个响应预测器相对于相应的零模型的准确度增益度量以选择单一响应预测器,并且使用至少所选择的响应预测器的途径元件和相关实体系数的子集以及患者肿瘤的途径模型输出来计算得分(例如,关于药物治疗的灵敏性得分)。最典型地,使用随机选择的数据集来计算相应的零模型,该数据集未用于被针对性地创建零模型的响应预测器的计算。最典型地,多个响应预测器是至少1000个、或至少10000个、或至少100000个响应预测器。此外,通常预期实体系数的途径元件是调节性RNA、免疫信号传导组分、细胞分化因子、细胞增殖因子、细胞凋亡信号传导组分、血管生成因子和/或细胞周期检查点组分。关于准确度增益度量,通常预期可以使用准确度值、准确度增益、性能度量、曲线下面积度量、R2值、p值度量、轮廓系数或者混淆矩阵来确定准确度增益。此外,通常预期使用至少两种、或至少四种、或至少六种、或至少十种不同的机器学习分类器来建立多个响应预测器,并且合适的机器学习分类器包括线性核支持向量机、一阶或二阶多项式核支持向量机、岭回归、弹性网络算法、序列最小优化算法、随机森林算法、朴素贝叶斯算法和NMF预测器算法。途径元件和相关实体系数的子集通常包括1个至50个实体系数,并且还预期患者肿瘤的途径模型输出包括与所选响应预测器中的途径元件子集相同的途径元件。因此,并且从不同的角度来看,专利技术人还考虑了使用患者肿瘤的途径模型的输出来预测患者使用药物(例如,化学治疗药物)的治疗结果的方法。最典型地,这种方法将包括使用针对药物的高准确度增益响应预测器中途径元件的多个实体系数作为肿瘤途径模型中相应途径元件的输出值的因子来预测患者使用该药物的治疗结果得分的步骤。优选地,使用患者的组学数据计算肿瘤的途径模型,并且肿瘤的途径模型包括多个途径元件和相关的输出值,并且进一步优选的是,高准确度增益响应预测器相对于相应的零模型具有预先确定的最小准确度增益。另外,在这种方法中优选的是,高准确度增益响应预测器选自多个响应预测器,其中每个响应预测器与药物相关联。在这种方法的典型方面,多个实体系数是1个至50个高准确度增益响应预测器的实体系数,和/或多个实体系数是实体系数的子集并且包括高准确度增益响应预测器的所有实体系数的上三分位数。在不限制本专利技术的主题的情况下,通常优选的是,途径模型是概率途径模型,尤其是PARADIGM。这种预期方法中的预先确定的最小准确度增益超出零模型至少50%,其中优选地使用随机选择的数据集来计算零模型,该数据集未用于被针对性地创建零本文档来自技高网
...

【技术保护点】
1.一种处理多个响应预测器的方法,其包括:提供多个响应预测器,其中每个响应预测器与药物相关联并且具有多个途径元件和相关实体系数;计算每个响应预测器相对于相应的零模型的准确度增益度量,以选择单一响应预测器;和使用至少所选择的响应预测器的途径元件和相关实体系数的子集以及患者肿瘤的途径模型输出来计算得分。

【技术特征摘要】
【国外来华专利技术】2016.08.03 US 62/370,6571.一种处理多个响应预测器的方法,其包括:提供多个响应预测器,其中每个响应预测器与药物相关联并且具有多个途径元件和相关实体系数;计算每个响应预测器相对于相应的零模型的准确度增益度量,以选择单一响应预测器;和使用至少所选择的响应预测器的途径元件和相关实体系数的子集以及患者肿瘤的途径模型输出来计算得分。2.根据权利要求1所述的方法,其中所述多个响应预测器为至少1000个响应预测器。3.根据权利要求1所述的方法,其中所述多个响应预测器为至少100000个响应预测器。4.根据权利要求1所述的方法,其中所述实体系数的途径元件选自调节性RNA、免疫信号传导组分、细胞分化因子、细胞增殖因子、细胞凋亡信号传导组分、血管生成因子和细胞周期检查点组分。5.根据权利要求1所述的方法,其中所述准确度增益度量选自准确度值、准确度增益、性能度量、曲线下面积度量、R2值、p值度量、轮廓系数和混淆矩阵。6.根据权利要求1所述的方法,其中使用至少两种不同的机器学习分类器来建立所述多个响应预测器。7.根据权利要求6所述的方法,其中所述至少两种不同的机器学习分类器选自线性核支持向量机、一阶或二阶多项式核支持向量机、岭回归、弹性网络算法、序列最小优化算法、随机森林算法、朴素贝叶斯算法和NMF预测器算法。8.根据权利要求1所述的方法,其中使用随机选择的数据集来计算相应的零模型,所述数据集未用于被针对性地创建零模型的响应预测器的计算。9.根据权利要求1所述的方法,其中途径元件和相关实体系数的子集包括1个至50个实体系数。10.根据权利要求1所述的方法,其中所述患者肿瘤的途径模型输出包括与所选响应预测器中的途径元件的子集相同的途径元件。11.根据权利要求1所述的方法,其中所述得分是关于药物治疗的敏感性得分。12.一种使用患者肿瘤的途径模型的输出来预测患者使用药物的治疗结果的方法,其包括:使用针对药物的高准确度增益响应预测器中途径元件的多个实体系数作为肿瘤途径模型中相应途径元件的输出值的因子,以预测患者使用药物的治疗结果得分;其中使用患者的组学数据计算肿瘤的途径模型,并且所述肿瘤的途径模型包括多个途径元件和相关输出值;其中高准确度增益响应预测器相对于相应的零模型具有预先确定的最小准确度增益;和其中所述高准确度增益响应预测器选自多个响应预测器,其中每个响应预测器与药物相关联。13.根据权利要求12所述的方法,其中所述多个实体系数是1个至50个高准确度增益响应预测器的实体系数。14.根据权利要求12所述的方法,其中所述多个实体系数是实体系数的子集并且包括高准确度增益响应预测器的所有实体系数的上三分位数。15.根据权利要求12所述的方法,其中所述途径模型是概率途径模型。16.根据权利要求12所述的方法,其中所述途径模型是PARADIGM。17.根据权利要求12所述的方法,其中所述预先确定的最小准确度增益超过零模型至少50%。18.根据权利要求12所述的方法,其中使用随机选择的数据集来计算零模型,所述数据集未用于被针对性地创建零模型的高准确度增益响应预测器的计算。19.根据权利要求12所述的方法,其中所述多个响应预测器为至少100000个响应预测器。20.根据权利要求12所述的方法,其中使用至少两种不同的机器学习分类器来建立所述多个响应预测器。21.根据权利要求20所述的方法,其中所述至少两种不同的机器学习分类器选自线性核支持向量机、一阶或二阶多项式核支持向量机、岭回归、弹性网络算法、序列最小优化算法、随机森林算法、朴素贝叶斯算法和NMF预测器算法。22.根据权利要求12所述的方法,其中所述药物是化学治疗药物。23.一种预测用达沙替尼治疗患者肿瘤的治疗结果的方法,其包括:获得患者肿瘤的组学数据;通过使用途径模型和组学数据的途径分析工具来计算肿瘤的途径模型输出,其中途径输出包括多个途径元件和相关活性值;将各个途径实体的多个实体系数应用为途径模型输出的相应途径元件的活性值的因子,从而预测患者的治疗结果;和其中途径实体和各自的实体系数选自MIR34A_(miRNA):-0.10545895;ETS1:-...

【专利技术属性】
技术研发人员:克里斯托弗·W·赛托斯蒂芬·查尔斯·本茨查尔斯·约瑟夫·瓦斯克
申请(专利权)人:南托米克斯有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1