新抗原的鉴别、制造及使用制造技术

技术编号:19070798 阅读:61 留言:0更新日期:2018-09-29 15:53
本文公开了一种用于基于个体的肿瘤突变确定等位基因、新抗原及疫苗组合物的系统和方法。还公开了用于从肿瘤获得高质量测序数据的系统和方法。此外,本文也描述了用于在多态性基因组数据中鉴别体细胞变化的系统和方法。最后,本文描述了独特的癌症疫苗。

【技术实现步骤摘要】
【国外来华专利技术】新抗原的鉴别、制造及使用相关申请的交叉引用本申请要求2015年12月16日提交的美国临时申请62/268,333、2016年4月4日提交的美国临时申请62/317,823、2016年8月26日提交的美国临时申请62/379,986、2016年9月13日提交的美国临时申请62/394,074及2016年11月23日提交的美国临时申请62/425,995的权益和优先权,各案以引用的方式整体并入用于所有目的。
技术介绍
基于肿瘤特异性新抗原的治疗性疫苗作为新一代个性化癌症免疫疗法具有广阔的前景。1-3鉴于产生新抗原的可能性相对较高,具有高突变负荷的癌症,如非小细胞肺癌(NSCLC)和黑素瘤成为此类疗法的特别值得关注的靶标。4,5早期有证据显示,基于新抗原的疫苗接种能够引起T细胞反应6并且靶向新抗原的细胞疗法在某些情况下能够在选择的患者中引起肿瘤消退。7新抗原疫苗设计的一个问题是在受试者肿瘤内存在的众多编码突变中,哪种突变可以产生“最佳的”治疗性新抗原,例如能够引起抗肿瘤免疫并使肿瘤消退的抗原。提出的初步方法并入了使用下一代测序的基于突变的分析、RNA基因表达及候选新抗原肽的MHC结合亲和力预测8。然而,提出的这些方法都无法模拟整个表位产生过程,该过程除含有基因表达和MHC结合外,还含有许多步骤(例如TAP转运、蛋白酶体裂解和/或TCR识别)9。因此,现有的方法可能会有低阳性预测值(PPV)降低的问题。(图1A)事实上,多个研究团队所进行的关于由肿瘤细胞呈递的肽的分析显示,预计使用基因表达和MHC结合亲和力呈递的肽中不到5%可以在肿瘤表面MHC上发现10,11(图1B)。近期观察到的仅针对突变数量的检查点抑制剂反应无法提高对结合受限的新抗原的预测准确性进一步支持了结合预测与MHC呈递之间的这一低相关性。12现有的呈递预测方法的这一低阳性预测值(PPV)提出了有关基于新抗原的疫苗设计的问题。如果使用PPV低的预测方法来设计疫苗,则大多数患者不太可能接受治疗性新抗原,且少数患者可能要接受一种以上新抗原(即使假设所有呈递的肽都具有免疫原性)。因此,用当前方法进行新抗原疫苗接种不太可能在众多具有肿瘤的受试者中取得成功。(图1C)此外,先前的方法仅使用顺式作用突变来产生候选新抗原,而在很大程度上忽视了考虑neo-ORF的其它来源,包括在多种肿瘤类型中出现且导致许多基因异常剪接的剪接因子突变13,及产生或移除蛋白酶裂解位点的突变。最后,由于文库构建、外显子组和转录组捕捉、测序或数据分析的条件并非最佳条件,故肿瘤基因组和转录组分析的标准方法可能会遗漏产生候选新抗原的体细胞突变。同样,标准肿瘤分析方法可能会无意中促成序列伪影或生殖系多态现象作为新抗原,而分别导致疫苗能力的低效使用或自身免疫的风险。
技术实现思路
本文公开了一种鉴别和选择用于个性化癌症疫苗的新抗原的优化方法。首先,提出了使用下一代测序(NGS)鉴别新抗原候选物的优化的肿瘤外显子组和转录组分析方法。这些方法建立在标准NGS肿瘤分析方法的基础之上,以确保在所有类别的基因组变化内推进最高敏感性和特异性的新抗原候选物。其次,提出了选择高PPV新抗原的新颖方法来克服特异性问题并确保打算包括在疫苗中的新抗原较大可能地引发抗肿瘤免疫。取决于实施方案,这些方法包括训练的统计回归或非线性深度学习模型,这些模型共同地模拟肽-等位基因定位以及多种长度的肽的独立等位基因基元(per-allelemotif),在不同长度的肽中共有统计强度。非线性深度学习模型可以专门设计和训练用于将同一细胞中的不同MHC等位基因处理为独立的,由此解决了线性模型所具有的不同MHC等位基因会相互干扰的问题。最后,解决了基于新抗原的个性化疫苗设计和制造的其它需要考虑的问题。附图说明参照以下描述和附图将更好地理解本专利技术的这些和其它特征、方面及优势,在附图中:图1A显示当前用于鉴别新抗原的临床方法。图1B显示<5%的预测结合肽被呈递在肿瘤细胞上。图1C显示新抗原预测特异性问题的影响。图1D显示结合预测不足以进行新抗原鉴别。图1E显示MHC-I呈递的机率随肽长度的变化。图1F显示由Promega动态范围标准(dynamicrangestandard)生成的示例性肽谱。图1G显示添加特征如何增加模型阳性预测值。图2A是根据一个实施方案,用于鉴别患者体内肽呈递的可能性的环境的概述。图2B和2C示出了根据一个实施方案的获得呈递信息的方法。图3是一个高级框图,示出了根据一个实施方案的呈递鉴别系统的计算机逻辑组件。图4示出了根据一个实施方案的一组示例训练数据。图5示出了与MHC等位基因相关联的示例网络模型。图6示出了MHC等位基因共享的示例网络模型。图7示出了使用示例网络模型生成与一个MHC等位基因相关联的肽的呈递可能性。图8示出了使用示例网络模型生成与一个MHC等位基因相关联的肽的呈递可能性。图9示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的呈递可能性。图10示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的呈递可能性。图11示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的呈递可能性。图12示出了使用示例网络模型生成与多个MHC等位基因相关联的肽的呈递可能性。图13示出了各种示例呈递模型的性能结果。图14示出了用于实施图1和3中所示实体的示例计算机。具体实施方式I.定义一般说来,权利要求书和说明书中使用的术语意图解释为具有与本领域普通技术人员所理解的普通含义。为清楚起见,以下定义某些术语。如果普通含义与所提供的定义之间存在矛盾,应使用所提供的定义。如本文所使用,术语“抗原”是诱导免疫反应的物质。如本文所使用,术语“新抗原”是具有至少一个使其不同于相应野生型亲本抗原的变化的抗原,例如,该变化是肿瘤细胞突变或肿瘤细胞特异性翻译后修饰。新抗原可以包括多肽序列或核苷酸序列。突变可以包括移码或非移码插入缺失、错义或无义取代、剪接位点变化、基因组重排或基因融合,或产生neoORF的任何基因组或表达变化。突变还可以包括剪接变体。肿瘤细胞特异性翻译后修饰可以包括异常磷酸化。肿瘤细胞特异性翻译后修饰还可以包括蛋白酶体产生的剪接抗原。参见Liepe等人,AlargefractionofHLAclassIligandsareproteasome-generatedsplicedpeptides;Science.2016Oct21;354(6310):354-358。如本文所使用,术语“肿瘤新抗原”是存在于受试者的肿瘤细胞或组织中但不存在于受试者的相应正常细胞或组织中的新抗原。如本文所使用,术语“基于新抗原的疫苗”是基于一个或多个新抗原,例如多个新抗原的疫苗构建体。如本文所使用,术语“候选新抗原”是产生可以代表新抗原的新序列的突变或其它异常。如本文所使用,术语“编码区”是基因中编码蛋白质的部分。如本文所使用,术语“编码突变”是在编码区中存在的突变。如本文所使用,术语“ORF”是指开放阅读框。如本文所使用,术语“NEO-ORF”是由突变或其它异常如剪接而产生的肿瘤特异性ORF。如本文所使用,术语“错义突变”是导致一个氨基酸被另一个氨基酸取代的突变。如本文所使用,术语“无义突变”是导致一个氨基酸被终止密码子取代的突变本文档来自技高网
...

【技术保护点】
1.一种用于鉴别来自受试者的肿瘤细胞中可能呈递于所述肿瘤细胞表面上的一种或多种新抗原的方法,包括以下步骤:从所述受试者的肿瘤细胞获得外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少一种,其中所述肿瘤核苷酸测序数据被用于获得代表新抗原集合中每一种新抗原的肽序列的数据,并且其中每一种新抗原的肽序列包含至少一个使其不同于相应野生型亲本肽序列的变化;将每一种新抗原的肽序列输入一个或多个呈递模型中以产生所述新抗原各自被一个或多个MHC等位基因呈递于所述受试者的所述肿瘤细胞的所述肿瘤细胞表面上的数字可能性集合,所述数字可能性集合已被至少基于接收到的质谱数据进行鉴别;及基于所述数字可能性集合,选择所述新抗原集合的子集,以产生选定的新抗原的集合。

【技术特征摘要】
【国外来华专利技术】2015.12.16 US 62/268,333;2016.04.04 US 62/317,823;1.一种用于鉴别来自受试者的肿瘤细胞中可能呈递于所述肿瘤细胞表面上的一种或多种新抗原的方法,包括以下步骤:从所述受试者的肿瘤细胞获得外显子组、转录组或全基因组肿瘤核苷酸测序数据中的至少一种,其中所述肿瘤核苷酸测序数据被用于获得代表新抗原集合中每一种新抗原的肽序列的数据,并且其中每一种新抗原的肽序列包含至少一个使其不同于相应野生型亲本肽序列的变化;将每一种新抗原的肽序列输入一个或多个呈递模型中以产生所述新抗原各自被一个或多个MHC等位基因呈递于所述受试者的所述肿瘤细胞的所述肿瘤细胞表面上的数字可能性集合,所述数字可能性集合已被至少基于接收到的质谱数据进行鉴别;及基于所述数字可能性集合,选择所述新抗原集合的子集,以产生选定的新抗原的集合。2.根据权利要求1所述的方法,其中所述集合的选定的新抗原的数量是20个。3.根据权利要求1至2中任一项所述的方法,其中所述呈递模型表示以下各项之间的依赖性:所述MHC等位基因中一对特定等位基因和肽序列特定位置处特定氨基酸的存在;与在所述肿瘤细胞表面上由所述对MHC等位基因中的特定等位基因呈递在所述位置处包含所述特定氨基酸的此类肽序列的可能性。4.根据权利要求1至3中任一项所述的方法,其中输入所述肽序列包括:将所述一个或多个呈递模型应用于相应新抗原的肽序列,以至少基于所述相应新抗原的肽序列的氨基酸位置生成所述一个或多个MHC等位基因各自的依赖性分数,所述依赖性分数指示所述MHC等位基因是否会呈递所述相应新抗原。5.根据权利要求4所述的方法,其另外包括:变换所述依赖性分数以得到每一MHC等位基因的相应独立等位基因可能性,由此指示相应MHC等位基因会呈递所述相应新抗原的可能性;及将所述独立等位基因可能性组合以产生所述数字可能性。6.根据权利要求5所述的方法,其中所述变换所述依赖性分数将所述相应新抗原的肽序列的呈递建模为相互排斥的。7.根据权利要求4至6中任一项所述的方法,其另外包括:变换所述依赖性分数的组合以产生所述数字可能性。8.根据权利要求7所述的方法,其中所述变换所述依赖性分数的组合将所述相应新抗原的肽序列的呈递建模为在MHC等位基因之间存在干扰。9.根据权利要求4至8中任一项所述的方法,其中数字可能性集合通过至少一个等位基因非相互作用特征进一步鉴别,并且另外包括:将不与所述一个或多个呈递模型中的一个相互作用的等位基因应用于所述等位基因非相互作用特征,以产生所述等位基因非相互作用特征的依赖性分数,所述依赖性分数指示所述相应新抗原的肽序列是否将基于所述等位基因非相互作用特征而被呈递。10.根据权利要求9所述的方法,其另外包括:将所述一个或多个MHC等位基因中每个MHC等位基因的依赖性分数与所述等位基因非相互作用特征的依赖性分数组合;变换每个MHC等位基因的所述组合的依赖性分数以产生所述MHC等位基因的相应独立等位基因可能性,由此指示所述相应MHC等位基因将呈递所述相应新抗原的可能性;及将组合所述独立等位基因可能性以产生所述数字可能性。11.根据权利要求9至10中任一项所述的方法,其另外包括:变换所述MHC等位基因中每一个的所述依赖性分数与所述等位基因非相互作用特征的所述依赖性分数的组合以产生所述数字可能性。12.根据权利要求1至11中任一项所述的方法,其中所述呈递模型的数字参数集合是基于训练数据集进行训练,所述训练数据集包括被鉴别为存在于多个样品中的至少一个训练肽序列集合以及与每一训练肽序列相关的一个或多个MHC等位基因,其中所述训练肽序列是通过对从来源于所述多个样品的MHC等位基因洗脱的分离的肽进行质谱法来鉴别。13.根据权利要求12所述的方法,其中所述训练数据集还包括有关所述肿瘤细胞的mRNA表达水平的数据。14.根据权利要求12至13中任一项所述的方法,其中所述样品包括被工程改造成表达单个I类或II类MHC等位基因的细胞系。15.根据权利要求12至14中任一项所述的方法,其中所述样品包括被工程改造成表达多个I类或II类MHC等位基因的细胞系。16.根据权利要求12至15中任一项所述的方法,其中所述样品包括从多个患者获得或得到的人细胞系。17.根据权利要求12至16中任一项所述的方法,其中所述样品包括从多个患者获得的新鲜或冷冻的肿瘤样品。18.根据权利要求12至17中任一项所述的方法,其中所述样品包括从多个患者获得的新鲜或冷冻的组织样品。19.根据权利要求12至18中任一项所述的方法,其中所述样品包括使用T细胞测定鉴别的肽。20.根据权利要求12至19中任一项所述的方法,其中所述训练数据集还包含与以下相关的数据:所述样品中存在的训练肽集合的肽丰度;所述样品中存在的训练肽集合的肽长度。21.根据权利要求12至20中任一项所述的方法,其中所述训练数据集是通过经由比对,将训练肽序列的集合与包含已知蛋白质序列的集合的数据库相比较而产生,其中所述训练蛋白质序列的集合比所述训练肽序列长并且包括所述训练肽序列。22.根据权利要求12至21中任一项所述的方法,其中所述训练数据集是基于对细胞系进行或已进行质谱法以获得来自所述细胞系的外显子组、转录组或全基因组测序数据中的至少一种而产生,所述肽测序数据包括至少一个含变化的蛋白质序列。23.根据权利要求12至22中任一项所述的方法,其中所述训练数据集是基于获得来自正常组织样品的外显子组、转录组或全基因组正常核苷酸测序数据中的至少一种而产生。24.根据权利要求12至23中任一项所述的方法,其中所述训练数据集还包含与所述样品相关的蛋白质组序列相关的数据。25.根据权利要求12至24中任一项所述的方法,其中所述训练数据集还包含与所述样品相关的MHC肽组序列相关的数据。26.根据权利要求12至25中任一项所述的方法,其中所述训练数据集还包含与所述分离的肽中的至少一个的肽-MHC结合亲和力测量值相关的数据。27.根据权利要求12至26中任一项所述的方法,其中所述训练数据集还包含与所述分离的肽中的至少一个的肽-MHC结合稳定性测量值相关的数据。28.根据权利要求12至27中任一项所述的方法,其中所述训练数据集还包含与所述样品相关的转录组相关的数据。29.根据权利要求12至28中任一项所述的方法,其中所述训练数据集还包含与所述样品相关的基因组相关的数据。30.根据权利要求12至29中任一项所述的方法,其中所述训练肽序列的长度在k-mer范围内,其中k在8-15之间(包括端点在内)。31.根据权利要求12至30中任一项所述的方法,其另外包括使用独热编码方案编码所述肽序列。32.根据权利要求31所述的方法,其还包括使用左填充独热编码方案编码所述训练肽序列。33.一种治疗患有肿瘤的受试者的方法,其包括进行权利要求1至32所述的步骤中的任一个,并且还包括获得包含选定的新抗原的集合的肿瘤疫苗,及将所述肿瘤疫苗施用给所述受试者。34.一种制造肿瘤疫苗的方法,其包括进行权利要求1至33所述的步骤中的任一个,并且还包括产生或已产生包含所述选定的新抗原的集合的肿瘤疫苗。35.一种肿瘤疫苗,包含根据权利要求1至32中任一项所述的选定的新抗原的集合,所述新抗原的集合是通过进行根据权利要求1至32中任一项所述的方法进行选择。36.根据权利要求35所述的疫苗,其中所述肿瘤疫苗包含核苷酸序列、多肽序列、RNA、DNA、细胞、质粒或载体中的一种或多种。37.根据权利要求35至36中任一项所述的疫苗,其中所述肿瘤疫苗包含呈递于肿瘤细胞表面上的一种或多种新抗原。38.根据权利要求35至37中任一项所述的疫苗,其中所述肿瘤疫苗包含在受试者体内具有免疫原性的一种或多种新抗原。39.根据权利要求35至38中任一项所述的疫苗,其中所述肿瘤疫苗不包含诱导针对所述受试者体内正常组织的自体免疫反应的一种或多种新抗原。40.根据权利要求35至39中任一项所述的疫苗,其中所述肿瘤疫苗还包含佐剂。41.根据权利要求35至40中任一项所述的疫苗,其中所述肿瘤疫苗还包含赋形剂。42.根据权利要求1至41中任一项所述的方法,其中选择所述选定的新抗原的集合包括基于所述呈递模型,选择在所述肿瘤细胞表面上呈递的可能性相对于未选择的新抗原有所增加的新抗原。43.根据权利要求1至42中任一项所述的方法,其中选择所述选定的新抗原的集合包括基于所述呈递模型,选择能够在所述受试者体内诱导肿瘤特异性免疫反应的可能性相对于未选择的新抗原有所增加的新抗原。44.根据权利要求1至43中任一项所述的方法,其中选择所述选定的新抗原的集合包括基于所述呈递模型,选择能够被专职抗原呈递细胞(APC)呈递至天然T细胞的可能性相对于未选择的新抗原有所增加的新抗原,任选地其中所述APC是树突状细胞(DC)。45.根据权利要求1至44中任一项所述的方法,其中选择所述选定的新抗原的集合包括基于所述呈递模型,选择经历中枢或外周耐受性抑制的可能性相对于未选择的新抗原有所降低的新抗原。46.根据权利要求1至45中任一项所述的方法,其中选择所述选定的新抗原的集合包括基于所述呈递模型,选择能够在所述受试者体内诱导针对正常组织的自体免疫反应的可能性相对于未选择的新抗原有所降低的新抗原。47.根据权利要求1至46中任一项所述的方法,其中外显子组或转录组核苷酸测序数据是通过对所述肿瘤组织进行测序来获得。48.根据权利要求1至47中任一项所述的方法,其中所述测序是下一代测序(NGS)或任何大规模平行测序方法。49.根据权利要求1至48中任一项所述的方法,其中所述数字可能性集合通过至少MHC等位基因相互作用特征进一步鉴别,所述特征包括以下中的至少一种:a.预测的所述MHC等位基因与所述新抗原编码肽结合的亲和力;b.预测的所述新抗原编码肽-MHC复合物的稳定性;c.所述新抗原编码肽的序列和长度;d.如通过质谱蛋白质组学或其它手段所评估的在来自表达特定MHC等位基因的其他个体的细胞中呈递具有类似序列的新抗原编码肽的机率;e.在相关受试者中所述特定MHC等位基因的表达水平(例如,如通过RNA-seq或质谱法测量);f.在表达所述特定MHC等位基因的其他不同受试者中不依赖于总体新抗原编码肽序列而由所述特定MHC等位基因呈递的机率;g.在其他不同受试者中不依赖于总体...

【专利技术属性】
技术研发人员:R·耶冷斯凯A·德里蒂B·布里克沙利文J·巴斯比
申请(专利权)人:磨石肿瘤生物技术公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1