基于高通量靶向测序分析肿瘤突变负荷的方法技术

技术编号:22326239 阅读:61 留言:0更新日期:2019-10-19 11:24
本公开涉及一种基于高通量靶向测序数据分析肿瘤突变负荷的方法和系统,所述方法包括以下步骤:通过高通量靶向测序对肿瘤样本和配对对照样本中的靶基因的选定外显子和上下游区域的序列进行测序;通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;以及将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:TMB=总突变数目/总区域长度。

Analysis of tumor mutation load based on high throughput targeted sequencing

【技术实现步骤摘要】
基于高通量靶向测序分析肿瘤突变负荷的方法
本公开属于生物信息技术中的基因检测领域,具体来说,涉及一种利用高通量靶向测序数据分析肿瘤突变负荷的方法和系统。技术背景化疗和放疗、靶向治疗以及免疫治疗被列为肿瘤治疗的三次革命。其中,免疫治疗以其低毒性、不损伤反而增强免疫系统、以及降低癌症复发率等优点,受到科学家、医生和患者的广泛关注。近几年来,免疫疗法在治疗黑色素瘤、非小细胞肺癌、头颈癌、尿路上皮癌,以及其他具有错配修复缺陷的肿瘤方面表现出显著的临床疗效。免疫药物,如最近在国内审批上市的O药(Opdivo)、K药(Keytruda)以及国产的特瑞普利,均是通过靶向免疫检查点分子来增强抗肿瘤免疫应答。而针对程序性死亡蛋白1(PD-1)以及其配体PD-L1、细胞毒性T淋巴细胞相关抗原4(CTLA-4)的抑制剂是目前促进T细胞免疫活化的主要药物,且展现出良好的抗癌效果。然而,免疫疗法并不是适合于每一个癌症患者。为了提高免疫疗法的经济学效能进而避免不必要的浪费,需要实现精准免疫治疗,选择优势获益人群等。在癌症患者中,肿瘤细胞通常存在各种体细胞突变,其与肿瘤的发生和发展相关。肿瘤突变负荷(TumorMutationBurden,TMB)表示肿瘤细胞的基因组上每一百万个碱基中存在的体细胞突变个数。TMB是重点研究的免疫疗法潜在生物标志物之一,与疗效响应率相关,可以用于选择免疫疗法的高获益人群。同时,相比于MSI-H/dMMR的低发生率,TMB高的患者比例更高。目前,TMB已被收入NCCN的NSCLC治疗指南。随着测序成本的降低,使用二代测序技术预测分析TMB成为可能。现有技术主要采取肿瘤样本与其对应的配对对照样本进行全基因组测序或全外显子组测序来对TMB进行预测分析。
技术实现思路
本公开旨在提供一种基于高通量靶向测序分析癌症的肿瘤突变负荷(TMB)的方法和系统。通过本公开的方法检测的TMB在本文中也称为OncoScreenPlusTMB。相应的,在第一个方面,本公开涉及一种分析肿瘤突变负荷(TMB)的方法,所述方法包括:a.通过高通量靶向测序,对肿瘤样本和配对对照样本中的靶基因的选定外显子和上下游20bp区域的序列进行测序,所述多个靶基因包括以下表1中列出的基因的外显子;b.通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;和d.将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:TMB=总突变数目/总区域长度,其中在计算总突变数目和总区域长度时排除2号染色体29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。表1.靶基因外显子列表人2号染色体29419654-29446218位的序列对应ALK基因激酶编码区域;人7号染色体55241614-55259567位的序列对应EGFR基因激酶编码区域。ALK与EGFR激酶区内突变主要为TKI(酪氨酸激酶抑制剂)用药后诱导出现的耐药突变,不代表全基因组上原发的体细胞突变水平,因此在计算TMB予以排除。在上述方法的一些实施方案中,使用的肿瘤样本中肿瘤细胞的比例不少于约20%,例如不少于约30%或不少于约50%。在上述方法的一些实施方案中,所述配对对照样本可以选自癌旁组织样本或白细胞样本,即与所述肿瘤样本来源于相同个体的癌旁组织样本或白细胞样本。在另一些实施方案中,可以使用其他类型的组织样本作为配对对照样本。在上述方法的一些实施方案中,所述高通量靶向测序可以包括:a1.从所述肿瘤样本和配对对照样本提取DNA;a2.将所述DNA片段化并扩增,从而制备预文库;a3.使用特异性探针,从所述预文库中捕获包含所述靶基因的选定外显子和上下游区域覆盖的区域的DNA片段;a4.对捕获的DNA片段进行扩增,从而制备终文库;和a5.对所述终文库进行测序,以获得所述靶基因的选定外显子和上下游区域的序列信息。在一些实施方案中,在步骤a2中将DNA片段化为平均约200bp的DNA片段,例如200bp±50bp、200±20bp或200bp±10bp。在一些实施方案中,在a3中使用的所述特异性探针是RNA探针。在上述方法的一些实施方案中,计算所述区域内的体细胞突变的数量可以包括:b1.将从所述肿瘤样本获得的序列数据与人类参考基因组序列进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;b2.将从所述配对对照样本获得的序列数据与人类参考基因组序列进行比对,以获得所述靶基因的选定外显子和上下游区域中的胚系变异;和b3.使用所述胚系变异过滤b1中检测的潜在突变,从而筛选体细胞突变,并计算所述体细胞突变的数量。在上述方法的一些实施方案中,所述体细胞突变包括单核苷酸变异(SNP)和插入缺失突变(indel)。在上述方法中,所述肿瘤的类型可以是实体瘤。在一些实施方案中,所述肿瘤可以选自膀胱癌、乳腺癌、宫颈癌、胆管癌、结直肠癌、子宫内膜癌、食道癌、头颈癌、胃癌、肝癌、肾癌、肺癌、黑色素瘤、卵巢癌、胰腺癌、前列腺癌、肉瘤和甲状腺癌等。在第二个方面,本公开涉及一种分析肿瘤负荷突变的系统,所述系统包括:靶向高通量测序模块;和突变分析模块,其中,所述靶向高通量测序模块配置为使用特异性探针从DNA片段文库中捕获包含靶基因的选定外显子和上下游区域覆盖的区域的DNA片段,并对所述DNA片段进行测序以获得所述靶基因的选定外显子和外显子上下游20bp区域的序列信息,其中所述靶基因的选定外显子包括表1中列出的基因的外显子;并且所述突变分析模块配置为将所述序列信息与人参考基因组序列信息进行比对,从而计算所述DNA片段文库中所述靶基因的选定外显子和上下游区域中的突变的数量。在上述系统的一些实施方案中,所述特异性探针是RNA探针。在上述系统的一些实施方案中,所述靶向高通量测序模块配置为对肿瘤样本DNA片段文库和配对对照样本DNA片段文库分别进行捕获和测序,以获得所述靶基因的选定外显子和上下游区域的序列信息;并且所述突变分析模块配置为将从所述肿瘤样本DNA片段文库获得的序列信息与参考基因组进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;并将从所述配对对照样本DNA片段文库获得的序列信息与参考基因组进行比对以获得所述靶基因的选定外显子和上下游区域中的胚系变异;以及使用所述胚系突变过滤所述潜在突变,从而筛选体细胞突变。在进一步的实施方案中,所述突变分析模块进一步配置为将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:TMB=总突变数目/总区域长度,其中在计算总突变数目和总区域长度时排除2号染色体29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。在上述系统的一些实施方案中,所述体细胞突变包括单核苷酸变异(SNP)和插入缺失突变(indel)。在第三个方面,本公开涉及本文档来自技高网
...

【技术保护点】
1.一种分析肿瘤突变负荷(TMB)的方法,所述方法包括:a.通过高通量靶向测序,对肿瘤样本和配对对照样本中的靶基因的选定外显子和外显子上下游20bp区域的序列进行测序,所述靶基因的选定外显子包括表1中列出的基因的外显子;b.通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;和c.将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:TMB=总突变数目/总区域长度,其中在计算总突变数目和总区域长度时排除2号染色体29419654‑29446218位和/或7号染色体55241614‑55259567位中的突变和序列长度。

【技术特征摘要】
1.一种分析肿瘤突变负荷(TMB)的方法,所述方法包括:a.通过高通量靶向测序,对肿瘤样本和配对对照样本中的靶基因的选定外显子和外显子上下游20bp区域的序列进行测序,所述靶基因的选定外显子包括表1中列出的基因的外显子;b.通过将从所述肿瘤样本和配对对照样本获得的序列数据与人类参考基因组序列进行比对,计算肿瘤样本中所述靶基因的选定外显子和上下游区域的序列中体细胞突变的数量;和c.将所述靶基因的选定外显子和上下游区域中的突变数量相加以获得总突变数量,并将所述靶基因的选定外显子和上下游区域的长度相加以获得总区域长度(Mb),通过以下公式计算TMB:TMB=总突变数目/总区域长度,其中在计算总突变数目和总区域长度时排除2号染色体29419654-29446218位和/或7号染色体55241614-55259567位中的突变和序列长度。2.如权利要求1所述的方法,其中所述肿瘤样本中肿瘤细胞的比例不少于20%。3.如权利要求1或2所述的方法,其中所述配对对照样本是癌旁组织样本或白细胞样本。4.如权利要求1-3中任一项所述的方法,其中所述高通量靶向测序包括:a1.从所述肿瘤样本和配对对照样本提取DNA;a2.将所述DNA片段化并扩增,从而制备预文库;a3.使用特异性探针,从所述预文库中捕获包含所述靶基因的选定外显子和上下游区域覆盖的区域的DNA片段;a4.对捕获的DNA片段进行扩增,从而制备终文库;和a5.对所述终文库进行测序,以获得所述靶基因的选定外显子和上下游区域的序列信息。5.如权利要求1-4中任一项所述的方法,其中计算所述区域内的体细胞突变的数量包括:b1.将从所述肿瘤样本获得的序列数据与人类参考基因组序列进行比对,以检测所述靶基因的选定外显子和上下游区域中存在的潜在突变;b2.将从所述配对对照样本获得的序列数据与人类参考基因组序列进行比对,以获得所述靶基因的选定外显子和上下游区域中的胚系变异;和b3.使用所述胚系变异过滤b1中检测的潜在突变,从而筛选体细胞突变,并计算所述体细胞突变的数量。6.如权利要求1-5中任一项所述的方法,其中所述体细胞突变包括单核苷酸变异(SNP)和插入缺失突变(indel)。7.如权利要求1-6中任一项所述的方法,其中所述肿瘤是实体瘤。8.如权利要求7所述的方法,其中所述肿瘤选自膀胱癌、乳腺癌、宫颈癌、胆管癌、结直肠癌、子宫内膜癌、食道癌、头...

【专利技术属性】
技术研发人员:张周张之宏侯婷李冰揣少坤汉雨生
申请(专利权)人:广州燃石医学检验所有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1