比对和变体测序分析管线制造技术

技术编号:17570696 阅读:38 留言:0更新日期:2018-03-28 18:47
提供了用于分析来自下一代序列(NGS)平台的基因序列数据的系统和方法。还提供了制备通过NGS进行核酸序列分析的样品的方法。使用修改的GATK变体判读器进行变体判读。将读段映射到基因组参考序列是用Burrows Wheeler Aligner(BWA)进行的,且不包括软剪切。基因组参考序列是GRCh37.1人类基因组参考序列。测序方法包括乳液PCR(emPCR)、滚环扩增或固相扩增。在一些实施方案中,固相扩增是克隆桥扩增。

【技术实现步骤摘要】
【国外来华专利技术】比对和变体测序分析管线对相关申请的交叉引用本申请要求2015年3月26日提交的美国临时申请No.62/138620和2015年11月11日提交的美国临时申请No.62/253908的优先权和权益,其内容各自通过提述完整并入本文。背景在美国,每年诊断出超过200000例乳腺癌新病例。其中约2%至5%与BRCA1或BRCA2基因中的功能丧失变体相关。在一般人群中估计的携带者频率BRCA1为1:300,BRCA2为1:800,例外是阿什肯纳兹犹太人(Ashkenazi-Jewish)女性,在她们中BRCA1和BRCA2中的3种始祖突变(foundermutation)的携带者频率为2%至5%。带有BRCA1或BRCA2基因中的有害突变的患者发生乳腺癌的终生风险有50%至80%,发生卵巢癌的终生风险有20%至40%。三阴性乳腺癌——不表达雌激素受体、孕激素受体或Her2/neu,特点是侵袭性更强——占所有乳腺癌的15%至20%;三阴性乳腺癌与BRCA突变相关,频率在4%至42%之间,取决于研究人群的特征(例如,阿什肯纳兹犹太人女性的比例)。美国国家综合癌症网络(NCCN)制定了帮助医疗保健提供者鉴定具有乳腺癌和卵巢癌高风险、并可能受益于癌症遗传风险评估的患者和家族成员的指南。遗传风险评估可能包括基因检测,但它是一个动态的咨询过程。确定乳腺癌女性是否为BRCA1/2阳性可有助于提供适当的关于增加监视以及关于对侧乳房切除术和/或输卵管卵巢切除术的风险与收益的咨询,而这两种手术都已被证明是对抗乳腺癌的防护措施。鉴定患者中的有害BRCA1/2变体也可能对家庭成员有帮助,家庭成员可能需要获取遗传咨询和测试的渠道来评估他们的癌症风险并确定适当的管理。美国乳腺外科医生学会建议对高风险人群个体进行BRCA1/2检测,包括具有以下情况的人群:早发型乳腺癌患者(50岁以前诊断);两处原发性乳腺癌,双侧或同侧;早发型乳腺癌家族史;男性乳腺癌;卵巢癌(特别是非粘液型)的个人或家族史;在新诊断的乳腺癌或乳腺癌家族史背景中的阿什肯纳兹(东欧)犹太血统;家族中以前鉴定出BRCA1或BRCA2突变;年龄≤60岁的三阴性乳腺癌;或与遗传性乳腺癌家族史和卵巢相关癌症相关联的胰腺癌。综合性的BRCA检测通常包括对BRCA1和BRCA2的所有编码外显子及剪接接合区进行测序,和对大基因重排进行分析。当扩增或测序引物序列中存在多态性时,基于PCR的测序方法,包括使用PCR扩增的Sanger测序和下一代测序(NGS)系统,可能由于等位基因脱扣(drop-out)而产生假阴性结果。因此,对于改进样品测序的方法以及准确高效地分析NGS测序数据的方法存在着需要。概述在本文某些实施方案中提供了处理由高通量测序方法(包括下一代测序平台)产生的测序数据的方法。示例性测序平台包括但不限于IlluminaMiSeq系统和LifeTechnologiesIonTorrent个人化操作基因组测序仪。在本文某些实施方案中提供了确定受试者中一个或多个基因中的变体的存在的方法,所述方法包括:(a)使用核酸测序仪提供从来自受试者的核酸样品的核酸测序反应产生的原始测序数据;(b)从所述原始测序数据中去除未通过质量过滤器的低质量读段;(c)从经过滤的原始测序数据中修剪衔接子和/或分子鉴别(MID)序列;(d)将经过滤的原始测序数据映射到基因组参考序列以生成经映射的读段;(e)对经映射的读段进行分类和索引;(f)将读段组添加到数据文件以生成经处理的序列文件;(g)创建重新比对(realigner)目标;(h)对经处理的序列文件进行局部重新比对以生成重新比对的序列文件;(i)从重新比对的序列文件中去除重复读段;(j)分析感兴趣的编码区;和(k)基于步骤(j)中的分析,生成鉴定变体是否存在的报告,其中使用限于含有该一个或多个感兴趣基因的核酸区域的改良的基因组比对工具(utility)进行步骤(g)和(j)。在一些实施方案中,该方法包括使用核酸测序仪对来自受试者的核酸样品进行核酸测序反应以产生步骤(a)的原始测序数据。在一些实施方案中,分析感兴趣的编码区包括判读(call)感兴趣的区域中的每个位置上的变体。在一些实施方案中,感兴趣的区域被额外的150个碱基填补(pad)。在一些实施方案中,使用改良的GATK变体判读器来进行变体判读。在一些实施方案中,将读段映射到基因组参考序列是用BurrowsWheelerAligner(BWA)进行的。在一些实施方案中,将读段映射到基因组参考序列不包括软剪切(softclipping)。在一些实施方案中,基因组参考序列是GRCh37.1人类基因组参考序列。在一些实施方案中,测序方法包括乳液PCR(emPCR)、滚环扩增或固相扩增。在一些实施方案中,固相扩增是克隆桥(clonalbridge)扩增。在一些实施方案中,用于序列分析的核酸从来自受试者的生物样品中提取。在一些实施方案中,生物样品是流体或组织样品。在一些实施方案中,生物样品是血液样品。在一些实施方案中,核酸是基因组DNA。在一些实施方案中,核酸是从mRNA反转录的cDNA。在一些实施方案中,其中核酸样品在测序前通过进行以下一种或多种方法制备:(a)剪切(shear)核酸;(b)浓缩核酸样品;(c)对经剪切的核酸样品中的核酸分子进行大小选择;(d)使用DNA聚合酶修复样品中核酸分子的末端;(e)附接一个或多个衔接子序列;(f)扩增核酸以增加具有附接的衔接子序列的核酸的比例;(g)富集核酸样品中的一个或多个感兴趣的基因;和/或(h)在即将测序之前定量核酸样品引物。在一些实施方案中,所述一个或多个衔接子序列包含用于引发测序反应和/或核酸扩增反应的核酸序列。在一些实施方案中,一个或多个衔接子序列包含分子鉴别(MID)标签。在一些实施方案中,富集核酸样品中的一个或多个感兴趣的基因包括使用一个或多个生物素化RNA诱饵的外显子捕获。在一些实施方案中,生物素化的RNA诱饵对于外显子区域、剪接接合位点或内含子区域或一个或多个感兴趣的基因是特异性的。在一些实施方案中,所述一个或多个生物素化RNA诱饵对于BRCA1基因和/或BRCA2基因是特异性的。在一些实施方案中,用于序列分析的核酸从哺乳动物受试者获得。在一些实施方案中,受试者是人类患者。在一些实施方案中,受试者是疑似患有癌症或疑似具有发生癌症的风险的人。在一些实施方案中,癌症是乳腺癌或卵巢癌。在一些实施方案中,通过本文中提供的方法确定与癌症相关的基因中的一个或多个变体。在一些实施方案中,确定了BRCA1基因或BRCA2基因中的一个或多个变体。在一些实施方案中,一个或多个变体选自表1中列出的变体。在一些实施方案中,所提供的方法进一步包括通过测序确认所述一个或多个变体的存在。本文还在某些实施方案中提供了包括一个或多个电子处理器的系统,所述电子处理器配置为:(a)从原始测序数据中去除未通过质量过滤器的低质量读段;(b)从过滤的原始测序数据中修剪衔接子和/或分子鉴别(MID)序列;(c)将经过滤的原始测序数据映射到基因组参考序列以生成经映射的读段;(d)对映射的读段进行分类和索引;(e)将读段组添加到数据文件以生成经处理的序列文件;(f)创建重新比对目标;(g本文档来自技高网...
比对和变体测序分析管线

【技术保护点】
一种确定受试者中一个或多个基因中的变体的存在的方法,所述方法包括:(a)从核酸测序仪获得与受试者相关的原始测序数据;(b)从原始测序数据中去除未通过质量过滤器的低质量读段;(c)从经过滤的原始测序数据中修剪掉衔接子和/或分子鉴别(MID)序列;(d)将经过滤的原始测序数据映射到基因组参考序列以生成映射的读段;(e)对映射的读段进行排序和索引;(f)将读段组添加到数据文件以生成经处理的序列文件;(g)创建重新比对目标;(h)进行经处理的序列文件的局部重新比对以生成重新比对的序列文件;(i)从重新比对的序列文件中去除重复读段;(j)分析感兴趣的编码区;和(k)基于步骤(j)中的分析,生成鉴定变体是否存在的报告,其中使用限于含有所述一个或多个感兴趣基因的核酸区域的改良的基因组比对工具来进行步骤(g)和(h)。

【技术特征摘要】
【国外来华专利技术】2015.03.26 US 62/138,620;2015.11.11 US 62/253,9081.一种确定受试者中一个或多个基因中的变体的存在的方法,所述方法包括:(a)从核酸测序仪获得与受试者相关的原始测序数据;(b)从原始测序数据中去除未通过质量过滤器的低质量读段;(c)从经过滤的原始测序数据中修剪掉衔接子和/或分子鉴别(MID)序列;(d)将经过滤的原始测序数据映射到基因组参考序列以生成映射的读段;(e)对映射的读段进行排序和索引;(f)将读段组添加到数据文件以生成经处理的序列文件;(g)创建重新比对目标;(h)进行经处理的序列文件的局部重新比对以生成重新比对的序列文件;(i)从重新比对的序列文件中去除重复读段;(j)分析感兴趣的编码区;和(k)基于步骤(j)中的分析,生成鉴定变体是否存在的报告,其中使用限于含有所述一个或多个感兴趣基因的核酸区域的改良的基因组比对工具来进行步骤(g)和(h)。2.权利要求1的方法,进一步包括使用核酸测序仪对来自受试者的核酸样品进行核酸测序反应以生成步骤(a)的原始测序数据。3.权利要求1的方法,其中分析感兴趣的编码区包括判读感兴趣区域中的每个位置处的变体。4.权利要求3的方法,其中所述感兴趣的区域被额外的150个碱基填补。5.权利要求3的方法,其中使用改良的GATK变体判读器来进行变体判读。6.权利要求1的方法,其中将读段映射到基因组参考序列是用BurrowsWheelerAligner(BWA)进行的。7.权利要求1的方法,其中将读段映射到基因组参考序列不包括软剪切。8.权利要求1的方法,其中所述基因组参考序列是GRCh37.1人类基因组参考序列。9.权利要求1的方法,其中所述测序方法包括乳液PCR(emPCR)、滚环扩增或固相扩增。10.权利要求1的方法,其中所述固相扩增是克隆桥扩增。11.权利要求1的方法,其中所述核酸是从来自受试者的生物样品中提取的。12.权利要求11的方法,其中所述生物样品是流体或组织样品。13.权利要求11的方法,其中所述生物样品是血液样品。14.权利要求1的方法,其中所述核酸是基因组DNA。15.权利要求1的方法,其中所述核酸是从mRNA反转录的cDNA。16.权利要求1的方法,其中在测序前通过实施以下一种或多种方法制备核酸:(a)剪切核酸;(b)浓缩核酸样品;(c)对剪切的核酸样品中的核酸分子进行大小选择;(d)使用DNA聚合酶修复样品中核酸分子的末端;(e)附接一个或多个衔接子序列;(f)扩增核酸以增加具有附接的衔接子序列的核酸的比例;(g)富集核酸样品中一个或多个感兴趣的基因;和/或(h)在即将测序之前定量核酸样品引物。17.权利要求16的方法,其中所述一个或多个衔接子序列包括用于引发测序反应和/或核酸扩增反应的核酸序列。18.权利要求16的方法,其中所述一个或多个衔接子序列包含分子鉴别(MID)标签。19.权利要求16的方法,其中富集核酸样品中的一个或多个感兴趣的基因包括使用一个或多个生物素化RNA诱饵的外显子捕获。20.权利要求19的方法,其中所述生物素化的RNA诱饵对于外显子区域、剪接接合位点、或内含子区域或一个或多个感...

【专利技术属性】
技术研发人员:C·埃尔津加
申请(专利权)人:奎斯特诊断投资股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1