用于重复序列的核酸大小检测的方法技术

技术编号:18736965 阅读:42 留言:0更新日期:2018-08-22 05:25
本文中公开了用于核酸分析的数据处理和计算注释系统和装置以及相应的方法。具体而言,本文中公开了用于对核酸样品的重复区域测定大小的方法。例如,本文中公开的方法使用扩增产物梯测定核酸大小。

【技术实现步骤摘要】
【国外来华专利技术】用于重复序列的核酸大小检测的方法本申请要求2015年11月3日提交的美国临时申请No.62/250,476的优先权权益,其在此通过引用完整并入。专利
本公开涉及用于核酸分析的数据处理和计算注释系统和装置以及相应的方法。具体而言,本公开涉及对核酸的重复区测定大小的方法。专利技术背景包含核苷酸重复区(例如同聚物区、二核苷酸重复、三核苷酸重复、六核苷酸重复等)的遗传基因座在人或动物基因组中是常见的。富集GC(鸟嘌呤-胞嘧啶)含量的遗传基因座也是常见的,而已经报告和研究了具有AT(腺嘌呤-胸腺嘧啶)富含含量的基因座。在一些情况下,富含GC或A/T的区域的扩充,或核苷酸重复的扩充可以与各种疾病状态有关。例如,位于X染色体上的脆性X智力低下-1基因(FMR1)的5’非翻译区(UTR)中的CGG重复的扩充与脆性X综合征(FXS)和多种病症和表型有关。在大多数人中,三核苷酸CGG在FMR1基因的5’非翻译区(UTR)中重复约5-44次(“CGG重复区”)。此区域中扩充至大于约45个CGG重复序列,特别是大于约200个CGG重复序列已经与FXS相关联。FXS表型可以包括智力低下、孤独症、焦虑和其它认知或行为状况。(J.Mol.Diag.10(6):496-501(2008))。同样,FMR2基因的5’UTR中CCG三核苷酸重复区(“CCG重复区”)的扩充与X连锁智力障碍相关,特别是与脆性X综合征E(FRAXE)相关。FRAXE是X连锁智力低下的常见形式。在其它情况下,重复长度多态性与疾病状态有关。例如,TOMM40基因的内含子6含有多聚-T重复区,并且已经报告在群体中显显示重复长度多态性(rs10524523)。已经报告TOMM40多聚T大小与迟发型阿尔茨海默氏病以及老年人的认知表现有关(参见ThePharmacogeneticsJournal10:375-3840(2010);andAlzheimer’sandDementia9:132-136(2013))。此外,C9ORF72基因中的内含子(G4C2)n六核苷酸重复扩充已经以约1/600频率在普通人群中观察到,,并且存在于全部肌萎缩侧索硬化(ALS)和额颞叶痴呆(FTD)病例的约10%中。少于30个重复认为是正常的,而致病性C9ORF72扩充可以包括数百到数千个重复。因此,用于对患者基因型进行准确测量、测定大小和重建的方法可以有益于这些疾病和其它疾病的诊断和治疗。用于评估包含核苷酸重复(例如FMR1和FMR2中的CGG和CCG重复序列)的序列的方法包括限制酶消化和聚合酶链式反应(PCR)策略。限制性消化分析可以提供重复区大小的粗略测量。然而,限制性消化分析在分辨率上可能受到限制,不容易检测到短中断(如CGG重复区内的AGG中断),并且不能确定甲基化状态。PCR策略可以在对重复区测定大小和重建各种基因型中提供更高的准确性。然而,在包含长重复序列的遗传基因座或含有富含GC或A/T的序列的遗传基因座的扩增和测序中存在限制,所述富含GC或A/T的序列阻碍重建这些基因座的基因型的能力。例如,已经尝试努力优化用于分析FMR1中CGG重复的PCR程序,并且包括对常规PCR测定的修改。(参见GenomeRes.6(7):633-8,(1996);J.Mol.Diag.8:544-550,(2006);和Am.J.Med.Genet.51(4):527-34,(1994))。最近,已经开发了PCR技术,其允许具有超过200个CGG或CCG重复的基因组基因座的更可靠的扩增。目前的工作流策略通常使用PCR与大小分辨技术,例如毛细管电泳。毛细管电泳改善了基于PCR的测定法的定量能力,以允许将DNA产物的精确分辨率降至单碱基分辨率。为了便于DNA产物的大小测定(sizing),通常使用外部标准校准品,例如使用合并的经染料标记的已知大小的DNA片段,其跨越特定毛细管电泳应用的感兴趣的大小范围。然而,尽管通过应用这些标准品实现了使能(enable)能力,但此种方法有几个缺点,包括但不限于:i.商品化染料标记的DNA梯的高成本;ii.通过对标准品梯使用专用染料通道导致的毛细管电泳多路复用降低,iii.大小测定不准确,其源自由PCR扩增分析物与标准DNA之间的碱基组成或序列差异所致的电泳迁移率偏斜,从而需要使用定制的DNA梯,其在大小测定,特别在重复无序PCR产物的大小测定的使用中可能是费力或使用无效的。此外,FMR1PCR和CE产物的片段大小分析由经过培训的操作人员手动进行,这对于大型样品集是费力的,并且会将不明确性和主观性引入其它方面简化的工作流中。因此,本领域需要对重复区测定大小并重建与那些重复区有关的基因型的改善的方法,所述重复区也可以是富含GC或A/T的。本文公开的方法涉及在用于对一个或多个核苷酸重复区测定大小并从中重建基因型的基于扩增的方法中的,单独或与外部标准品组合的内部标准品的产生和使用。附图简述附图不一定按比例或详尽。相反,重点通常放在例示本文中所述的专利技术的原理上。并入本说明书并构成本说明书的一部分的附图显示了与本公开一致的几个实施方案,并且与说明书一起用来解释本公开的原理。在附图中:图1描绘了用于基因型峰大小测定的系统的示例性高级表示。图2描绘了用于自动分析基因组重复区的示例性过程。图3A描绘了用于生成外部大小测定标准品的示例性外部大小测定梯。图3B描绘了示例性外部大小测定标准品。图4A描绘扩增产物梯的示例性通道。图4B描绘了使用重复概况来生成内部大小测定标准品。图5描绘了用背景模型和动态阈值注释的示例性重复概况。图6A描绘了显示(n,n+1)基因型的杂合女性的示例性重复区。图6B描绘了示例性扩充重复区。图7A-7C描绘具有不同质量控制问题的样品。图7A描绘了具有较差的ROX梯的样品。图7B描绘了具有较差的PCR扩增的样品。图7C描绘了具有污染峰的样品。图8描绘了用于基因型峰大小测定的示例性计算系统。图9描绘了根据实施例1中描述的某些实施方案的实验设计的示意图。图10描绘了重复峰定位用于对基因特异性产物测定大小的过程的图示。可以使用每个重复的预期位置产生用于大小测定的校正曲线,作为独立的大小测定梯或者作为对外部大小测定标准品的片段迁移率校正。图11描绘了与深灰色的1106份样品的验证数据集中的基因型分布相比浅灰色的一般群体中FMR1基因型的分布。图12描绘了使用内部衍生的大小测定梯和从称为ROX梯(ROX100大小梯,AsuragenP/N:145194)的外部大小测定标准品衍生的大小测定梯测定的重复区长度之间的一致性。图13描绘了在临床组中评估的主要等位基因的手动和自动化大小测定之间的比较。图14A和14B描绘了详述算法对基因特异性产物的分析灵敏性的图。箭头指示通过自动化大小测定生成的呼叫(calls)。图14A描绘了另外的基因特异性产物的检测。图14B描绘了低丰度扩充等位基因的检测。图15A和15B描绘了详述FMR1基因型范围间的测定法的分析灵敏性的图。箭头指示通过自动化大小测定生成的呼叫。图15A描绘了正常样品。图15B描绘了具有次要等位基因的前突变(premutation)样品。图16显示了示例性测定法和软件组件的图。图17描绘了外部梯,描绘了某些测定法的本文档来自技高网...

【技术保护点】
1.对核酸样品的重复区测定大小的方法,其包括:i.扩增所述重复区;ii.进行高分辨率片段分析;iii.获得扩增产物梯;并且iv.使用所述扩增产物梯作为内部标准品以测定重复区长度,从而对所述重复区测定大小。

【技术特征摘要】
【国外来华专利技术】2015.11.03 US 62/250,4761.对核酸样品的重复区测定大小的方法,其包括:i.扩增所述重复区;ii.进行高分辨率片段分析;iii.获得扩增产物梯;并且iv.使用所述扩增产物梯作为内部标准品以测定重复区长度,从而对所述重复区测定大小。2.在对核酸测定大小中使用扩增产物梯作为内部标准品的方法,其包括:a)扩增包含重复区的核酸区域;b)进行高分辨率片段分析;c)获得扩增产物梯;并且d)参照所述扩增产物梯作为内部标准品对所述核酸测定大小。3.测量来自患者的核酸的重复区的总长度的方法,其包括:a)扩增包含所述重复区的核酸区域;b)通过以下测量所述重复区的总长度:i.进行高分辨率片段分析;ii.获得扩增产物梯;并且iii.使用所述梯作为内部标准品以测定重复区长度。4.权利要求1-3中任一项的方法,其还包括测定所述扩增产物梯的重复概况。5.重复区大小测定的方法,其包括:a)扩增包含所述重复区的核酸区域;b)获得扩增产物梯;c)测定所述扩增产物梯的重复概况;并且从而对所述重复区测定大小。6.基因型峰大小测定的方法,其包括:i.扩增核酸样品的重复区;ii.进行高分辨率片段分析;iii.获得扩增产物梯;iv.鉴定至少一个基因特异性峰;并且v.使用所述扩增产物梯对所述重复区和所述至少一个基因特异性峰中的至少一种测定大小。7.产生内部大小测定标准品的方法,其包括:鉴定对应于扩增产物梯的通道中的重复概况;迭代地产生重复峰位置的组,迭代包括:使用先前的峰位置和区间数值测定所述重复概况中的预测的峰位置,鉴定包括所述预测的峰位置的第一窗内的峰位置,并且当鉴定的峰位置处的信号强度满足幅度标准时,将鉴定的峰位置添加到所述重复峰位置的组;并且使用所述重复峰位置的组和相应片段大小的组评估重复峰位置和重复片段大小之间的线性关系。8.产生外部大小测定标准品的方法,其包括:鉴定对应于具有已知片段大小的产物梯的通道中的峰,所述峰超出局部噪音阈值;使用第一组片段大小和第一组相应的峰位置,使用所述通道的第一区域中鉴定的峰,迭代地再评估峰位置和片段大小之间的线性关系,所述迭代再评估包括:将逐渐更小的片段大小纳入所述第一组片段大小中,并且将对应于逐渐更小的片段大小的峰位置纳入所述第一组相应的峰位置中;使用第二组片段大小和第二组相应的峰位置,使用所述通道的第二区域中鉴定的峰,评估所述通道的第二区域的峰位置和片段大小之间的非线性关系;通过组合所述线性关系和所述非线性关系产生外部大小测定标准品,用于对核酸样品的重复区测定大小。9.用于基因型峰大小测定的方法,其包括:从背景模型产生动态阈值,产生包括分段放缩所述背景模型以获得所述动态阈值;使用所述动态阈值测定基因特异性产物峰位置;使用大小测定标准品将重复大小与所述基因特异性产物峰位置相关联;并且输出基因特异性产物大小的指标。10.用于产生大小测定标准品的方法,其包括:鉴定数据文件的通道中的峰;接收预测的大小测定标准品;测定使依赖于所述预测大小测定标准品的代价函数最小化的大小测定标准品,包括:选择鉴定峰的亚组;对于所述鉴定峰的亚组计算大小测定标准品;使用所述鉴定峰的亚组的大小测定标准品计算代价函数;鉴定使所述代价函数最小化的所述鉴定峰的亚组的大小测定模型之一;并且将所述使代价函数最小化的鉴定峰的亚组的大小测定模型之一指定为用于对至少一个基因特异性峰测定大小的大小测定标准品。11.权利要求10的方法,其中所述通道对应于扩增产物梯,并且用于对至少一个基因特异性峰测定大小的大小测定标准品包括内部标准品。12.权利要求10的方法,其中所述通道对应于具有已知片段大小的产物的梯,并且所述用于对至少一个基因特异性峰测定大小的大小测定标准品包含外部标准品。13.权利要求4或9的方法,其中所述重复概况包括重复信号开始和重复数目。14.权利要求4或9的方法,其中所述重复概况包括扩增产物位置。15.权利要求1-14中任一项的方法,其中所述重复区是富含C/G的区域。16.权利要求1-14中任一项的方法,其中所述重复区是富含A/T的重复区段。17.权利要求1-14中任一项的方法,其中所述重复区是同聚物区段。18.权利要求1-17中任一项的方法,其中所述扩增包括聚合酶链式反应。19.权利要求1-18中任一项的方法,其还包括至少第一引物和第二不同引物以扩增所述重复区。20.权利要求19的方法,其中所述第一引物包含所述重复区的部分。21.权利要求19的方法,其中所述第二引物与所述重复区外部的位置退火。22.权利要求1-21中任一项的方法,其还包括使用所述扩增产物梯以对所述核酸样品的第二区域测定大小。23.权利要求1-21中任一项的方法,其中使用所述梯来对所述重复区外部的核酸区域测定大小。24.权利要求19-22中任一项的方法,其还包括第三引物和任选的第四引物。25.权利要求1-24中任一项的方法,其中扩增第二核酸区域。26.权利要求1-25中任一项的方法,其中扩增第二和第三核酸区域。27.权利要求24或25的方法,其中所述第二核酸和任选地所述第三核酸是重复区。28.权利要求1-21中任一项的方法,其中所述高分辨率片段分析区分长度相差3个碱基对或更少的扩增产物。29.权利要求1-21中任一项的方法,其中所述高分辨率片段分析区分长度相差单碱基对的扩增产物。30.权利要求1-28中任一项的方法,其中所述扩增产物梯包含重复元件周期性、第一扩增产物、扩增产物计数、和恒定元件长度。31.权利要求30的方法,其还包括从所述重复元件周期性、第一扩增产物和扩增产物计数测定所述重复区的大小。32.权利要求31的方法,其还包括从所述恒定元件长度测定所述重复区的大小。33.权利要求31至32中任一项的方法,其还包括基于局部区域内的峰形状、峰幅度、和峰的周期性中的至少一项,选择所述重复区的峰以产生大小测定标准品。34.权利要求30的方法,其还包括使用基于频率的分析测定所述重复元件大小。35.权利要求1-34中任一项的方法,其还包括测定所述扩增产物梯中每个扩增产物的大小。36.权利要求1-35中任一项的方法,其还包括说明所述重复区中的已知序列中断。37.权利要求1-36中任一项的方法,其还包括校正信号伪像。38.权利要求1-37中任一项的方法,其中使用所述梯来对超过中断元件的核酸区域测定大小。39.权利要求1-37中任一项的方法,其还包括测定标准大小曲线。40.权利要求1-39中任一项的方法,其中所述扩增产物梯是内部标准品。41.权利要求1-40中任一项的方法,其中相对于所述扩增产物梯标准化所述重复区高分辨率片段分析迁移率以对所述重复区内或外部的扩增产物测定大小。42.权利要求1-41中任一项的方法,其还包括提供患者样品,所述患者样品含有包含所述重复区的核酸。43.权利要求1-42中任一项的方法,其还包括产生重建基因型。44.权利要求43的方法,其还包括测定与所述区域中的任何中断的正向方向上的距离或者与所述至少一个重复区中的任何中断的反向方向上的距离和所述区域的总长度以产生包含所述区域中的所述中断的所有可能排列的潜在基因型的组;并且评估所述潜在基因型的组以测定满足所有参数信息的解析基因型。45.权利要求1-44中任一项的方法,其中所述重复区是由SCA1、SCA2、SCA3、CACNA1A、SCA7、SCA8、X25、CSTB、C9ORF72、DMPK、ZNF9、HTT、AR、ATN1、ATXN1-3、ATXN7、ATXN10、CACNA1A、SCA8、PPP2R2B、CNBP、TBP和TOMM40遗传基因座或其片段包含的。46.权利要求45的方法,其中所述重复区是由FMR1或FMR2遗传基因座或其片段包含的。47.权利要求1-46中任一项的方法,其还包括检测患者中与FMR1或FMR2病症相关的基因型,或者检测所述患者后代中FMR1或FMR2病症的风险。48.权利要求47的方法,其中所述FMR1或FMR2病症是脆性X综合征(FXS)、脆性X综合征E(FRAXE)、脆性X相关震颤/共济失调综合征(FXTAS)、脆性X相关原发性卵巢功能不全(FXPOI)、或多巴胺响应性帕金森症。49.诊断患者中的病症或诊断所述患者的后代中的病症风险的方法,其包括:a)从包含重复区的患者样品扩增核酸的区域;b)进行高分辨率片段分析;c)获得扩增产物梯;并且d)使用扩增产物梯作为内部标准品来测定重复区长度,其中若检出扩充重复区,则诊断病症。50.权利要求49的方法,其中所述病症是脆性X综合征、脆性X(FRAXE)智力低下、脆性X相关震颤/共济失调综合征(FXTAS)、脆性X相关原发性卵巢功能不全(FXPOI)、脊髓小脑性共济失调1型、脊髓小脑性共济失调2型、脊髓小脑性共济失调3型、脊髓小脑性共济失调6型、脊髓小脑性共济失调7型、脊髓小脑性共济失调8型、弗里德赖希(Friedrich)氏共济失调、进行性肌阵挛性癫痫、强直性肌营养不良I、强直性肌营养不良II、亨廷顿氏病、脊髓延髓肌萎缩、齿状核红核苍白球丘脑下核萎缩、脊髓小脑性共济失调、肌萎缩侧索硬化(ALS)、额颞叶痴呆(FTD)和阿尔茨海默氏病。51.权利要求49的方法,其中所述病症是脆性X综合征或脆性X(FRAXE)智...

【专利技术属性】
技术研发人员:E布拉姆R施罗夫A哈德B普林蒂
申请(专利权)人:奥斯瑞根公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1