新基因组测序策略制造技术

技术编号:7127182 阅读:635 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种测定基因组序列的方法,包括步骤:通过对BAC克隆池的片段末端进行测序,提供样品基因组的物理图;提供一组来自样品基因组的序列读数,产生物理图谱和序列读数的重叠群。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及从头全基因组测序的有效方法。本专利技术涉及大规模核酸测序,特别是对生物的基因组或或其中一部分测序的方法。本专利技术涉及基于高通量测序技术测定优选复杂(即大)基因组的序列的改良策略。
技术介绍
许多测序设计的目的是首次测定目标生物的完整基因组(从头基因组草图测序)。拥有基因组序列草图能鉴定生物的有用遗传信息,例如鉴定异种或同种不同个体之间基因改变的起源。因此,本领域对于能够以合理成本和精力从头测定个体(无论是人、动物或植物)完整基因组序列的技术有广泛的需求。这个目标通常表现为1000$-基因组,即最高耗费1000$来测定个体完整基因组序列(不考虑货币波动)。然而,实践中1000$基因组并不必定依赖于从头基因组测序和组装策略,也可基于重测序法。后一种情况下,重测序的基因组并不从头组装,但其测序得到的DNA与现存的感兴趣生物的参考基因组序列比较 (或作图)。因此,重测序法技术上挑战较小,花费较少。为了清楚起见,本专利技术集中于从头基因组测序策略,其能用于缺乏参考基因组序列的生物。目前的尝试各种各样,获得了多种多样和迅速增加的结果。但是,目标还未实现。 以直截了当的方式对完整基因组测序和组装仍然在经济上并不可行。本领域仍然存在对于改良从头基因组测序策略的需要。W003/027311描述了一种克隆阵聚集鸟枪测序法(CAPPS)。该方法使用来自不同 (BAC)克隆池的随机序列读数。基于该随机读数的交叉组装,可从多个克隆产生序列重叠群,并可产生相对于序列的克隆的图。该出版物更详细描述了在多维收集池,例如两维形式中BAC文库的产生,该两维形式是每个池和列含有148个BAC克隆(148x148形式)。使用 CAPPS,以平均4-5X覆盖率对BAC池进行测序,在两维合并聚集方案中产生每BAC 8-10X覆盖率。在两维聚集方案中,基于在单独一列和单独池中出现的对BAC独特的序列,对每个 BAC分别产生重叠群。然后,将这些BAC组装成基因组的重叠群。出版物仅基于5个BAC演示了该技术。该出版物未提及数据加工的问题。然而该技术的缺点之一是,使用随机剪切的片段需要大量读数,来以8-10倍的序列冗余水平覆盖基因组,使得该方法在大规模下非常耗力。另外,其不产生基于序列的物理BAC图。US2007/0082358描述了一种从头组装序列信息的方法,该方法基于克隆分离和扩增的单链基因组DNA文库,使用产生有序限制性图的限制性酶,结合全基因组光学限制性作图产生完整基因组鸟枪序列信息。US2002/0182630公开了一种通过比较亚序列的BAC重叠群作图法。该方法旨在避免与重复序列有关的困难,以及通过在重复富集的区域产生桥来生成重叠群。以BAC为基础测定物理图谱可基于BAC文库测序(基于序列的BAC克隆物理图谱),使用例如Keygene在W02008/007951中描述的方法(也称作“全基因组作图”或WGP)。 简单说,WGP涉及产生至少一部分基因组的物理图谱,包括步骤从样品DNA产生人工染色体文库,聚集克隆,用限制性酶消化聚集的克隆,连接含标识物的接头,扩增连接有含标识物的接头的限制性片段,将克隆的扩增子与克隆相联并排序片段,以产生重叠群,从而建立物理图谱。虽然在高通量测序中有许多发展,高精确测定基因组序列草图仍然被认为是昂贵和耗时的。现有方法仍需要补充,以形成产生基因组序列草图的有效且经济的方法。?特别是,目前的高通量测序技术提供了相对较短读数(直到400nt),产生的较短重叠群难以组装成更大重叠群,并对计算能力提出高要求。专利技术概述本专利技术人发现,将基于克隆的基因组作图与使用高通量测序技术的样品(基因组)DNA的(高通量)测序结合起来,为高效迅速测定基因组序列草图提供了卓越的策略。 通过从测序读数产生重叠群,并将这些读数锚定在全基因组作图所得的BAC (或YAC或任何其它大插入克隆载体)_重叠群中,产生长度和密度都有所提高的重叠群。因此,获得了一种基因组序列草图,其通过较少的重叠群生成,从而提高了其质量。^JL群聚术语“群聚”意味着在相同或相似核苷酸的短或长区段的存在下,比较两个或多个核苷酸序列,并基于相同或类似序列的短(或长)区段将具有某最小水平序列同源性的序列集合在一起。比对将多个序列以表格形式放置,以尽可能,例如通过引入缺口获得比对中不同序列之间的相同序列区域。本领域中已知几种核苷酸序列的比对方法,在下文中进一步详述。AFLP =AFLP指一种选择性扩增核酸的方法,该方法基于用一种或多种限制性内切核酸酶消化核酸,产生限制性片段,将接头与限制性片段连接,用引物扩增连有接头的限制性片段,至少一种引物(部分)与接头互补,(部分)与剩余限制性内切核酸酶互补,且还在引物3’末端含有至少一种随机选自A、T、C、或G(或在有些情况下是U)的核苷酸。AFLP 不需要任何现有序列信息,可在任何起始DNA上进行。一般,AFLP包括以下步骤(a)用一种或多种特异性限制性内切核酸酶消化核酸(特定是DNA或cDNA),使得 DNA片段成为一系列对应的限制性片段;(b)将如此获得的限制性片段与双链合成寡核苷酸接头连接,其一端与限制性片段的一端或两端相容,从而产生连有接头的起始DNA的限制性片段;(c)使连有接头的限制性片段在杂交条件下与一种或多种寡核苷酸引物接触,该引物被定向到接头,且可在其3’末端包含选择性核苷酸;(d)通过PCR或相似技术扩增与引物杂交的连有接头的限制性片段,从而使杂交的引物沿着与引物杂交的起始DNA的限制性片段延伸;(e)检测、鉴定或回收由此获得的扩增或延伸的DNA。AFLP因此提供了连有接头的片段的可重复亚组。AFLP如EP 534858,US 6045994 和Vos等1995所述。AFLP:—种DNA指纹分析的新技术。核酸研究(Nucleic Acids Research) 23 (21) :4407_4414。引用这些出版物进一步详细描述了 AFLP。AFLP通常作为有效、强大和可重复的复杂度减少的技术使用。选择性碱基或选择性核苷酸位于引物3’末端,引物的一部分与接头互补且一部分与剩余限制性位点互补,选择性碱基随机选自A,C,T或G(或可能的情况下为U)。通过用选择性碱基延伸引物,随后的扩增仅仅得到连有接头的限制性片段的可重复亚组,即仅用携带选择性碱基的引物能扩增出的片段。可在引物3’端加入1-10个选择性核苷酸。一般,1-4个足够。两种引物都可含有不同数量的选择性碱基。每加入一个选择性碱基,亚组中扩增的连有接头的限制性片段数量就减少约4倍。通常,用于AFLP的选择性碱基的数目以+N+M表示,其中一个引物携带N个选择性核苷酸,另一个引物携带M个选择性核苷酸。因此,EcoRI/MseI+l/+2AFLP是用EcoRI和MseI消化起始DNA,连接合适的接头,并用引物扩增,一种引物针对EcoRI限制性位点,携带1个选择性碱基,另一种引物针对MseI限制性位点,携带2个选择性核苷酸。用于AFLP的在3’末端携带至少一种选择性核苷酸的引物也被称作AFLP-引物。在3’末端不携带选择性核苷酸,实际上与接头和剩余限制性位点互补的引物有时被称作AFLP+0引物。术语选择性核苷酸也被用于目标序列的核苷酸,这些核苷酸位于接头区域附近本文档来自技高网...

【技术保护点】
1.一种测定基因组序列的方法,包括步骤:-通过对人工染色体克隆池片段末端进行测序,提供样品基因组的物理图谱;-提供一组来自样品基因组的序列读数;-产生物理图谱和序列读数的重叠群,建立基因组序列。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:M·J·T·范艾杰克
申请(专利权)人:关键基因股份有限公司
类型:发明
国别省市:NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1