一种测序文库及其制备方法、一种末端测序方法和装置制造方法及图纸

技术编号:4089598 阅读:203 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于分子生物学领域,本发明专利技术属于分子生物学领域,涉及一种测序文库及其制备方法、一种末端测序方法和装置。具体地,所述制备测序文库的方法包括随机打断、末端修复、分离、环化、扩增的步骤。所述末端测序方法包括将根据制备测序文库的方法制得的测序文库进行测序的步骤,该测序方法特别适用于大片段DNA的高通量测序。本发明专利技术还涉及一种高通量末端测序装置,包括如下单元:1)随机打断单元,2)平端化修饰单元,3)分离单元,4)环化单元,5)PCR扩增单元,以及6)测序单元。本发明专利技术的末端测序方法克服了酶切的偏好性,能够得到更长的组装片段。

【技术实现步骤摘要】

本专利技术属于分子生物学领域,涉及一种测序文库及其制备方法、以及一种末端测 序方法和装置。所述末端测序方法和装置特别适用于高通量测序。
技术介绍
在基因组测序中,通常将基因组DNA克隆到载体中再进行测序。例如常用的载体 是Fosmid和细菌人工染色体(bacterial artificial chromosome,BAC),二者具有插入片 段大和稳定的特点,是基因组学研究重要工具。已知BAC通常可以插入100-200kb的片段, Fosmid通常可以插入大约40kb的片段,二者在基因图位克隆、基因分析、结构性变异和基 因组组装中有重要的作用。此外还有多种其它载体也应用在测序当中。第一代测序技术中通常要对含有待测DNA的载体克隆的末端进行测序,以构建 重叠克隆,然而由于克隆具有低拷贝的特点以及插入的大片段存在的二级结构,所以对 克隆进行末端测序比较困难,即使目前开发了自动化的设备(Kelley,J. Μ. et al. 1999. High throughout direct end sequencing of BAC clones. Nucleic Acids Res. 27 1539-1546),但是对于数十万的克隆来说,仍然显得费时费力。第二代测序技术(next generation sequencing, NGS)是高通量测序技术, 其对第一代测序技术进行了改进,采用S0LEXA、SOLID、和454测序平台等(Metzker ML Sequencing technologies-the nextgeneration. Nat Rev Genet.2010 Jan ;11 (1) 31-46)使高通量测序得到了迅速的发展。对于读长较小的一些测序平台(如illumina/solexa),测序后的拼接较为困难, 得到的scaffold的N50偏低,组装结果并不理想。在本专利技术中,术语“N50”为将所有的组 装得到的序列从大到小排列起来并按长度相加,当相加得到的长度为所有组装得到序列 总长的百分之五十时那条组装序列的长度,具体可以参考Miller et al. 2010. Assembly algorithms for next generation sequencing data. Genomics. 95(6) :315_327。为了克服组装的困难,需要对大片段的末端进行测序.W02010003316A1中公开了 一种方法,该方法合成了构建fosmid克隆的载体,在这些载体中存在的识别4碱基的内切 酶FspBI和Csp6I的酶切位点被突变,利用这两个内切酶对插入外源片段的fosmid克隆进 行酶切,回收目的酶切片段,环化之后,获得fosmid克隆的两个末端序列,可以利用第二代 测序仪进行双末端测序,但是这个方法会因为FspBI和Csp6I的酶切位点并不是完全平均 分布在基因组中,导致有一些含有特定区域的fosmid克隆的末端无法得到,并且不能对插 入更长片段的BAC进行末端测序。此外,该方法还需要针对酶切位点选择特定的载体或者 对现有载体进行改造,增加了方法的复杂性,由于没有载体通用性,也限制了该方法的大规 模推广。
技术实现思路
为了解决上述问题,本专利技术人进行了多方面的研究,终于获得了一种改良的高通4量末端测序方法,该方法没有酶切偏好性,对片段大小和载体类型并无特殊要求,无需对构 建克隆的载体进行改造和选择,并且能够得到更长的组装片段。本专利技术还提供了相应的高 通量测序装置。具体地,本专利技术的末端测序方法采用随机打断的方式对载体(例如BAC或者 Fosmid)克隆的质粒DNA进行片段化,选择目的片段,环化之后,通过扩增的方式获得含有 双末端的片段,利用高通量测序技术对获得的片段测序,得到目的片段的双末端序列。由此 提供了下述专利技术本专利技术的一个方面涉及一种制备测序文库的方法,包括下述步骤1)随机打断将插入有待测DNA的载体进行随机打断处理,得到随机打断片段 (图 1);2)末端修复将步骤1)中得到的随机打断片段进行末端修复,使末端平端化;3)分离将步骤2)中的末端修复后的随机打断片段进行分离,得到大于载体长度 50bp至SOObp的随机打断片段(图1);4)环化将步骤3)中分离得到的随机打断片段进行自身连接,形成环形分子(图 2),然后清除未自身连接的片段;5)扩增根据载体序列设计引物,扩增环形分子中的待测DNA的片段(图2),得到 扩增产物,即为测序文库。可选地,一种制备测序文库的方法,包括下述步骤A.随机打断将插入有待测DNA的载体进行随机打断处理,得到随机打断片段 (图 1);B.分离将步骤A中的随机打断片段进行分离,得到大于载体长度50bp至SOObp 的随机打断片段(图1);C.末端修复将步骤B中分离得到的随机打断片段进行末端修复,使末端平端 化;D.环化将步骤C中末端修复的随机打断片段进行自身连接,形成环形分子(图 2),然后清除未自身连接的片段;E.扩增根据载体序列设计引物,扩增环形分子中的待测DNA的片段(图2),得到 扩增产物,即为测序文库。 上述制备测序文库的方法中,关于步骤1)或步骤A,所述载体是质粒。具体地,所述质粒是fosmid质粒、BAC质 粒或Cosmid质粒等。所述随机打断处理是雾化、超声、或者HydroShear法。优选地,采用 HydroShear法,当含有核酸片段的溶液通过较小面积的通道时,流体加速,产生的力使核酸 片段突然断裂,流速和通道大小决定核酸片段的大小。可以通过参数设置,使得随机打断片 段处于大于载体长度几十bp到数百bp的范围内。可以设置仪器的参数,使随机打断片段 长度大于载体的长度,优选地,使随机打断片段长度处于大于载体长度50bp至SOObp (例如 载体大小为8. 2kb,则将质粒DNA打断为8. 25-9. Okb)的范围内,更优选地,使随机打断片段 处于大于载体长度200bp至800bp的范围内。在本专利技术的一个实施方案中,还包括在进行步骤1)或步骤A中的所述随机打断处 理之前,选择载体上不存在酶切位点的核酸限制性内切酶进行酶切处理的步骤,优选识别6碱基的核酸限制性内切酶。例如利用pCC2F0S Vector (Epicentre, USA)得到的fosmid克 隆,可以使用Xhol、或ClaI等核酸限制性内切酶。关于步骤2)或步骤C,所述末端修复可以使用如下的酶Klenow酶、T4聚合酶、或 T4多核苷酸激酶。关于步骤3)或步骤B,所述分离采用凝胶电泳法(图1)或梯度沉降法,优选地, 采用凝胶电泳法。可选地,对分离得到的片段进行大小和浓度的测定,例如可以使用安捷伦 2100生物芯片分析仪。优选地,步骤3)中分离得到的随机打断片段是大于载体长度200bp 至800bp的随机打断片段。关于步骤4)或步骤D,所述自身连接可以采用本领域已知的方法进行,例如使 用T4连接酶进行连接。环化体系中核酸片段的浓度不高于2ng/yl,防止不同的核酸片 段彼此连接并环化成一个大环。未连接的片段化核酸需要被清除,可采用已知的消化线性 核酸的方法进行,例如使用不降解质粒的ATP依赖DNA酶(Plasmid-Safe ATP-dependent DNase)、外本文档来自技高网
...

【技术保护点】
一种制备测序文库的方法,包括下述步骤:  1)随机打断:将插入有待测DNA的载体进行随机打断处理,得到随机打断片段;  2)末端修复:将步骤1)中得到的随机打断片段进行末端修复,使末端平端化;  3)分离:将步骤2)中的末端修复后的随机打断片段进行分离,得到大于载体长度50bp至800bp的随机打断片段;  4)环化:将步骤3)中分离得到的随机打断片段进行自身连接,形成环形分子,然后清除未自身连接的片段;  5)扩增:根据载体序列设计引物,扩增环形分子中的待测DNA的片段,得到扩增产物,即为测序文库。

【技术特征摘要】

【专利技术属性】
技术研发人员:韩长磊徐讯
申请(专利权)人:深圳华大基因科技有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利