改进的测序文库及其制备和应用制造技术

技术编号:13053464 阅读:79 留言:0更新日期:2016-03-23 17:17
本发明专利技术提供一种测序文库,所述测序文库中的插入片段是待测序列与标签序列同向交替串联体,所述待测序列与标签序列同向交替串联体的制备包括将所述待测序列连接所述标签序列,单链环化和滚环复制的步骤,所述滚环复制在被油滴包裹的反应液内完成。本发明专利技术还提供该测序文库的制备方法及一种测序方法。本发明专利技术提供的测序文库及测序方法,在任何测序深度下,都能有效去除DNA扩增错误和测序错误,从而超精确检测DNA分子上存在的突变。本发明专利技术提供的测序文库,适用于微量DNA短片段甚至单链DNA测序文库的构建。

【技术实现步骤摘要】

本专利技术涉及一种测序文库及其制备和应用。
技术介绍
第二代测序技术的发展,推动了生物学以及生物医学研究的革命性发展。但是由 于高通量测序本身的特点,在测得的序列中存在约1%的碱基错误。虽然在一些应用中1% 的错误率是可以忍受的,但是在很多情况下,这1 %的错误却掩盖了很多真实的信息,而成 为很多研究的障碍。构建一种能够快速、有效、准确地构建DNA测序文库的方法是十分必要 的。 专利技术人在先专利技术的一种测序文库,如201310651462. 5号专利申请文件所示,解决 了现有技术存在的上述问题,但是,由于滚环扩增具有极大的序列偏好性,以至于个别环状 DNA扩增倍数极大,而绝大多数环扩增的倍数很低,在后续的测序过程中,很难实现对整个 基因组的全面的有效的检测。如何有效的均衡的扩增环状DNA分子,就成为一个非常关键 的,亟待解决的问题。
技术实现思路
为了解决现有技术中环化后的DNA分子不能有效均衡扩增的问题,本专利技术实施例 提供一种。 本专利技术的一个方面,涉及一种核酸序列滚环复制油包水反应体系,所述反应体系 中,扩增反应液包裹在油滴内,所述油滴体积小于1000PL。 本专利技术另一方面,涉及一种测序文库,所述测序文库中的插入片段是待测序列与 标签序列同向交替串联体,所述待测序列与标签序列同向交替串联体的制备包括将所述待 测序列连接所述标签序列,单链环化和滚环复制的步骤,所述滚环复制在被油滴包裹的反 应液内完成。 本专利技术的第三方面,涉及一种核酸序列滚环复制方法,所述方法包括将反应液包 裹到油滴内的步骤,所述油滴体积小于1000pL。 本专利技术的第四方面,涉及一种制备测序文库的方法,所述方法包括制备在待测序 列与标签序列同向交替串联体的两端连接测序接头的核酸序列,所述待测序列与标签序列 同向交替串联体的制备包括将所述待测序列连接标签序列,单链环化和滚环复制的步骤, 所述滚环复制包括将反应液包裹到油滴内进行滚环复制的步骤。 本专利技术的第五方面,涉及上述测序文库在目标片段捕获测序、单链DNA片段测序、 化石DNA测序或外周血游离DNA测序中的应用。 本专利技术的第六方面,涉及一种测序方法,该方法所用测序文库的插入片段是待测 序列与标签序列同向交替串联体,所述待测序列与标签序列同向交替串联体的制备包括将 所述待测序列连接所述标签序列,单链环化和滚环复制的步骤,所述滚环复制在油滴包裹 的反应液中进行。 本专利技术提供的测序文库及其应用,至少实现了如下有益效果: 1、在任何测序深度下,都能有效去除DNA扩增错误和测序错误,从而超精确检测 DNA分子上存在的突变。 通过连接标签序列到待测序的DNA小片段5'末端(总长度小于测序长度的一 半),然后对这种嵌合体变性,得到单链的待测序列与标签序列连接片段DNA,再进行单链 环化,而后对环化后的单链DNA进行滚环复制,构建待测序列与标签序列同向交替串联体 序列。这些滚环复制所得到的重复单元之间,在扩增过程是相互独立的,因此,在各自单元 上复制时所产生的错误也是独立的。以待测序列与标签序列同向交替串联体序列进行测序 文库构建(文库插入片段大小为至少两个重复单元)。对该文库进行一次测序,则至少测了 两次同向重复单元,将两次重复单元测得的序列进行相互确认,两次重复单元不一致的碱 基,即是文库制备过程中或测序过程中产生的聚合酶链式反应错误或测序错误。一致的序 列即是原始序列。由于测序的重复单元来自于环状DNA,需要利用标签序列来确定待测序列 的起始。 一条单链DNA和它的互补链,经过扩增后就无法确定新复制的DNA来自于哪条链, 这对识别碱基错误类型造成影响。例如,C突变为T和G突变为A,这两种类型的错误在双 链DNA上是互补的,测序序列没有标记的话,就无法判断到底发生了C突变为T还是G突变 为A。由于标签序列是非回文结构,并连接在单链DNA的5'端,经过复制扩增后,仍然可以 根据标签序列的方向来确定出原始单链DNA,这样就可以识别出错误发生的类型,进而帮助 识别低频突变。 由于DNA扩增的不平衡性,从少量DNA扩增到足够测序的DNA时会出现一部分DNA 的拷贝数明显高于均值。在本专利技术中体现为:一个原始单链DNA滚环复制得到的多条测序 序列共同反映同一条原始DNA的信息,存在测序冗余。但是在后续的数据处理中,由于没有 任何信息来判断这些测序序列是否来自于同一个原始DNA单链环,这些测序序列可能被多 次统计。由此会带来一种错误放大的效应:一个存在DNA损伤的单链滚环复制后,存在于多 条测序序列中,被统计为可信的多次独立出现的DNA变异。识别出这种冗余将有助于排除 上述错误。本专利技术的标签序列可包括两个部分:已知碱基组成的接头区和随机碱基的自由 区。接头区为6至13个连续的碱基,自由区为1至13个连续的碱基。特别指出的是自由 区的碱基组成是随机的,在核酸序列合成时涉及为相应长度的'Ν'(随机碱基)。自由区的 长度越长,区分的分辨率越高。如果自由区长度设计为零时,区分不同原始来源的测序序列 仅依赖于1)从测序序列推断出的目标DNA片段的大小不同,2)推断出的目标DNA片段的序 列组成不同。设计标签序列的总长为奇数,可有效避免形成回文结构。 以下使用测序错误率为1/100(二代测序的错误率是1/100至1/1000)来阐明本 专利技术的原理。一条一致序列上两个重复单元的同一位点同时发生一种类型错误的概率是: 1/3* (1/100)2,即3*10 5的错误率(更多的重复单元一致碱基的错误概率更低)。那么两条 不同的一致序列出现同样错误的概率为:(1/3*(1/100) 2)2即9*10'因此,该方法极其有 效的去除了文库构建过程和测序过程中产生的错误,达到了精确测序的目的。 2、适用于微量DNA短片段甚至单链DNA测序文库的构建。 由于单链环化所需的DNA起始量小(纳克级别甚至更低),片段短(30-200碱基 对),环化后扩增效率高。因此特别适用于外周血游离DNA和古化石等降解严重的DNA的测 序文库构建。 3、能够兼容目标区域捕获(如:外显子捕获,目的基因捕获)等方法。 本专利技术提供的待测序列与标签序列同向交替串联体序列中,由原始DNA复制的不 同拷贝是串联在一起的。在进行目标区域捕获时,探针捕获到的分子至少含有两个同向重 复单元的核酸序列,能够精确的测定DNA序列。 4、该方法构建的待测序列与标签序列同向交替串联体序列可用于构建多种第二 代短片段测序文库,使其适用于各种测序平台。 5、通过将环化后的DNA片段和扩增反应液包裹在体积为皮升(pL)大小的油滴内, 让尽量少的环化分子(一个或多个)分布于单个油滴里面,从而有效地提高了滚环扩增时 的均衡性。【具体实施方式】 下面结合具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好的 理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。 专利技术概述 本专利技术的创新点之一在于,通过对短片段DNA分子连接标签序列(两者的总长度 小于测序仪测序长度的一半),单链环化,滚环复制,得到待测序列与标签序列同向交替串 联体序列,构建测序文库并测序。具体来讲,可以采用如下两种方案来实现。方案一: 首先将DNA随机打断成小于二代测序仪测序读长一半的片段(打断后本文档来自技高网...

【技术保护点】
核酸序列滚环复制油包水反应体系,其特征在于,所述反应体系中,扩增反应液包裹在油滴内,所述油滴体积小于1000pL。

【技术特征摘要】

【专利技术属性】
技术研发人员:王开乐阮珏吕雪梅吴仲义
申请(专利权)人:中国科学院北京基因组研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1