提高下一代测序建库成功率的方法和系统技术方案

技术编号:23838464 阅读:40 留言:0更新日期:2020-04-18 03:34
本发明专利技术一方面提供了一种提高二代测序建库成功率的方法,其包括以下步骤:1)使包含分子标签的接头与单链模板接触,得到连接产物;2)使扩库引物和所述连接产物接触,得到建库产物。其中所述接头与单链模板的连接是单链单端连接,所述分子标签中的每一个包含非连续的随机序列,所述随机序列被固定序列所间隔。本发明专利技术另一方面提供了一种提高二代测序建库成功率的系统,其包括适用于本发明专利技术第一方面提供的固定序列与随机序列相间隔的寡核苷酸接头。本发明专利技术提供的用于提高二代建库成功率的方法和系统,设计独特,成本可控,应用场景明确,性能稳定,对于单链单端连接的二代建库,实现了相同成本条件下远超现有技术的效果,具有广泛的应用前景及推广价值。

Methods and systems to improve the success rate of next generation sequencing

【技术实现步骤摘要】
提高下一代测序建库成功率的方法和系统
本专利技术涉及分子生物学领域,具体涉及一种提高下一代测序建库成功率的方法及系统。
技术介绍
下一代测序技术NGS诞生于上世纪90年代,进入市场也已满十多年。这一技术能够实现同时对成千上万的待检测DNA模板分子进行测序,加大了测序反应的效率与通量,并正在提供越来越高的测序速度,允许更大的测序深度。然而,由于测序精确度和灵敏度受到各种来源如样品缺陷、扩库阶段的PCR、和测序的噪声和误差的影响,单独增加测序的深度不能确保检测到频率非常低的等位基因序列,如血浆中的游离DNA(cfDNA)序列、循环肿瘤DNA(ctDNA)序列、外源微生物亚克隆突变中的序列等。基于抑制由于各种误差来源所致的测序不准确的情况下测定少量和/或低等位基因频率的DNA分子序列的需求,越来越多的NGS业者选择使用独特分子标识(UMI)来测定降低背景噪声和纠正测序错误。现有NGS技术中,UMI主流的应用方法是将6-10个连续随机碱基的序列作为分子标签嵌入待测序片段两端的接头序列中。然而,在单链连接后扩库的情景模式下,由于接头数量巨大,总会有相当数量的随机序列与扩库引物形成较高程度的甚至完全配对,形成PCR反应,产生大量非目标PCR产物,影响建库成功率。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术一方面提供一种提高下一代测序建库成功率的方法。其包括以下步骤:1)使包含分子标签的接头与单链模板接触,得到连接产物;2)使扩库引物和所述连接产物接触,得到建库产物;其特征在于,所述接头与单链模板的连接是单链单端连接,所述分子标签中的每一个包含非连续的随机序列。本专利技术另一方面提供一种提高下一代测序建库成功率的系统,其包括适用于本专利技术第一方面提供的用于提高下一代测序建库成功率的方法的寡核苷酸接头。具体实施方式本申请人经过大量探索性研究,提供了一种提高下一代测序建库成功率的方法,所述方法设计简单、性能卓越,尤其对于单链单端连接建库的下一代测序样本具有良好的建库效果,在此基础上完成了本专利技术。本专利技术一方面涉及一种提高下一代测序建库成功率的方法。其包括以下步骤:1)使包含分子标签的接头与单链模板接触,得到连接产物;2)使扩库引物和所述连接产物接触,得到建库产物;其中所述接头与单链模板的连接是单链单端连接,所述分子标签中的每一个包含非连续的随机序列。本专利技术所提供的提高下一代测序建库成功率的方法中,用于单链连接的所述接头为复数个,所述分子标签相应也为复数个,其中每个分子标签是能用于鉴定所述样品中单链DNA片段的单独分子的寡核苷酸序列。每个分子标签包含随机序列,所述随机序列是间断的,非连续的。本专利技术所述的分子标签还包括固定序列,对应复数个接头或分子标签,所述固定序列相应也为复数个。对于单个接头的单个分子标签,随机序列与固定序列互为间隔。所述随机序列的段数是复数个,至少为两段;所述固定序列的段数是单数或复数个,至少为一段。在本专利技术的一些实施方案中,每个固定序列包含的碱基数是1-4个,最少可以是1个碱基,最多可以是4个。这里并不是说多于4个碱基的单段固定序列不可用于本专利技术所提供的分子标签,而是本申请人经过大量实验发现,用单段多于4个碱基的固定序列来间隔随机序列所构造的分子标签并不能起到比使用单段1-4个碱基的固定序列来间隔随机序列所构造的分子标签更优的鉴定单独分子的效果,反而可能导致分子标签序列过长而提升成本,故而缺乏临床应用价值。在本专利技术的一些实施方案中,当分子标签中被随机序列所间隔的相邻两段固定序列所包含的碱基数都是1个时,该相邻的两段固定序列包含的碱基互不相同;这既是说,被随机序列相间隔的两段单个碱基的固定序列不可以皆为A,或者T、C、G。比如说,被随机序列NN所间隔的固定序列不会在分子标签中形成ANNANN这样的序列。这是因为,本申请人经大量实验发现,当分子标签中被随机序列相间隔的两个单碱基的固定序列相同时,并不能够比连续随机序列的分子标签具有更优的鉴定单独分子的效果。在本专利技术的一些实施方案中,当所用分子标签中的单段固定序列包含的碱基数是2-4个时,所述单段固定序列不是四种碱基中单种碱基的重复;比如说,一段长度为2的固定序列不可以是AA,一段长度为4的固定序列不可以是CCCC。这是因为,本申请人经实验发现,当分子标签中单段固定序列是四种碱基中单种碱基的重复时,比如单段固定序列是AA、TTT、或者CCCC时,并不能够比连续随机序列的分子标签具有更优的鉴定单独分子的效果。在本专利技术的一些实施方案中,被随机序列所间隔的固定序列在分子标签中出现的频率是1-7次。一般而言,单段固定序列的碱基数越少,固定序列在分子标签中出现的频率越高。比如说,当接头所用分子标签中的单段固定序列所包含的碱基数都只有1个时,相比单段包含的碱基数为2-4个的固定序列,其在本专利技术所提供的接头的分子标签中出现7次的频率更高;当接头所用分子标签中的固定序列所包含的碱基数有4个时,其在分子标签中出现的频率可能只有1-2次,这是为了在保证区分单独分子效果的前提下使分子标签序列不会过于冗长,引致成本明显增高和其它问题。在本专利技术的一些实施方案中,用于间隔固定序列的每段所述随机序列包含的碱基数同样是1-4个,且所述随机序列的碱基总数为8-12。同理固定序列的设置规则,单段随机序列包含的碱基数越少,其在分子标签中可能出现的频率越高,反之亦然,但随机序列的碱基总数不超过现有技术中常用的连续随机序列8-12的范围。本申请人经过大量实验发现,被1-7段单段长度为1-4个碱基的固定序列所间隔的总长为8-12个碱基的随机序列,能最大程度的降低建库过程中接头的背景值,达到既能高效鉴定原始样本中的单独分子,又不使合成本专利技术所提供的分子标签比连续随机序列构成的分子标签成本明显上升的目的。在本专利技术的一些实施方案中,所述步骤1)中包含分子标签的接头与所述步骤2)中扩库引物3’端最后十个碱基中的连续配对不超过8个,进一步确保本专利技术使用固定序列来间隔分子标签中随机序列的接头的性能。如使用8-10个连续随机序列作为接头的分子标签,接头与扩库引物3’端连续8个碱基形成配对过于容易,导致形成大量接头-引物二聚体,大幅升高建库背景,进而降低建库效率或更严重的情况下,直接导致建库失败。由于扩库引物的作用是扩增步骤1)得到的连接产物供测序之用,其序列已由各测序平台所限定,几乎不容改动,则为了避免与扩库引物形成二聚体阻碍建库,本申请人的解决方案是精密设计接头序列,使其不仅能满足单链单端连接条件下能够鉴定样本中单独分子的要求,而且尽量不与扩库引物的3’端形成配对,最大程度的避免形成引物二聚体,确保建库成功率。在本专利技术的一些实施方案中,为了检验初步设计了分子标签的接头在扩库阶段的可行性,还包括使用步骤2)中的扩库引物对所述接头进行背景检测。当所述接头的背景值低于阈值时,所述包含分子标签的接头被选用;当所述接头的背景高于阈值时,所述包含分子标签的接头被弃用。其中对于所述阈值的设定,至少低于包本文档来自技高网...

【技术保护点】
1.一种提高下一代测序建库成功率的方法,其包括以下步骤:/n1)使包含分子标签的接头与单链模板接触,得到连接产物;/n2)使扩库引物和所述连接产物接触,得到建库产物;/n其特征在于,所述接头与单链模板的连接是单链单端连接,所述分子标签中的每一个包含非连续的随机序列。/n

【技术特征摘要】
1.一种提高下一代测序建库成功率的方法,其包括以下步骤:
1)使包含分子标签的接头与单链模板接触,得到连接产物;
2)使扩库引物和所述连接产物接触,得到建库产物;
其特征在于,所述接头与单链模板的连接是单链单端连接,所述分子标签中的每一个包含非连续的随机序列。


2.如权利要求1所述的提高下一代测序建库成功率的方法,其特征在于,
所述分子标签还包含固定序列;
所述随机序列与所述固定序列互为间隔;
单个所述分子标签中包含的固定序列至少是一段。


3.如权利要求2所述的提高下一代测序建库成功率的方法,其特征在于,
单段所述固定序列包含的碱基数是1-4个;
优选的,当被随机序列所间隔的相邻两段固定序列的碱基数都是1个时,所述相邻的固定碱基不相同;
和/或,当单段所述固定序列包含的碱基数是2-4个时,所述固定序列不是四种碱基中单种碱基的重复;
优选的,所述固定序列在单个所述分子标签中出现的频率是1-7次。


4.如权利要求2所述的提高下一代测序建库成功率的方法,其特征在于,
单段所述随机序列包含的碱基数是1-4个,且所述随机序列的碱基总数为8-12;
和/或,所述包含分子标签的接头与步骤...

【专利技术属性】
技术研发人员:郭志伟李英辉陈倩胡荣君
申请(专利权)人:上海臻迪基因科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1