双端文库标签组合物及其在MGI测序平台中的应用制造技术

技术编号:26300300 阅读:18 留言:0更新日期:2020-11-10 19:49
本发明专利技术提供了一种双端标签扩增引物组合物及其在MGI测序平台中的应用。其中,该双端文库标签组合物包括:多个5’端的文库标签和多个3’端的文库标签,多个的5’端的文库标签长度均相同,多个3’端的文库标签的长度均相同,且在双端文库标签组合物中,相同位置上每种碱基出现的次数相同。利用优化的双端文库标签进行数据拆分,能够解决合成、实验环节和上机测序过程中导致的串扰问题。而控制每个5’端的文库标签的长度相同,3’端的文库标签的长度也相同,且相同位置上每种碱基出现的次数相同,能够获得双端文库标签碱基平衡性很好的多个文库,将这多个文库混合上机测序时,各文库的双端标签读取准确性高,进而提高文库有效拆分率。

【技术实现步骤摘要】
双端文库标签组合物及其在MGI测序平台中的应用
本专利技术涉及血浆DNA建库领域,具体而言,涉及一种双端标签扩增引物组合物及其在MGI测序平台中的应用。
技术介绍
在MGI高通量测序仪测序过程中,为了实现更多的样本测序,需要把每个样本用不同的标签序列(Index)进行标记测序后进行拆分。但目前的MGI测序平台使用的基本都是单端标签的文库。由于单端标签(Index)存在着天然的缺陷,容易导致样本之间串扰的发生。由于标签接头或引物在合成、实验操作以及测序的各个环节导致的污染,使得相互串扰是不可避免的,所以需要解决样本之间的低频度的相互串扰,目前最好的方式是用双端标签的方法来解决,用双端标签方法能够有效去除样本之间的相互串扰。但采用双端标签相比单端标签,在测序数据拆分时,测序仪是否能够准确地读取标签序列,会严重影响测序数据有效拆分。如果双端标签序列读取有问题,则会降低测序数据的有效拆分率,进而增加测序成本。因此,如何利用双端标签的方式标记混合测序的文库,一方面降低样本串扰现象,另一方面提高多样本混合测序后的数据有效拆分率。
技术实现思路
本专利技术的主要目的在于提供一种双端标签扩增引物组合物及其在MGI测序平台中的应用,以解决现有MGI测序平台利用单端标签标记文库容易发生样本串扰的问题。为了实现上述目的,根据本申请的一个方面,提供了一种双端文库标签组合物,双端文库标签组合物包括:多个5’端的文库标签和多个3’端的文库标签,多个的5’端的文库标签长度均相同,多个3’端的文库标签的长度均相同,且在双端文库标签组合物中,相同位置上每种碱基出现的次数相同。进一步地,多个5’端的文库标签的长度与多个3’端的文库标签的长度相同,优选均为6~10bp之间的任一固定长度;优选地,双端文库标签组合物中,任意两种文库标签间至少存在3个碱基差异;且任意一种文库标签中连续相同的碱基数目不超过3个;优选地,任意一种文库标签的GC含量为40~60%;优选地,双端文库标签组合物包括4标签平衡的双端文库标签的组合,或8标签平衡的双端文库标签的组合,其中,4标签平衡的双端文库标签的组合为4n个5’端的文库标签和4n个3’端的文库标签的组合,8标签平衡的的双端文库标签的组合为8n个5’端的文库标签和8n个3’端的文库标签的组合,其中,n为大于等于1的自然数。进一步地,4标签平衡的双端文库标签的组合中,5’端的文库标签选自表1所示的96组中的任意一组或多组,3’端的文库标签组选自表1所示的96组不同于5’端的文库标签组的任意一组或多组。进一步地,8标签平衡的双端文库标签的组合中,5’端的文库标签选自表2所示的48组中的任意一组或多组,3’端的文库标签组选自表2所示的48组不同于5’端的文库标签组的任意一组或多组。根据本专利技术的第二个方面,提供了一种基于MGI测序平台的带双端文库标签的扩增引物组合物,该扩增引物组合物包括多个带双端文库标签的扩增引物对的组合,每个扩增引物对包括5’端的文库标签和3’端的文库标签,多个扩增引物对的5’端的文库标签的长度均相同,多个扩增引物对的3’端的文库标签的长度均相同,且相同位置上每种碱基出现的次数相同。进一步地,多个扩增引物对的5’端的文库标签的长度与多个扩增引物对的3’端的文库标签的长度相同;优选地,5’端的文库标签和3’端的文库标签的长度均为6~10bp之间的任一固定长度;优选地,扩增引物组合物中,任意两种文库标签之间至少存在3个碱基差异;且任意一种文库标签中连续相同的碱基数目不超过3个;优选地,多个5’端的文库标签和多个3’端的文库标签的GC含量均为40~60%;优选地,扩增引物组合物包括4标签平衡的4n个扩增引物对的组合,或者为8标签平衡的8n个扩增引物对的组合,n为大于等于1的自然数。进一步地,4标签平衡的4n个扩增引物对中,5’端的文库标签选自表1所示的96组中的任意一组或多组,3’端的文库标签组选自表1所示的96组不同于5’端的文库标签组的任意一组或多组;优选地,8标签平衡的8n个扩增引物对中,5’端的文库标签选自表2所示的48组中的任意一组或多组,3’端的文库标签组选自表2所示的48组不同于5’端的文库标签组的任意一组或多组。进一步地,每个扩增引物对还包括5’端通用扩增序列和3’端通用扩增序列,5’端通用扩增序列包括位于5’端的文库标签上游的通用序列和位于5’端的文库标签下游的通用序列,3’端通用扩增序列包括位于3’端的文库标签上游的通用序列和位于3’端的文库标签下游的通用序列;优选地,位于5’端的文库标签上游的通用序列为SEQIDNO:793,位于5’端的文库标签下游的通用序列为SEQIDNO:794;位于3’端的文库标签上游的通用序列为SEQIDNO:795,位于3’端的文库标签下游的通用序列为SEQIDNO:796;或者位于5’端的文库标签上游的通用序列为SEQIDNO:793,位于5’端的文库标签下游的通用序列为SEQIDNO:797;位于3’端的文库标签上游的通用序列为SEQIDNO:795,位于3’端的文库标签下游的通用序列为SEQIDNO:798。根据本专利技术的第三个方面,提供了一种测序文库构建试剂盒,试剂盒包括上述任一种扩增引物组合物。进一步地,试剂盒还包括泡状接头,泡状接头包括第一接头序列和第二接头序列,第一接头序列为SEQIDNO:769,第二接头序列为SEQIDNO:770,或者第一接头序列为SEQIDNO:773,第二接头序列为SEQIDNO:774。根据本专利技术的第四个方面,提供了一种基于MGI测序平台的测序文库的构建方法,该构建方法采用上述任一种试剂盒进行构建。根据本专利技术的第五个方面,提供了一种测序文库,测序文库包括上述双端文库标签组合,或者上述任一种扩增引物组合物。应用本专利技术的技术方案,通过引入双端文库标签及优化的双端文库标签组合,利用双端文库标签进行数据拆分,能够解决合成、实验环节和上机测序过程中导致的串扰问题,会使检测结果更准确。进一步地,通过控制双端文库标签组合中每个5’端的文库标签的长度相同,3’端的文库标签的长度也相同,并且限定相同位置上每种碱基出现的次数相同,使得该组合物中的双端标签的碱基出现概率相同,因而合成带有该组合物中的双端标签的接头或文库扩增引物时,能够获得双端文库标签碱基平衡性很好的多个文库,将这多个文库混合上机测序时,能够使得这些混合文库中各文库的双端标签读取准确性高,进而提高文库有效拆分率。附图说明构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1A、图1B及图1C示出了MGI测序平台采用双端标签比单端标签去除串扰的优势;图2A和图2B分别示出了MGI的单端标签接头的两种形式;图3A和图3B分别示出了MGI的双端标签接头的两种潜在形式;图4示出了MGI平台两种双端标签建库实现过程;图5示出了本申请的本本文档来自技高网...

【技术保护点】
1.一种双端文库标签组合物,其特征在于,所述双端文库标签组合物包括:多个5’端的文库标签和多个3’端的文库标签,多个所述的5’端的文库标签长度均相同,多个所述3’端的文库标签的长度均相同,且在所述双端文库标签组合物中,相同位置上每种碱基出现的次数相同。/n

【技术特征摘要】
1.一种双端文库标签组合物,其特征在于,所述双端文库标签组合物包括:多个5’端的文库标签和多个3’端的文库标签,多个所述的5’端的文库标签长度均相同,多个所述3’端的文库标签的长度均相同,且在所述双端文库标签组合物中,相同位置上每种碱基出现的次数相同。


2.根据权利要求1所述的双端文库标签组合物,其特征在于,所述多个所述5’端的文库标签的长度与多个所述3’端的文库标签的长度相同,优选均为6~10bp之间的任一固定长度;
优选地,所述双端文库标签组合物中,任意两种所述文库标签间至少存在3个碱基差异;且任意一种所述文库标签中连续相同的碱基数目不超过3个;
优选地,任意一种所述文库标签的GC含量为40~60%;
优选地,所述双端文库标签组合物包括4标签平衡的双端文库标签的组合,或8标签平衡的双端文库标签的组合,其中,所述4标签平衡的双端文库标签的组合为4n个所述5’端的文库标签和4n个所述3’端的文库标签的组合,所述8标签平衡的的双端文库标签的组合为8n个所述5’端的文库标签和8n个所述3’端的文库标签的组合,其中,n为大于等于1的自然数。


3.根据权利要求2所述的双端文库标签组合物,其特征在于,所述4标签平衡的双端文库标签的组合中,所述5’端的文库标签选自表1所示的96组中的任意一组或多组,所述3’端的文库标签组选自表1所示的96组不同于所述5’端的文库标签组的任意一组或多组。


4.根据权利要求2所述的双端文库标签组合物,其特征在于,所述8标签平衡的双端文库标签的组合中,所述5’端的文库标签选自表2所示的48组中的任意一组或多组,所述3’端的文库标签组选自表2所示的48组不同于所述5’端的文库标签组的任意一组或多组。


5.一种基于MGI测序平台的带双端文库标签的扩增引物组合物,其特征在于,所述扩增引物组合物包括多个带双端文库标签的扩增引物对的组合,每个所述扩增引物对包括5’端的文库标签和3’端的文库标签,
多个所述扩增引物对的5’端的文库标签的长度均相同,多个所述扩增引物对的3’端的文库标签的长度均相同,且相同位置上每种碱基出现的次数相同。


6.根据权利要求5所述的扩增引物组合物,其特征在于,多个所述扩增引物对的5’端的文库标签的长度与多个所述扩增引物对的3’端的文库标签的长度相同;
优选地,所述5’端的文库标签和所述3’端的文库标签的长度均为6~10bp之间的任一固定长度;
优选地,所述扩增引物组合物中,任意两种文库标签之间至少存在3个碱基差异;且任意一种文库标签中连续相同的碱基数目不超过3个;
优选地,多个所述5’端...

【专利技术属性】
技术研发人员:汪彪胡玉刚郑文莉吴强
申请(专利权)人:纳昂达南京生物科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利