低频突变检测方法、试剂盒和装置制造方法及图纸

技术编号:19712447 阅读:29 留言:0更新日期:2018-12-08 18:23
本发明专利技术提出了一种测序接头,所述测序接头呈Y字型,包括:第一链,所述第一链包括相连的第一样本标签序列和第一分子标签序列;以及第二链,所述第二链包括相连的第二样本标签序列和第二分子标签序列。由此,利用本发明专利技术的测序接头能够有效地构建基因组DNA样品的高通量测序文库,特别是能够有效地构建适用于检测低频突变的高通量测序文库,通过对文库的测序,然后基于对测序结果的数据分析,以获得序列信息,实现高效、准确、快速地对基因组DNA样品的检测,适于广泛应用。

【技术实现步骤摘要】
低频突变检测方法、试剂盒和装置
本专利技术涉及生物领域。具体地,本专利技术涉及低频突变检测方法、试剂盒和装置。更具体地,本专利技术涉及测序接头、接头封闭序列组、构建测序文库的方法、测序文库、低频突变检测方法、实施低频突变检测方法的装置以及用于构建测序文库的试剂盒。
技术介绍
液体活检(Liquidbiopsy)作为组织活检的补充,通过非侵入性取样以降低活检危害,在动态监测肿瘤进展和治疗反应等领域获得临床认可,已成为肿瘤精准医疗领域炙手可热的明星技术。液体活检的检测对象主要有CTC(循环肿瘤细胞)、ctDNA(循环肿瘤DNA)、循环microRNA和Exsome(外泌体)。其中,ctDNA可应用于肿瘤的早期诊断、动态监测肿瘤的发生发展及疗效、耐药检测、复发风险评估等,在肿瘤诊治中前景广阔,受到越来越多的关注。然而,肿瘤是高度异质性的,其中致病突变可能以极低比例存在,比如突变频率<0.1%,甚至更低。随着NGS(下一代测序)技术的发展,高深度目标区域捕获测序策略让低频突变的发现成为可能,但是文库构建、目标区域捕获及测序过程中的系统错误使得低频突变的准确检出依然是一个挑战。这些系统错误主要包括:(1)测序仪的固有错误率,目前最准确的HiSeq测序仪的单碱基错误率也在0.2%左右;(2)文库构建、目标区域捕获所涉及的DNA聚合酶的固有错误率在10-7-10-5;(3)目前Illumina高通量测序仪HiSeqX和NovaSeq均采用图案化流动槽和排他性扩增,这导致index标签交换(又称标签错配)的发生比例明显增高,高至2%。index标签交换会造成特定类型的错比对,导致文库未能比对到预期标签而是错误地比对到多重分析库的另一个标签)。上述系统错误对低频突变位点检测的影响尤为明显,极易导致检出大量假阳性低频突变位点,即,难以区分到底是真实的样本突变还是由于这些系统错误所造成的假阳性突变。对于上述系统错误,通常采用添加分子标签的方法来进行错误校正,该技术是对原始样本基因组打断后的每一个片段都加上一段特有的标签序列,用于区分同一样本中成千上万的不同的片段,在后续的数据分析中可以通过这些标签序列来排除由于DNA聚合酶和扩增以及测序过程中所引入的错误。主要分为单分子标签技术safe-seq和双分子标签技术duplex-seq。以duplex-seq为代表的双分子标签策略能够纠正几乎所有类型的假阳性突变,但数据转化率低,所需上机数据量远高于常规测序,测序成本高;以safe-seq为代表的单分子标签策略数据转化率稍高,且能够纠正大部分的测序错误和PCR扩增引物的错误,但是无法识别Index标签交换造成的假阳性突变位点。由于duplex-seq数据转化率的限制,目前单分子标签策略依然是主流。调研发现,目前商业试剂盒,比如SwiftBiosciences的Accel-2SPlusDNALibraryKit(MID),尚不能避免Index串扰(即标签交换)造成的假阳性难题。因此,亟需对现有技术进行改进,以获得一种更全面、更准确的低频突变检测方法,为疾病的早期筛查提供可信赖的检测手段。
技术实现思路
本专利技术旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。为此,在本专利技术的一个方面,本专利技术提出了一种测序接头。根据本专利技术的实施例,所述测序接头呈Y字型,包括:第一链,所述第一链包括相连的第一样本标签序列和第一分子标签序列;以及第二链,所述第二链包括相连的第二样本标签序列和第二分子标签序列。本专利技术的第一链(在本专利技术中,也可称作“P5接头”)和第二链(在本专利技术中,也可称作“P7接头”)中均设有样本标签序列(即第一样本标签序列和第二样本标签序列,在本专利技术中,也可分别称作“indexi5”和“indexi7”),即采用双端index标签用于消除index串扰带来的样本错配。同时,第一链和第二链中均设有分子标签序列(即第一分子标签序列和第二分子标签序列,在本专利技术中,也可分别称作“UMI1”和“UMI2”),以便纠正PCR及测序过程中的系统错误,减少这些错误对低频突变检出的影响,降低假阳性突变的检出。由此,利用本专利技术的测序接头能够有效地构建基因组DNA样品的高通量测序文库,特别是能够有效地构建适用于检测低频突变的高通量测序文库,通过对文库的测序,然后基于对测序结果的数据分析,以获得序列信息,实现高效、准确、快速地对基因组DNA样品的检测,适于广泛应用。根据本专利技术的实施例,上述测序接头还可以具有下列附加技术特征:根据本专利技术的实施例,所述第一样本标签序列和第二样本标签序列的总碱基数为8nt,所述第一分子标签序列和第二分子标签序列的总碱基数为8nt。根据本专利技术的实施例,所述第一样本标签序列、第二样本标签序列、第一分子标签序列和第二分子标签序列的碱基数均为4nt;或者所述第一样本标签序列和第二分子标签序列的碱基数均为3nt,所述第二样本标签序列和第一分子标签序列的碱基数均为5nt;或者所述第一样本标签序列和第二分子标签序列的碱基数均为5nt,所述第二样本标签序列和第一分子标签序列的碱基数均为3nt。根据本专利技术的实施例,所述第一样本标签序列和第二样本标签序列具有如SEQIDNO:1~24任一所示的核苷酸序列。根据本专利技术的实施例,所述第一分子标签序列和第二分子标签序列为随机序列。根据本专利技术的实施例,所述第一分子标签序列和第二分子标签序列中每个位置上A、T、G、C四种碱基各自出现的概率分别独立地为24~26%。根据本专利技术的实施例,所述测序接头具有如SEQIDNO:25~48任一所示的核苷酸序列。在本专利技术的另一方面,本专利技术提出了一种用于封闭前面所述测序接头的接头封闭序列组。根据本专利技术的实施例,所述接头封闭序列组包括:第一接头封闭序列,所述第一接头封闭序列使所述测序接头的第一链封闭;以及第二接头封闭序列,所述第二接头封闭序列使所述测序接头的第二链封闭;其中,其中,所述第一接头封闭序列包括与所述第一样本标签序列和第一分子标签序列至少部分互补的第一互补序列,所述第二接头封闭序列包括与所述第二样本标签序列和第二分子标签序列至少部分互补的第二互补序列,并且所述第一接头封闭序列和第二接头封闭序列的3’端碱基均被磷酸化修饰。本专利技术的接头封闭序列组封闭效果好,使得探针捕获效率显著提高,数据利用率高,有利于目的基因的检出。由此,利用本专利技术的接头封闭序列组能够有效地构建基因组DNA样品的高通量测序文库,特别是能够有效地构建适用于检测低频突变的高通量测序文库,通过对文库的测序,然后基于对测序结果的数据分析,以获得序列信息,实现高效、准确、快速地对基因组DNA样品的检测,适于广泛应用。根据本专利技术的实施例,所述第一互补序列和第二互补序列均包括兼并序列,所述第一接头封闭序列和第二接头封闭序列包括LNA碱基。根据本专利技术的实施例,当所述测序接头具有如SEQIDNO:25~48任一所示的核苷酸序列时,所述第一接头封闭序列具有SEQIDNO:49所示的核苷酸序列,所述第二接头封闭序列具有SEQIDNO:50所示的核苷酸序列。在本专利技术的又一方面,本专利技术提出了一种构建测序文库的方法。根据本专利技术的实施例,所述方法包括:将前面所述测序接头与目的基因相连,以便获得连接产物;将所述连接产物进本文档来自技高网
...

【技术保护点】
1.一种测序接头,其特征在于,所述测序接头呈Y字型,包括:第一链,所述第一链包括相连的第一样本标签序列和第一分子标签序列;以及第二链,所述第二链包括相连的第二样本标签序列和第二分子标签序列。

【技术特征摘要】
1.一种测序接头,其特征在于,所述测序接头呈Y字型,包括:第一链,所述第一链包括相连的第一样本标签序列和第一分子标签序列;以及第二链,所述第二链包括相连的第二样本标签序列和第二分子标签序列。2.根据权利要求1所述的测序接头,其特征在于,所述第一样本标签序列和第二样本标签序列的总碱基数为8nt,所述第一分子标签序列和第二分子标签序列的总碱基数为8nt,任选地,所述第一样本标签序列、第二样本标签序列、第一分子标签序列和第二分子标签序列的碱基数均为4nt;或者所述第一样本标签序列和第二分子标签序列的碱基数均为3nt,所述第二样本标签序列和第一分子标签序列的碱基数均为5nt;或者所述第一样本标签序列和第二分子标签序列的碱基数均为5nt,所述第二样本标签序列和第一分子标签序列的碱基数均为3nt,任选地,所述第一样本标签序列和第二样本标签序列具有如SEQIDNO:1~24任一所示的核苷酸序列,任选地,所述第一分子标签序列和第二分子标签序列为随机序列,任选地,所述第一分子标签序列和第二分子标签序列中每个位置上A、T、G、C四种碱基各自出现的概率分别独立地为24~26%,任选地,所述测序接头具有如SEQIDNO:25~48任一所示的核苷酸序列。3.用于封闭权利要求1或2所述测序接头的接头封闭序列组,其特征在于,包括:第一接头封闭序列,所述第一接头封闭序列使所述测序接头的第一链封闭;以及第二接头封闭序列,所述第二接头封闭序列使所述测序接头的第二链封闭;其中,所述第一接头封闭序列包括与所述第一样本标签序列和第一分子标签序列至少部分互补的第一互补序列,所述第二接头封闭序列包括与所述第二样本标签序列和第二分子标签序列至少部分互补的第二互补序列,并且所述第一接头封闭序列和第二接头封闭序列的3’端碱基均被磷酸化修饰。4.根据权利要求3所述的接头封闭序列组,其特征在于,所述第一互补序列和第二互补序列均包括兼并序列,所述第一接头封闭序列和第二接头封闭序列包括LNA碱基;任选地,当所述测序接头具有如SEQIDNO:25~48任一所示的核苷酸序列时,所述第一接头封闭序列具有SEQIDNO:49所示的核苷酸序列,所述第二接头封闭序列具有SEQIDNO:50所示的核苷酸序列。5.一种构建测序文库的方法,其特征在于,包括:将权利要求1或2所述测序接头与目的基因相连,以便获得连接产物;将所述连接产物进行扩增,以便获得扩增产物;采用权利要求3或4所述接头封闭序列组对所述扩增产物进行接头封闭,以便获得接头封闭产物;以及将所述接头封闭产物进行杂交捕获,以便获得测序文库。6.一种测序文库,其特征在于,是由权利要求5所述构建测序文库的方法获得的。7.一种低频突变检测方法,其特征在于,包括:根据权利要求...

【专利技术属性】
技术研发人员:董超宋廷瑞王秀莉郭琦李长平
申请(专利权)人:北京莲和医学检验所有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1