测序接头、测序接头组和超低频突变的检测方法技术

技术编号:19584943 阅读:53 留言:0更新日期:2018-11-28 02:22
本发明专利技术公开了一种测序接头,包括双链互补区、单链5’‑连接臂和单链3’‑连接臂,双链互补区包括随机标签序列和接头标签序列,单链区与随机标签序列直接相连,移除了传统接头中单链区与随机标签序列之间的互补序列,能最大程度上减少错配接头比例,实现原始模板的完全配对,利用正负链配对关系进行序列校正。本发明专利技术公开了一种测序接头组,包括至少两个上述的测序接头,通过设置每组测序接头组中接头标签序列的序列种类和/或随机标签序列的长度,能够区分不同样本的测序结果,排除污染数据。本发明专利技术公开了一种超低频突变的检测方法,利用上述的测序接头组,最大化校正高通量测序中的各类低频错误,高效实现血浆循环游离DNA的超低频突变检测。

【技术实现步骤摘要】
测序接头、测序接头组和超低频突变的检测方法
本专利技术涉及核酸测序
,具体涉及一种测序接头、测序接头组和超低频突变的检测方法。
技术介绍
高通量测序技术的发展使基因测序的成本急剧下降,由于其测序通量高、成本低,以及速度快等优势,在科学研究以及临床检测领域获得了广泛的应用,使人类医学由传统医学进入到了精准医疗时代成为了可能。目前,高通量测序技术在临床应用相对广泛的包括以游离DNA(cellfreeDNA,cfDNA)为检测对象的肿瘤液体活检和和无创产前诊断。无创产前检测技术主要通过检测孕妇外周血中存在胎儿游离DNA(cell-freefetalDNA,cffDNA),检测胎儿21、18、13染色体非整倍体。单胎妊娠早期的胎儿释放的游离cfDNA浓度小于10%。随着保存时间的延长,白细胞降解及随之而来的母体基因组DNA(gDNA)的释放将严重影响低含量的胎儿游离DNA(cffDNA)的比例及完整性,使cffDNA中的低频突变和超低频突变检出困难。肿瘤的液体活检技术主要通过对外周血、尿液、腹水等液体样本中包含的循环肿瘤DNA(CirculatingTumorDNA,ctDNA)进行检测,以获取疾病信息。ctDNA往往只是占cfDNA中非常少的比例,对于癌症早期患者来说,该比例通常不高于1%,即便是中晚期患者,ctDNA在cfDNA中的占比通常也不高于5%(Kennedyetal.,2014),因此ctDNA中突变的频率一般非常低,为实现肿瘤液体活检,需要对血浆等液体样本中的ctDNA进行高准确率的低频突变检测。目前,高通量测序技术在临床基因检测中被证实具有很高的准确度和灵敏度,然而受到文库构建以及测序过程中各种来源的错误和噪音的影响,(例如:测序时仪器读取碱基时引入的错误;文库构建过程中由于PCR扩增发生的复制错误,PCR过程中使用的DNA聚合酶也会引入10-6~10-7的错误率,随着PCR循环数的增加错误率也会有所增加;测序过程中由于标签跳跃(indexhopping)引入的数据污染),使测序得到的每个碱基出现错误的概率在1/1000~1/100之间,即每1000个碱基就会出现1到10个错误碱基,导致高通量测序在用于检测突变率在1%以下的低频突变和超低频突变时,难以区分是测序本身的错误还是生物体内本来就存在的突变。为解决超低频突变噪音问题,主要通过在文库构建过程中引入分子标签,对原始的DNA分子进行标记,来区分DNA模板;在后续的生物信息学分析阶段,通过分子标签的识别以还原最原始的突变状态。分子标签可以是固定序列的组合,也可以是随机序列,现有技术中公开了图1所示的Y型接头,Y型接头的P5端连接index1,P7端连接index2,P7端index2序列后引入随机分子标签序列UMI(uniquemolecularindex),通过UMI对样品文库中的DNA片段进行单分子标记,并通过对同一UMI标记的重复序列进行一致性对比以去除测序错误;同时,利用双端index的组合降低由于indexhopping引入的污染数据。然而,上述的UMI序列使双链DNA分子的每条链上都带有不同的分子标记,在文库构建和测序分析的过程中两个单链的配对关系丢失,无法利用原始模板的双链配对信息进行序列校正,限制了对高通量测序错误的识别检出。
技术实现思路
因此,本专利技术要解决的技术问题在于克服现有技术中的高通量测序接头无法跟踪原始模板的正负链信息,不能很好地将正负链信息进行较正缺陷,从而提供一种保持原始模板的正负链配对关系,且对超低频突变识别准确度高的测序接头。为此,本专利技术提供下述技术方案:第一方面,本专利技术提供一种测序接头,包括:双链互补区、单链5’-连接臂和单链3’-连接臂,所述双链互补区包括随机标签序列和接头标签序列,所述随机标签序列由随机碱基组成,所述接头标签序列为已知核苷酸序列;所述单链5’-连接臂和所述单链3’-连接臂连接于所述随机标签序列远离所述接头标签序列的自由端。上述的测序接头,还包括文库标签序列,所述文库标签序列位于所述单链5’-连接臂或所述单链3’-连接臂。上述的测序接头,所述随机标签序列由3~8个随机碱基组成。上述的测序接头,所述接头标签序列由10~15个碱基组成。上述的测序接头,所述单链5’-连接臂为P5接头,所述单链3’-连接臂为P7接头,所述测序接头的文库标签序列位于所述P7接头。上述的测序接头,所述单链5’-连接臂的核苷酸序列如SEQIDNO.3或SEQIDNO.9所示,所述单链3’-连接臂的核苷酸序列如SEQIDNO.4或SEQIDNO.10所示;所述文库标签序列的核苷酸序列如SEQIDNO.5所示。上述的测序接头,所述双链互补区远离所述单链5’-连接臂和单链3’-连接臂的一端突出碱基T。上述的测序接头,所述接头标签序列选自SEQIDNO.6和SEQIDNO.11~SEQIDNO.30所示的任一序列。第二方面,本专利技术提供一种测序接头组,包括至少两个所述的测序接头,其中,至少一个所述测序接头的接头标签序列与其他所述测序接头不同。上述的测序接头组,所述测序接头组包括具有5~100种所述接头标签序列的所述测序接头。上述的测序接头组,连接不同样本文库的所述测序接头组中所述测序接头的随机标签序列的长度不同。第三方面,本专利技术提供一种超低频突变的检测方法,包括以下步骤:S1,制备至少一组所述的测序接头组,其中,至少一组测序接头组中所述测序接头的随机标签序列长度与其他所述测序接头组不同;S2,连接待测基因片段与所述S1中的测序接头组,获得连接产物,扩增所述连接产物得到扩增产物,获得所述待测样本的测序文库;其中,同一样本来源的所述基因片段连接同一组所述测序接头组;S3,捕获所述测序文库的目标区域,获得杂交后测序文库;S4,将所述杂交后测序文库进行测序,获得测序数据,校正所述测序数据,基于校正后的测序数据进行突变分析。上述的超低频突变的检测方法,所述基因片段为游离DNA,或打断的基因组DNA。上述的超低频突变的检测方法,所述步骤S4中的校正所述测序数据包括:(i)利用所述文库标签序列对同一样本来源的测序数据进行识别与校正;(ii)利用所述随机标签序列的长度对同一样本来源的测序数据进行识别与校正;(iii)利用所述随机序列标签和所述接头标签序列对同一基因片段来源的测序数据进行识别与校正。第四方面,本专利技术提供一种试剂盒,包括上述的测序接头或上述的测序接头组。第五方面,本专利技术提供下述a1~a6中的任一用途:a1,所述的测序接头,所述的测序接头组,或所述的试剂盒在高通量测序中的用途;a2,所述的测序接头,所述的测序接头组,或所述的试剂盒在构建高通量测序文库中的用途;a3,所述的测序接头,所述的测序接头组,或所述的试剂盒在制备高通量测序文库的产品中的用途;a4,所述的测序接头,所述的测序接头组,或所述的试剂盒在游离DNA超低频突变检测中的用途;a5,所述的测序接头,所述的测序接头组,或所述的试剂盒在制备游离DNA超低频突变检测的产品中的用途;a6,所述的测序接头,所述的测序接头组,或所述的试剂盒在制备癌症低频突变检测、靶向用药指导、疾病早期筛查和/或无创产前诊断的产品中的用途。本专利技术技术方案,具有如下优点:1、本专利技术提供的测序本文档来自技高网
...

【技术保护点】
1.一种测序接头,其特征在于,包括:双链互补区、单链5’‑连接臂和单链3’‑连接臂,所述双链互补区包括随机标签序列和接头标签序列,所述随机标签序列由随机碱基组成,所述接头标签序列为已知核苷酸序列;所述单链5’‑连接臂和所述单链3’‑连接臂连接于所述随机标签序列远离所述接头标签序列的自由端。

【技术特征摘要】
1.一种测序接头,其特征在于,包括:双链互补区、单链5’-连接臂和单链3’-连接臂,所述双链互补区包括随机标签序列和接头标签序列,所述随机标签序列由随机碱基组成,所述接头标签序列为已知核苷酸序列;所述单链5’-连接臂和所述单链3’-连接臂连接于所述随机标签序列远离所述接头标签序列的自由端。2.根据权利要求1所述的测序接头,其特征在于,还包括文库标签序列,所述文库标签序列位于所述单链5’-连接臂或所述单链3’-连接臂。3.根据权利要求1或2所述的测序接头,其特征在于,所述随机标签序列由3~8个随机碱基组成。4.根据权利要求1-3任一项所述的测序接头,其特征在于,所述接头标签序列由10~15个碱基组成。5.根据权利要求1-4任一项所述的测序接头,其特征在于,所述单链5’-连接臂为P5接头,所述单链3’-连接臂为P7接头,所述测序接头的文库标签序列位于所述P7接头。6.根据权利要求5所述的测序接头,其特征在于,所述单链5’-连接臂的核苷酸序列如SEQIDNO.3或SEQIDNO.9所示,所述单链3’-连接臂的核苷酸序列如SEQIDNO.4或SEQIDNO.10所示;所述文库标签序列的核苷酸序列如SEQIDNO.5所示。7.根据权利要求1-6任一项所述的测序接头,其特征在于,所述双链互补区远离所述单链5’-连接臂和单链3’-连接臂的一端突出碱基T。8.根据权利要求1-7任一项所述的测序接头,其特征在于,所述接头标签序列选自SEQIDNO.6和SEQIDNO.11~SEQIDNO.30所示的任一序列。9.一种测序接头组,其特征在于,包括至少两个权利要求1-8任一项所述的测序接头,其中,至少一个所述测序接头的接头标签序列与其他所述测序接头不同。10.根据权利要求9所述的测序接头组,其特征在于,所述测序接头组包括具有5~100种所述接头标签序列的所述测序接头。11.根据权利要求9-10任一项所述的测序接头组,其特征在于,连接不同样本文库的所述测序接头组中所述测序接头的随机标签序列的长度不同。12.一种超低频突变的检测方法,其特征在于,包括以下步骤:S1,制备至少一组权利要求9-11任一项所述的测序接头组,其中,至少一组测序接头组中所述测序接头的随机...

【专利技术属性】
技术研发人员:杨功达曾丰波胡秀弟蒋廷亚黎小锋
申请(专利权)人:苏州人人基因科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1