当前位置: 首页 > 专利查询>古博专利>正文

一种高通量测序标签的应用和文库构建的方法技术

技术编号:19159578 阅读:46 留言:0更新日期:2018-10-13 12:36
本发明专利技术公开了一种高通量测序标签的应用和文库构建的方法,属于生物技术领域;其步骤如下:(1)、片段化DNA末端修复:将片段化的DNA修改为平末端,5’端磷酸化修饰,3’端链接上腺苷酸,以满足连接接头序列的需要;(2)、将接头与完成末端修复的片段化DNA相连接;(3)、纯化:去除多余的接头序列;(4)、PCR扩增:使用与接头序列相应的引物,进行PCR,扩增文库;(5)、纯化:去除多余的引物序列;(6)、测序;依据illumina测序仪的要求,进行高通量测序。本发明专利技术通过改进现有技术的实验和分析流程,区分位于基因组同一位置的不同DNA来源的测序片段,在不增加实验负责程度和成本的情况下,解决了上述问题。

【技术实现步骤摘要】
一种高通量测序标签的应用和文库构建的方法
本专利技术涉及一种高通量测序标签的应用和文库构建的方法,属于生物

技术介绍
高通量测序(High-throughputsequencing,又称为下一代测序,Nextgenerationsequencing,NGS)是在一次实验中同时进行数亿计的DNA分子序列测序的功能强大的实验技术。以人类基因组重新测序为例,在得到人类基因组蓝图后,要想知道某个人基因组和人类基因组蓝图的差异,即其自身特异的基因特征,就需要对某个人的基因组进行重新测序。然后,人类基因组包含约30亿个碱基对(basepair,bp),传统测序方法,每个反应仅能测约1000个碱基对,需要300万个反应才能够完成一个人的基因组重测序,在工作量和成本上都是难以想象的。使用高通量测序技术,在一次实验中即可以完成数百万个DNA分子的测序,从而实现了在一个反应中,完成人类基因组重新测序,同时大大降低了测序成本。以人类基因组重新测序为例,常规的高通量测序过程包含:基因组DNA提取,DNA片段化处理,DNA碎片末端补平和磷酸化修饰,将高通量测序仪能够识别的接头序列链接至修复好的DNA碎片上,产物纯化,PCR扩增,产物纯化,质检,上机进行高通量测序。PCR扩增后得到的测序文库,其中含有众多的测序片段。PCR扩增和测序的过程中,准确性都不是100%,从而会引入一定比例的错误,后续的测序结果数据分析过程,能够一定程度上降低错误发生的概率。其方法是:首先,将两端的序列一致的测序片段(称为冗余序列)合并成一个测序片段(去冗余);其次,用在基因组上有交集的不同测序片段相互比对,当某个位置的某个变异次数超过阈值时,判读此位置存在变异。当测序深度超过5000层时,会有大量冗余序列。此外,冗余序列中的错误次数也会增多。冗余序列合并时,当某个位置的错误变异比例超过阈值时,合并后的测序片段也带有错误。冗余序列被认为来自于同一个DNA分子,由PCR扩增生成的不同测序片段。然而,在超深度测序过程中,冗余序列也并不一定来源于同一个DNA分子。如果能够区分冗余序列是否来源于同一个DNA分子,可以仅将同一来源分子进行去冗余操作,然后再通过基因组同一区域中不同测序片段进行相互比对,去除测序错误。然而,现有技术方案无法有效地判断冗余序列中分子的来源,从而无法实现上述功能。因此,提供一种高通量测序标签的应用和文库构建的方法,从多种途径区分位于基因组同一位置的不同DNA来源的测序片段,在不增加实验复杂程度和成本的情况下,有效去除测序片段中的测序错误,提高测序的特异性,从而提高测序灵敏性;就成为该
急需解决的技术难题。
技术实现思路
本专利技术的目的之一是提供一种用于高通量测序标签的应用和文库构建的接头序列。本专利技术的上述目的是通过以下技术方案达到的:方案1:一种用于高通量测序标签的应用和文库构建的接头序列,包括如下:接头序列1:5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’;见序列表1;接头序列2(含有标记核酸的标签):5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC【U7标签】ATCTCGTATGCCGTCTTCTGCTTG3’。优选地,所述U7标签是长度为4-15bp的随机核酸序列。优选地,在同一样本中,所述带有U7标签序列的接头的种类不少于24种:CGTGAT,ACATCG,GCCTAA,TGGTCA,CACTGT,ATTGGC,GATCTG,TCAAGT,CTGATC,AAGCTA,GTAGCC,TACAAG,AGTCAA,GGAACT,TGACAT,GGACGG,GCGGAC,TTTCAC,GGCCAC,CGAAAC,CGTACG,CCACTC,ATCAGT,ATTCCT;见序列表1。序列表1优选地,所述接头序列1的3’端序列和接头序列2的5’端序列反意互补。优选地,所述接头序列1的5’端序列和接头序列2的3’端序列不反意互补。优选地,所述接头序列通过连接酶与待测核酸分子相结合。方案2:一种用于高通量测序标签的应用和文库构建的接头序列,包括如下:接头序列3(含有标记核酸的标签):5’AATGATACGGCGACCACCGAGATCTACAC【U5标签】ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’;接头序列4:5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC3’;见序列表2。优选地,所述U5标签是长度为4-15bp的随机核酸序列。优选地,在同一样本中,所述带有U5标签序列的接头的种类不少于24种:CGTGAT,ACATCG,GCCTAA,TGGTCA,CACTGT,ATTGGC,GATCTG,TCAAGT,CTGATC,AAGCTA,GTAGCC,TACAAG,AGTCAA,GGAACT,TGACAT,GGACGG,GCGGAC,TTTCAC,GGCCAC,CGAAAC,CGTACG,CCACTC,ATCAGT,ATTCCT;见序列表2:序列表2优选地,所述接头序列3的3’端序列和接头序列4的5’端序列反意互补。优选地,所述接头序列3的5’端序列和接头序列4的3’端序列不反意互补。优选地,所述接头序列通过连接酶与待测核酸分子相结合。本专利技术的另一目的是提供一种含有区分样本的核酸标签的引物序列,用于扩增连接有标记核酸的标签的接头的核酸。本专利技术的上述目的是通过以下技术方案达到的:方案1:一种用于高通量测序标签的应用和文库构建的引物序列,如下:引物序列1:5’AATGATACGGCGACCACCGAGATCTACAC【S5标签】ACACTCTTTCCCTACACG3’;见序列表3;引物序列2:5’CAAGCAGAAGACGGCATACGAGAT3’;见序列表3。序列表3优选地,所述S5标签是长度为4-15bp的随机核酸序列。优选地,S5标签用于区分样本,在同一个样本中,S5标签的序列一致,在不同样本中,S5标签的序列不同。优选地,不需要区分样本时,区分样本的标签可以省去。优选地,所述用于区分样本的标签位于PCR引物上。方案2:一种用于高通量测序标签的应用和文库构建的引物序列,如下:引物序列3:5’AATGATACGGCGACCACCGAGATCTACAC3’;见序列表4;引物序列4:5’CAAGCAGAAGACGGCATACGAGAT【S7标签】GTGACTGGAGTTCAGACG3’;见序列表4。序列表4优选地,所述S7标签是长度为4-15bp的随机核酸序列。优选地,S7标签用于区分样本,在同一个样本中,S7标签的序列一致,在不同样本中,S7标签的序列不同。优选地,S5标签和上述U7标签可以联合使用,S7标签和上述U5标签可以联合使用,S5标签和U5标签不可以联合使用;S7标签和U7标签不可以联合使用。优选地,不需要区分样本时,区分样本的标签可以省去。优选地,所述用于区分样本的标签位于PCR引物上。本专利技术的另一目的是提供一种高通量测序标签的应用和文库构建的方法,从多种途径区分位于基因组同一位置的不同DNA来源的测序片段,在不增加实验复杂程度和成本的情况下,有效去除测序片段中的测序错误,提高测序的特异性,从而提高测序灵敏性。本专利技术本文档来自技高网
...

【技术保护点】
1.一种高通量测序标签的应用和文库构建的方法,其步骤如下:(1)、片段DNA的获得或处理如果从样本中提取的DNA是长片段,通过物理超声破碎或酶处理的方式将DNA打断至所需的片段大小,并进行片段筛选;当提取的DNA是短片段时,则不需要进行DNA片段化处理;(2)、片段化DNA末端修复将片段化的DNA修复成平末端,5’端磷酸化修饰,3’端链接上腺苷酸,以满足连接接头序列的需要;(3)、加接头将带有标记核酸标签的接头与完成末端修复的片段化DNA相连接;(4)、纯化:去除多余的接头序列;(5)、PCR扩增:使用与接头序列相应的引物,进行PCR,扩增文库;根据是否需要区分样本,引物可以携带区分样本的标签;(6)、纯化:去除多余的引物序列;(7)、测序;依据illumina测序仪的要求,进行高通量测序。

【技术特征摘要】
1.一种高通量测序标签的应用和文库构建的方法,其步骤如下:(1)、片段DNA的获得或处理如果从样本中提取的DNA是长片段,通过物理超声破碎或酶处理的方式将DNA打断至所需的片段大小,并进行片段筛选;当提取的DNA是短片段时,则不需要进行DNA片段化处理;(2)、片段化DNA末端修复将片段化的DNA修复成平末端,5’端磷酸化修饰,3’端链接上腺苷酸,以满足连接接头序列的需要;(3)、加接头将带有标记核酸标签的接头与完成末端修复的片段化DNA相连接;(4)、纯化:去除多余的接头序列;(5)、PCR扩增:使用与接头序列相应的引物,进行PCR,扩增文库;根据是否需要区分样本,引物可以携带区分样本的标签;(6)、纯化:去除多余的引物序列;(7)、测序;依据illumina测序仪的要求,进行高通量测序。2.根据权利要求1所述的高通量测序标签的应用和文库构建的方法,其特征在于:所述步骤(7)之后,增加如下步骤,进行分析:(8)、分析:(8.1)根据样本标签和核酸标记标签,拆分出不同样本的数据;(8.2)按照常规的分析流程完成测序结果判读;(8.3)将拆分后的数据中,位于基因组同一位置的测序片段标记为冗余序列,去除冗余序列条数低于2-5个的冗余序列;(8.4)将保留下来的冗余序列合并成一条序列,将冗余序列上各个位置上超过80-95%的序列为合并后序列的序列;(8.5)将含有相同样本标签,不同核酸标签的拆分数据中的合并后序列合并,按照常规的分析流程完成最终测序结果判读。3.根据权利要求1所述的高通量测序标签的应用和文库构建的方法,其特征在于:所述步骤(3)中所述加接头具体如下:在一个样本中,使用含有多个核酸标记标签的接头序列,通过核酸标记标签随机标记片段化DNA分子,将位于基因组同一位置的不同片段化DNA分子带上含有不同核酸标记标签序列的接头分子。4.根据权利要求1所述的高通量测序标签的应用和文库构建的方法,其特征在于:所述步骤(3)中所述加接头具体如下:在一个样本中,使用含有多个核酸标记标签的接头序列,但是只含有一个样本标记标签的接头序列;在不同样本中,本标记标签的序列不同。5.一种用于高通量测序标签的应用和文库构建的接头序列,包括如下:接头序列1:5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’;接头序列2(含有标记核酸的标签):5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC【U7标签】ATCTCGTATGCCGTCTTCTGCTTG3’;优选地,所述U7标签是长度为4-15bp的随机核酸序列;优选地,在同一样本中,所述带有U7标签序列的接头的种类不少于24种:CGTGAT,ACATCG,GCCTAA,TGGTCA,CACTGT,ATTGGC,GATCTG,TCAAGT,CTGATC,AAGCTA,GTAGCC,TACAAG,AGTCAA,GGAACT,TGACAT,GGACGG,GCGGAC,TTTCAC,GGCCAC,CGAAAC,CGTACG,CCACTC,ATCAGT,ATTCCT;优选地,所述接头序列2是接头序列2-1至接头序列2-24,接头序列1...

【专利技术属性】
技术研发人员:古博
申请(专利权)人:古博
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1