【技术实现步骤摘要】
一种高通量测序标签的应用和文库构建的方法
本专利技术涉及一种高通量测序标签的应用和文库构建的方法,属于生物
技术介绍
高通量测序(High-throughputsequencing,又称为下一代测序,Nextgenerationsequencing,NGS)是在一次实验中同时进行数亿计的DNA分子序列测序的功能强大的实验技术。以人类基因组重新测序为例,在得到人类基因组蓝图后,要想知道某个人基因组和人类基因组蓝图的差异,即其自身特异的基因特征,就需要对某个人的基因组进行重新测序。然后,人类基因组包含约30亿个碱基对(basepair,bp),传统测序方法,每个反应仅能测约1000个碱基对,需要300万个反应才能够完成一个人的基因组重测序,在工作量和成本上都是难以想象的。使用高通量测序技术,在一次实验中即可以完成数百万个DNA分子的测序,从而实现了在一个反应中,完成人类基因组重新测序,同时大大降低了测序成本。以人类基因组重新测序为例,常规的高通量测序过程包含:基因组DNA提取,DNA片段化处理,DNA碎片末端补平和磷酸化修饰,将高通量测序仪能够识别的接头序列链接至修复好的DNA碎片上,产物纯化,PCR扩增,产物纯化,质检,上机进行高通量测序。PCR扩增后得到的测序文库,其中含有众多的测序片段。PCR扩增和测序的过程中,准确性都不是100%,从而会引入一定比例的错误,后续的测序结果数据分析过程,能够一定程度上降低错误发生的概率。其方法是:首先,将两端的序列一致的测序片段(称为冗余序列)合并成一个测序片段(去冗余);其次,用在基因组上有交集的不同测序片段 ...
【技术保护点】
1.一种高通量测序标签的应用和文库构建的方法,其步骤如下:(1)、片段DNA的获得或处理如果从样本中提取的DNA是长片段,通过物理超声破碎或酶处理的方式将DNA打断至所需的片段大小,并进行片段筛选;当提取的DNA是短片段时,则不需要进行DNA片段化处理;(2)、片段化DNA末端修复将片段化的DNA修复成平末端,5’端磷酸化修饰,3’端链接上腺苷酸,以满足连接接头序列的需要;(3)、加接头将带有标记核酸标签的接头与完成末端修复的片段化DNA相连接;(4)、纯化:去除多余的接头序列;(5)、PCR扩增:使用与接头序列相应的引物,进行PCR,扩增文库;根据是否需要区分样本,引物可以携带区分样本的标签;(6)、纯化:去除多余的引物序列;(7)、测序;依据illumina测序仪的要求,进行高通量测序。
【技术特征摘要】
1.一种高通量测序标签的应用和文库构建的方法,其步骤如下:(1)、片段DNA的获得或处理如果从样本中提取的DNA是长片段,通过物理超声破碎或酶处理的方式将DNA打断至所需的片段大小,并进行片段筛选;当提取的DNA是短片段时,则不需要进行DNA片段化处理;(2)、片段化DNA末端修复将片段化的DNA修复成平末端,5’端磷酸化修饰,3’端链接上腺苷酸,以满足连接接头序列的需要;(3)、加接头将带有标记核酸标签的接头与完成末端修复的片段化DNA相连接;(4)、纯化:去除多余的接头序列;(5)、PCR扩增:使用与接头序列相应的引物,进行PCR,扩增文库;根据是否需要区分样本,引物可以携带区分样本的标签;(6)、纯化:去除多余的引物序列;(7)、测序;依据illumina测序仪的要求,进行高通量测序。2.根据权利要求1所述的高通量测序标签的应用和文库构建的方法,其特征在于:所述步骤(7)之后,增加如下步骤,进行分析:(8)、分析:(8.1)根据样本标签和核酸标记标签,拆分出不同样本的数据;(8.2)按照常规的分析流程完成测序结果判读;(8.3)将拆分后的数据中,位于基因组同一位置的测序片段标记为冗余序列,去除冗余序列条数低于2-5个的冗余序列;(8.4)将保留下来的冗余序列合并成一条序列,将冗余序列上各个位置上超过80-95%的序列为合并后序列的序列;(8.5)将含有相同样本标签,不同核酸标签的拆分数据中的合并后序列合并,按照常规的分析流程完成最终测序结果判读。3.根据权利要求1所述的高通量测序标签的应用和文库构建的方法,其特征在于:所述步骤(3)中所述加接头具体如下:在一个样本中,使用含有多个核酸标记标签的接头序列,通过核酸标记标签随机标记片段化DNA分子,将位于基因组同一位置的不同片段化DNA分子带上含有不同核酸标记标签序列的接头分子。4.根据权利要求1所述的高通量测序标签的应用和文库构建的方法,其特征在于:所述步骤(3)中所述加接头具体如下:在一个样本中,使用含有多个核酸标记标签的接头序列,但是只含有一个样本标记标签的接头序列;在不同样本中,本标记标签的序列不同。5.一种用于高通量测序标签的应用和文库构建的接头序列,包括如下:接头序列1:5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’;接头序列2(含有标记核酸的标签):5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC【U7标签】ATCTCGTATGCCGTCTTCTGCTTG3’;优选地,所述U7标签是长度为4-15bp的随机核酸序列;优选地,在同一样本中,所述带有U7标签序列的接头的种类不少于24种:CGTGAT,ACATCG,GCCTAA,TGGTCA,CACTGT,ATTGGC,GATCTG,TCAAGT,CTGATC,AAGCTA,GTAGCC,TACAAG,AGTCAA,GGAACT,TGACAT,GGACGG,GCGGAC,TTTCAC,GGCCAC,CGAAAC,CGTACG,CCACTC,ATCAGT,ATTCCT;优选地,所述接头序列2是接头序列2-1至接头序列2-24,接头序列1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。