The invention discloses a library construction method and reagent for large sample size hybrid library construction of PCR products based on high-throughput sequencing. Methods: Each of the multiple PCR products from different samples was annealed with random primers with tagged sequences, and isothermal amplification was performed under the action of isothermal amplification enzymes; the isothermal amplification products from different sources were mixed and fragments were selected; the fragments were selected. The selected products were repaired by 5'-phosphorylated flat-end repair and 3'-terminal plus A reaction; ligated to the junction sequence to obtain the ligated products which could distinguish library information; and the ligated products were amplified by PCR to obtain the on-line library suitable for high-throughput sequencing. The invention does not depend on ultrasonic interrupting instrument, realizes mixed database building, reduces database building cost and complexity, reduces data waste, improves base randomness and coverage depth uniformity of sequencing data, and thus reduces the sequencing cost of a single sample.
【技术实现步骤摘要】
基于高通量测序的PCR产物大样本量混合建库的文库构建方法和试剂
本专利技术涉及文库构建
,尤其涉及一种基于高通量测序的PCR产物大样本量混合建库的文库构建方法和试剂。
技术介绍
随着测序技术的发展,基因测序已进入千元基因组时代,但是对全基因组进行测序,其测序成本及分析成本依然是非常昂贵的。因此对外显子区域或者感兴趣的特定区域进行捕获测序则更符合实际需求。对于少数几个或者数十个目的基因扩增序列的二代测序文库构建,常常采用单管扩增后混合建库或者多重PCR。由于每个样本的目标区域小,而数据需求量低,所以一般都需要对成百上千个样本进行混合测序,而在常规的文库构建方法情况下,是先将样本DNA进行打断,再在加接头环节将不同样本的插入片段分别加上带有不同文库标签序列的接头,以便于下机数据进行样本的拆分。上述方法工作量大,难以进行大样本量的混合建库。常规的高通量测序小片段文库的构建方法,是将样本DNA分别进行随机打断,进行末端修复及加“A”碱基,再给不同样本的DNA片段分别加上带有不同标签序列的接头,加接头产物即可进行混合建库上机。该方法由于需要对每个样本单独进行酶反应及纯化,建库成本高、工作量大,而且依赖于超声波打断设备。为了降低建库的成本及工作量,实现大样本的混合建库,需尽可能在更早的环节在不同样本的PCR产物上加上用以区分样本的标签序列。除了上述的常规建库方法外,一种方法是在PCR环节,在特异性引物的5’端加上特定的标签序列,PCR产物混合后经不完全随机打断后建库并进行双端测序,部分插入片段带有标签序列则可区分样本信息,而部分不带有标签序列的数据则为无效数据。 ...
【技术保护点】
1.一种基于高通量测序的PCR产物大样本量混合建库的文库构建方法,其特征在于,包括:(1)将来源于不同样本DNA的多个PCR产物中的每一个,分别与带有标签序列的随机引物进行退火,并在恒温扩增酶的作用下进行恒温扩增反应,得到能够区分样本来源的恒温扩增产物,其中所述带有标签序列的随机引物的序列结构如下:X(m)N(n),其中X(m)表示标签序列,其长度为4~15个碱基,用于区分样本来源;N(n)表示随机碱基序列,其长度为6~10个碱基,用于与所述PCR产物随机结合;(2)将不同样本来源的恒温扩增产物混合,并对混合产物进行片段选择;(3)对所述片段选择的产物进行5’磷酸化平末端修复和3’末端加A反应,以得到具有5’磷酸化和3’粘性末端A的DNA片段;(4)将所述DNA片段与接头序列连接,以得到能够区分文库信息的连接产物,其中所述接头序列含有用于区分文库的条形码序列;(5)对所述连接产物进行PCR扩增,以得到适用于高通量测序的上机文库。
【技术特征摘要】
1.一种基于高通量测序的PCR产物大样本量混合建库的文库构建方法,其特征在于,包括:(1)将来源于不同样本DNA的多个PCR产物中的每一个,分别与带有标签序列的随机引物进行退火,并在恒温扩增酶的作用下进行恒温扩增反应,得到能够区分样本来源的恒温扩增产物,其中所述带有标签序列的随机引物的序列结构如下:X(m)N(n),其中X(m)表示标签序列,其长度为4~15个碱基,用于区分样本来源;N(n)表示随机碱基序列,其长度为6~10个碱基,用于与所述PCR产物随机结合;(2)将不同样本来源的恒温扩增产物混合,并对混合产物进行片段选择;(3)对所述片段选择的产物进行5’磷酸化平末端修复和3’末端加A反应,以得到具有5’磷酸化和3’粘性末端A的DNA片段;(4)将所述DNA片段与接头序列连接,以得到能够区分文库信息的连接产物,其中所述接头序列含有用于区分文库的条形码序列;(5)对所述连接产物进行PCR扩增,以得到适用于高通量测序的上机文库。2.根据权利要求1所述的文库构建方法,其特征在于,所述标签序列X(m)长度为6个碱基,所述随机碱基序列N(n)长度为6个碱基。3.根据权利要求1或2所述的文库构建方法,其特征在于,所述步骤(1)中的PCR产物是目标区域特异性PCR产物。4.根据权利要求1或2所述的文库构建方法,其特征在于,所述步骤(1)中的PCR产物是单重或者多重PCR反应的产物,其长度大于400bp。5.根据权利要求1或2所述的文库构建方法,其特征在于,所述步骤(1)中的PCR产物的量是10-50ng。6.根据权利要求...
【专利技术属性】
技术研发人员:陈建国,陈川,张静,王瑢,杨传春,张文勇,
申请(专利权)人:深圳市乐土精准医疗科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。