基于NGS读段搜索实现序列延伸的虚拟PCR方法技术

技术编号:19926245 阅读:60 留言:0更新日期:2018-12-29 02:02
本发明专利技术公开了一种基于NGS读段搜索实现序列延伸的虚拟PCR方法。该方法首先基于NGS测序技术对试验样品全基因组进行一次深度较高的高通量测序,获得覆盖全基因组的海量测序读段(reads);再结合生物信息学方法,搜索测序读段,根据搜索结果在程序中实现序列延伸,从而建立序列片段重叠群(contig),继而实现目的基因在虚拟程序中的扩增。该方法的扩增片段更长,远高于Wet Lab PCR中酶与反应体系的限制;扩增周期更短,通常只需要半天即可完成5k碱基的延伸;无需实际操作PCR实验,在程序中即可获得目的基因的序列信息,成本低;可一次性扩增几十甚至于几百条序列,效率高。

【技术实现步骤摘要】
基于NGS读段搜索实现序列延伸的虚拟PCR方法
本专利技术涉及生物信息学或分子生物学领域,具体涉及一种基于NGS读段搜索实现序列延伸的虚拟PCR方法的方法。
技术介绍
聚合酶链式反应(PCR)是一种用于放大扩增特定的DNA片段的分子生物学技术,它可看作是生物体外的特殊DNA复制。PCR技术的基本原理类似于DNA的天然的半保留复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火--延伸三个基本反应步骤构成,不断重复循环变性--退火--延伸三过程就可将待扩增的目的基因扩增放大几百万倍。测序读段(reads)是通过NGS测序又称二代测序获得的。目前高通量测序的主要平台代表有罗氏公司(Roche)的454测序仪(RochGSFLXsequencer),Illumina公司的Solexa基因组分析仪(IlluminaGenomeAnalyzer)和ABI的SOLiD测序仪(ABISOLiDsequencer)。不同的NGS平台均可并行地对数百万个小DNA片段进行测序,而获得海量测序数据即测序读段(reads)。这些读段组合在一起可进行基因组的组装,也可将每个读段映射到参本文档来自技高网...

【技术保护点】
1.基于NGS读段搜索实现序列延伸的虚拟PCR方法,其特征在于,利用对测序读段的搜索来建立序列片段重叠群从而在不进行实际的PCR仪器操作的情况下,在程序中实现模拟PCR扩增目的基因的过程。

【技术特征摘要】
1.基于NGS读段搜索实现序列延伸的虚拟PCR方法,其特征在于,利用对测序读段的搜索来建立序列片段重叠群从而在不进行实际的PCR仪器操作的情况下,在程序中实现模拟PCR扩增目的基因的过程。2.如权利要求1所述的虚拟PCR方法,其特征在于,包括如下步骤:1)对实验材料的全基因NGC测序:选择所需的实验材料提取长片段DNA,将长片段DNA打断后加载到基因芯片中,使用测序仪进行边合成边测序,获得样品的短片段90-150bp成对的测序读段数据;2)测序读段数据的预处理:将步骤1)中获得的测序读段数据去除测序重复,去除测序接头、Barcode及低质量数据;3)虚拟PCR过程:在不进行实际的PCR仪器操作的情况下,在程序中模拟PCR扩增目的基因的过程,从而获得目的基因的扩增序列。3.如权利要求2所述的虚拟PCR方法,其特征在于,所述的NGC测序的覆盖度不低于50X。4.如权利要求2或3所述的虚拟PCR方法,其特征在于,所述的步骤3)的虚拟PCR过程,包括以下步骤:a)引物设计:利用目的片段S1的两端侧翼分别设计3’及5’端长度为30-40bp的虚拟引物一对,这两个引物分别称为seed_L与seed_R;b)3’端的延伸:在程序起始设定预期延伸长度,并输入初始引物及全部的测序读段数据,在测序读段数据中搜索seed_L引物序列,并按照seed_L在测序读段数据中从左到右位置的顺序对搜索击中的测序读段进行排序,选择排列第一位的测序读段,截取其上seed_L右侧的序列进行延伸,同时以该被截取的序列最右侧30-40bp序列作为新的seed_L,继续搜索-延伸,如此循环直至向右延伸到设定的长度形成Contig_L1,同理以seed_L的反向互补序列seed_L_rever...

【专利技术属性】
技术研发人员:段乃彬王效睦马玉敏宫永超谢坤白静杨永义
申请(专利权)人:山东省农作物种质资源中心
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1