病原物种特异PCR引物优化设计方法技术

技术编号:28042116 阅读:39 留言:0更新日期:2021-04-09 23:25
本发明专利技术提供一种病原物种特异PCR引物优化设计方法。所述引物优化设计方法使用K‑mer法鉴定物种的特异区间,基于特异片段作引物设计,确保了引物的物种特异性,避免了使用单一基因组造成的菌株特异性。

【技术实现步骤摘要】
病原物种特异PCR引物优化设计方法
本专利技术涉及生物信息学分析领域,特别是涉及一种特异PCR引物的设计优化方法。
技术介绍
聚合酶链式反应(PolymeraseChainReaction,PCR)作为最基础的分子生物学实验手段之一,能够在体外成百万倍地扩增目标DNA的拷贝数,因而被广泛应用于基因工程、基因诊断、目标序列富集等领域。其中引物设计的优劣是影响PCR试验的重要参数之一。在临床微生物诊断中,多重PCR检测、Illumina和三代Nanopore高通量平台已成为检测临床样本未知感染的重要检测手段。且近年已有通过PCR方法靶向富集病原区域来提升检测精准度的趋势。在这些检测手段中,设计灵敏、高效、物种特异的PCR引物成为了关键。针对微生物的PCR引物设计,现有方法主要为:1.基于16ribosomalRNA(rRNA)的引物设计;2.基于多重序列比对,获得同源性保守序列作兼并引物设计。然而这两种方法都有其局限性:1.不同微生物之间16SrRNA基因序列的高度相似性。基于16SrRNA只能在较高的分类水平(例如属和科)而不能在物种/菌株水平上可靠地鉴定微生物。即使在属级,许多研究者也报告了16SrRNA基因序列的分辨率问题,因此16SrRNA设计的引物并不适用于感染样本这种复杂环境中对菌株/物种水平上的微生物进行鉴定。2.基于多重序列比对进行兼并引物设计,1)前期需要大量有关目的微生物的背景知识调研积累;2)重复劳动,针对每一个目的物种,都需要重复构建多序列比对及同源性保守区域筛选;3)获得序列保守性的高低,会严重影响引物设计的灵敏度和特异性,4)兼并引物不能直接进行引物间相互作用的自由能评估,影响湿试验作多重PCR组合反应性能。因此基于多重序列比对设计兼并引物也不适用于大批量感染样本作多重PCR反应进行靶向富集。鉴于此,提出本专利技术。
技术实现思路
本专利技术要解决的技术问题是提供一种便捷的特异性PCR引物的设计方法,该方法的核心设计思路是:1.从目标物种多个基因组使用K-mer方法获取物种共有K-mer集合,避免使用单一基因组造成的菌株特异性;2.基于NCBIRefSeq库使用K-mer方法构建背景比对库,并对目标物种共有K-mer集合作比对,获取不包含在背景比对库中的物种特异K-mer集合,根据K-mer位置信息获取特异区间序列;3.对物种特异序列作PCR引物设计,引入引物间相互作用的结合自由能阈值ΔG等进行筛选过滤;4.引物经过与1600个临床微生物基因组作模板结合能力评估,确保引物与目标物种优先结合;5.构建microbial_nthash比对库,使用NCBI-ePCR软件获取引物的扩增区间target,提取序列作blast比对,确保引物的物种特异性。具体的,本专利技术首先提供了一种病原物种特异PCR引物优化设计方法,所述方法包括:1)从NCBIRefSeq/GenBank库中挑选n个目标物种的基因组;2)对步骤1)中的每一个基因组划分K-mer,分别作uniqueK-mer集合;3)对步骤2)中所有uniqueK-mer集合合并,挑选出频率大于等于n*p的K-mer,构建K-mer比对库;所述n取值1-10,优选10;所述p为概率值,取值0.5-1,优选0.8;4)从步骤1)中的基因组按最佳参考基因组的筛选规则顺序挑选目标物种的参考基因组,并将基因组划分K-mer集合,并记录所有K-mer的位置信息;优选的,所述最佳参考基因组的筛选规则顺序为“referencegenome>representativegenome>CompleteGenome>Chromosome>Scaffold>Contig”;5)对步骤4)中的K-mer集合和步骤3)中的比对库作比对,得到有比对结果的K-mer集合,此集合为物种水平共有序列K-mer集合;6)步骤5)中的K-mer集合与背景比对库作比对,获取未比对上背景库的K-mer集合,制备物种特异的K-mer集合;7)对物种特异K-mer集合根据步骤4)中记录的K-mer位置信息进行合并处理,整理成bed格式,并使用seqtk软件进行特异片段segments序列提取,制备物种特异序列集合;所述bed格式为基因组注释文件格式;8)对物种特异序列集合作长度L和窗口W片段序列切分,得到(L,W)segments序列集合;9)调用primer3软件对步骤8中的segments序列作引物设计。在一些方式中,所述步骤1)中,所述n可取值1-10,优选10;在一些方式中,所述步骤2)-3)中所述K-mer中的K可取值为18-20,优选为20。在一些方式中,所述步骤4)-7)中所述K-mer中的K取值为40-60,优选为50。在一些方式中,所述步骤8)中,当针对Illumina平台、微流控PCR平台作多重PCR反应时,L取值100-1000bp,优选200bp;W取值范围为100-1000p,优选100bp;进一步的,当针对Nanopore平台作多重PCR靶向富集时,L取值1500-3000bp,优选2000bp;W取值范围为1500-3000bp,优选1500bp。在一些方式中,所述步骤6)中背景比对库制备方法如下:d)获取NCBIRefSeq中所有微生物物种水平的参考基因组,对每一个基因组划分K-mer,形成uniqueK-mer集合,所述K取值为18-20;e)从微生物物种水平的uniqueK-mer集合中挑选出频率>=2的K-mer,作为候选K-mer集合,所述K取值为18-20;f)人基因组按步骤a)切分uniqueK-mer集合,与步骤b)的微生物物种水平的候选K-mer集合合并,用于构建K-merdb,获得背景比对库;所述K取值为18-20。在一些方式中,所述步骤9)中,所述引物设计满足以下任一条件或其组合:1)引物长度在18-25nt;2)GC含量在40-65%之间;3)退火温度Tm值在59-65之间;4)模板扩增长度在80-3000bp之间;5)引物间相互作用的结合自由能阈值ΔG为-4--9kcal/mol;6)引物不能出现超过4个连续重复碱基;7)引物间不能出现超过5个碱基的连续互补。本专利技术还提供了一种病原物种特异PCR引物优化设计装置,其特征在于,包括:至少一个存储器,用于存储程序;至少一个处理器,用于加载所述程序以执行上述的方法。本专利技术进一步提供了一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于实现如上述的方法。本专利技术最后提供了一种上述检测装置及存储介质在病原物种特异PCR引物设计的应用,尤其是在病原物种宏基因组测序领域中的特异PCR引物设计的应用。本专利技术有益的技术效果:1)本专利技术使用K-mer方法鉴定物种的特异区间,基于特异片段作引物设计确保了引本文档来自技高网
...

【技术保护点】
1.一种病原物种特异PCR引物优化设计方法,其特征在于,所述方法包括:/n1)从NCBI RefSeq/GenBank库中挑选n个目标物种的基因组;/n2)对步骤1)中的每一个基因组划分K-mer,分别作unique K-mer集合;/n3)对步骤2)中所有unique K-mer集合合并,挑选出频率大于等于n*p的K-mer,构建K-mer比对库;所述n取值1-10,优选10;所述p为概率值,取值0.5-1,优选0.8;/n4)从步骤1)中的基因组按最佳参考基因组的筛选规则顺序挑选目标物种的参考基因组,并将基因组划分K-mer集合,并记录所有K-mer的位置信息;优选的,所述最佳参考基因组的筛选规则顺序为“reference genome>representative genome>Complete Genome>Chromosome>Scaffold>Contig”;/n5)对步骤4)中的K-mer集合和步骤3)中的比对库作比对,得到有比对结果的K-mer集合,此集合为物种水平共有序列K-mer集合;/n6)步骤5)中的K-mer集合与背景比对库作比对,获取未比对上背景库的K-mer集合,制备物种特异的K-mer集合;/n7)对物种特异K-mer集合根据步骤4)中记录的K-mer位置信息进行合并处理,整理成bed格式,并使用seqtk软件进行特异片段segments序列提取,制备物种特异序列集合;所述bed格式为基因组注释文件格式;/n8)对物种特异序列集合作长度L和窗口W片段序列切分,得到(L,W)segments序列集合;/n9)调用primer3软件对步骤8中的segments序列作引物设计。/n...

【技术特征摘要】
1.一种病原物种特异PCR引物优化设计方法,其特征在于,所述方法包括:
1)从NCBIRefSeq/GenBank库中挑选n个目标物种的基因组;
2)对步骤1)中的每一个基因组划分K-mer,分别作uniqueK-mer集合;
3)对步骤2)中所有uniqueK-mer集合合并,挑选出频率大于等于n*p的K-mer,构建K-mer比对库;所述n取值1-10,优选10;所述p为概率值,取值0.5-1,优选0.8;
4)从步骤1)中的基因组按最佳参考基因组的筛选规则顺序挑选目标物种的参考基因组,并将基因组划分K-mer集合,并记录所有K-mer的位置信息;优选的,所述最佳参考基因组的筛选规则顺序为“referencegenome>representativegenome>CompleteGenome>Chromosome>Scaffold>Contig”;
5)对步骤4)中的K-mer集合和步骤3)中的比对库作比对,得到有比对结果的K-mer集合,此集合为物种水平共有序列K-mer集合;
6)步骤5)中的K-mer集合与背景比对库作比对,获取未比对上背景库的K-mer集合,制备物种特异的K-mer集合;
7)对物种特异K-mer集合根据步骤4)中记录的K-mer位置信息进行合并处理,整理成bed格式,并使用seqtk软件进行特异片段segments序列提取,制备物种特异序列集合;所述bed格式为基因组注释文件格式;
8)对物种特异序列集合作长度L和窗口W片段序列切分,得到(L,W)segments序列集合;
9)调用primer3软件对步骤8中的segments序列作引物设计。


2.权利要求1所述的病原物种特异PCR引物优化设计方法,其特征在于,所述步骤1)中,所述n取值1-10,优选10。


3.权利要求1-2任一所述的病原物种特异PCR引物优化设计方法,其特征在于,所述步骤2)-3)中所述K-mer中的K取值为18-20,优选为20。


4.权利要求1-3任一所述的病原物种特异PCR引物优化设计方法,其特征在于,所述步骤4)-7)中所述K-mer中的K取值为40-60,优选为5...

【专利技术属性】
技术研发人员:梁相志李振中周水莲何祥鹏潘吾思胥慧郭昊李诗濛任用
申请(专利权)人:江苏先声医疗器械有限公司江苏先声诊断技术有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1