基于核酸一致性的引物设计方法、系统及计算机存储介质技术方案

技术编号:37772464 阅读:15 留言:0更新日期:2023-06-06 13:38
本申请公开了基于核酸一致性的引物设计方法、系统及计算机存储介质,方法包括:获取靶向核酸序列;对靶向核酸序列进行分类,获得多个分类单元;将每个分类单元中的至少一条靶向核酸序列作为代表序列;设计代表序列的候选引物;依次选择每个分类单元的至多一对候选引物,建立候选引物池;将候选引物池中存在非特异性扩增的候选引物排除,获得最终的引物池。本申请操作简单,而且可以处理大量的核酸库,尤其适合针对病原体库的通用引物设计。相比同类软件本申请的方法更加系统全面,设计出的引物池覆盖度高且宿主污染率低。物池覆盖度高且宿主污染率低。物池覆盖度高且宿主污染率低。

【技术实现步骤摘要】
基于核酸一致性的引物设计方法、系统及计算机存储介质


[0001]本申请涉及生物医药
,特别涉及基于核酸一致性的引物设计方法、系统及计算机存储介质。

技术介绍

[0002]对常规PCR(Polymerase Chain Reaction,聚合酶链式反应)来说,一对好的引物是反应能否成功的关键,因此可以说引物设计是PCR的基础。常规PCR引物设计要考虑的因素很多,目前许多软件可以完成常规PCR引物设计。多重PCR是在常规PCR基础上发展而来的一种方法,在一个PCR反应体系内进行多个PCR反应,利用这一特性多重PCR反应可以高效系统的对疾病进行分型和检测病原体。
[0003]但是多重PCR的引物设计要比常规PCR引物设计更麻烦,因为其面对的是一系列靶向核酸序列,目前常用的方法有两种:一种是先多序列比对再使用degePrime或prider等软件挑选候选引物,然后使用常规PCR引物设计软件检验候选引物是否合适。这种方法由计算量指数巨大,而且引物的覆盖度很低。第二种方法是对靶向核酸逐一设计引物,然后再将设计好的引物混合,代表性的软件是MPprimer。这种方式会导致引物与引物间形成二聚体。
[0004]临床上的病原体检测一般分为两种情况:第一种待检病原体是某一类已知病原体,第二种无法判断需检测的病原体种类以及是否为混合感染。针对第一种情况,只需要检出该病毒即可,可是如果遇到病毒的变异程度高,基因组种类多且核酸序列一致性一般时,上述软件在设计通用引物时经常不适用。而第二种情况更为复杂,需要根据可能感染的病原体库检测,此时引物设计难点更多。可以发现临床病原体检测时引物设计难点不仅在于引物设计对象庞大,而且还需要多方面权衡考虑,排除其他污染。因此如何设计出包含最小数量、无引物特殊结构以及不会产生脱靶的引物池就成为多重PCR应用于临床检测的关键,这方面的研究有极高的应用价值却未有报道。

技术实现思路

[0005]本申请实施例提供了基于核酸一致性的引物设计方法、系统及计算机存储介质,用以解决现有技术中多重PCR引物设计存在的覆盖率低和易导致宿主污染的问题。
[0006]一方面,本申请实施例提供了基于核酸一致性的引物设计方法,包括:
[0007]获取靶向核酸序列;
[0008]对靶向核酸序列进行分类,获得多个分类单元;
[0009]将每个分类单元中的至少一条靶向核酸序列作为代表序列;
[0010]设计代表序列的候选引物;
[0011]依次选择每个分类单元的至多一对候选引物,建立候选引物池;
[0012]将候选引物池中存在非特异性扩增的候选引物排除,获得最终的引物池。
[0013]另一方面,本申请实施例还提供了基于核酸一致性的引物设计系统,包括:
[0014]序列获取模块,用于获取靶向核酸序列;
[0015]序列分类模块,用于对靶向核酸序列进行分类,获得多个分类单元;
[0016]代表序列查询模块,用于将每个分类单元中的至少一条靶向核酸序列作为代表序列;
[0017]候选引物设计模块,用于设计代表序列的候选引物;
[0018]候选引物池建立模块,用于依次选择每个分类单元的至多一对候选引物,建立候选引物池;
[0019]引物池过滤模块,用于将候选引物池中存在非特异性扩增的候选引物排除,获得最终的引物池。
[0020]另一方面,本申请实施例还提供了一种计算机存储介质,该计算机存储介质中存储有多条计算机指令,该多条计算机指令用于使计算机执行上述的方法。
[0021]本申请中的基于核酸一致性的引物设计方法、系统及计算机存储介质,具有以下优点:
[0022]操作简单,而且可以处理大量的核酸库,尤其适合针对病原体库的通用引物设计。相比同类软件本申请的方法更加系统全面,设计出的引物池覆盖度高且宿主污染率低。
附图说明
[0023]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1为本申请实施例提供的基于核酸一致性的引物设计方法的流程图;
[0025]图2为本申请实施例提供的核心分类单元的序列比重示意图;
[0026]图3为本申请实施例提供的总引物池和核心引物池的覆盖度示意图;
[0027]图4为本申请实施例提供的五类病毒的引物池覆盖度示意图;
[0028]图5为本申请实施例提供的五类病毒的序列一致性示意图;
[0029]图6为本申请实施例提供的五类病毒的分类单元数量示意图;
[0030]图7为实验中degePrime设计的通用引物脱靶位置示意图。
具体实施方式
[0031]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0032]申请人在研究中发现,目前常用的多重PCR引物设计方法中,第一种先多序列比对再使用degePrime(Hugerth et al.,2014)或prider(Smolander et al.,2022)的方法由于其依赖多序列比对而局限性很大,多序列比对过程随着序列的增加计算量指数增加,当超过1000条序列时大部分比对软件(例如MUSCLE(Edgar et al.,2004)等)都无法运行;而且如果序列数目过多,序列间一致性必然差,这时即使多重比对也无法得到保守区域,因此无法获得高覆盖度引物。第二种对靶向核酸逐一设计引物,然后再将设计好的引物混合的方
法只适用于待检数量很少的情况,因为随着目标核酸的数目增加,引物数量也会增加,引物与引物间形成二聚体的机会就增加,当引物达到一定数量时必然有二聚体,引物二聚体会导致PCR的过程中引物自身扩增而靶向序列没有扩增。在临床上检测中,针对无法判断需检测的病原体种类以及是否为混合感染的情况,引物设计存在诸多难点,首先病毒库内病毒种类多,每个病毒的核酸种类也多(例如人冠状病毒,NCBI中记载有数十万条序列);其次,为了检出病毒,病毒库内每种病毒都需要最大程度的设计通用引物因而会增加了引物间形成二聚体的风险。另外这两种情况都需要面对另一个问题是宿主基因组污染,在病原体检测时提取的核酸是无法避免宿主污染的,因此需要在引物设计之初就需要预测脱靶位置并排除脱靶情况。因此,可以看出现有的引物设计方法还存在设计出的引物覆盖率低和宿主污染率高的问题。
[0033]针对现有技术中的问题,本申请首先将靶向核酸序列分类,然后为每个分类单元中的代表序列设计相应的候选引物,由于同一个分类单元中的靶向核酸序列具有较高的一致性,因此设计的候选引本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于核酸一致性的引物设计方法,其特征在于,包括:获取靶向核酸序列;对所述靶向核酸序列进行分类,获得多个分类单元;将每个所述分类单元中的至少一条靶向核酸序列作为代表序列;设计所述代表序列的候选引物;依次选择每个所述分类单元的至多一对候选引物,建立候选引物池;将所述候选引物池中存在非特异性扩增的候选引物排除,获得最终的引物池。2.根据权利要求1所述的基于核酸一致性的引物设计方法,其特征在于,所述将每个所述分类单元中的至少一条靶向核酸序列作为代表序列,包括:将所述分类单元中长度符合要求的靶向核酸序列作为代表序列;确定所述分类单元中其他靶向核酸序列与所述代表序列的相似性,将相似性达到相似性阈值的靶向核酸序列也作为所述代表序列。3.根据权利要求2所述的基于核酸一致性的引物设计方法,其特征在于,还包括:当所述代表序列的数量超过数量阈值时,随机选择一定数量的代表序列作为最终的代表序列。4.根据权利要求1所述的基于核酸一致性的引物设计方法,其特征在于,在设计得到所述候选引物后,还将所述候选引物按照所在的所述分类单元以引物效率从高到低的顺序排序,排序后按照所述候选引物的顺序依次选择每个所述分类单元的至多一对候选引物建立所述候选引物池。5.根据权利要求1所述的基于核酸一致性的引物设计方法,其特征在于,在选择所述分类单元的候选引物加入所述候选引物池时,确定待加入的所述候选引物与已经加入至所述候选引物池的候选引物是否存在互作,如果不存在互作则加入至所述候选引物池,如果存在互作则不加入至所述候选引物池。6.根据权利要求5所述的基于核...

【专利技术属性】
技术研发人员:夏涵官远林杨军波魏康飞段美琳牛毓龙胡龙穆西玉骆晨
申请(专利权)人:西咸新区予果微码生物科技有限公司予果智造科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1