一种兼并引物的设计筛选方法技术

技术编号:25693343 阅读:29 留言:0更新日期:2020-09-18 21:04
本发明专利技术提供一种兼并引物的设计筛选方法。本发明专利技术所述方法通过多重比对、k‑mer划分、制备兼并k‑mer、获得候选引物集以及组合引物对等步骤,实现对多种物种基因设计兼并引物,并筛选出最佳兼并引物对。

【技术实现步骤摘要】
一种兼并引物的设计筛选方法
本专利技术涉及生物信息学分析领域,特别是涉及一种兼并引物的设计筛选方法。
技术介绍
在临床病原诊断领域,常用检测方法为PCR扩增、16SrRNA测序和宏基因组测序,其中PCR扩增主要面向靶向扩增检测,16S测序物种区分度不足以作病原鉴定,宏基因组测序在解决大量的宿主DNA占比问题上仍有很大的挑战。鉴于常规检测方法中的各种局限和挑战,提供一套临床常见病原菌的靶向检测解决方案尤为重要。病原靶向检测需要富集目标物种特定序列后测序作物种鉴定,达到临床关注病原检测的目的。这就要求富集引物能够覆盖到多种病原物种,且富集序列需具备一定地物种区分度用于后续作物种鉴定分析。靶向富集技术需要在物种序列的保守区设计兼并引物,同时要求富集区间包含一定比例地可变区用于物种区分。靶向富集序列可应用于下一代测序(NextGenerationSequencing,NGS)和纳米孔测序(OxfordNanoporeTechnologies,ONT)。关于靶向富集引物的设计筛选,现有技术主要根据蛋白保守性domain结构作兼并引物设计,该方法需要预知基因对应地蛋白序列,且引物对组合时具有一定地随意性,比较适用于同属相似物种间的引物设计,而对于非相似物种的引物设计并不适用。目前linux端引物设计经常调用primer3软件,但该软件只适用于提供特定序列设计非兼并引物,并不支持兼并引物设计。为推进靶向富集在临床病原检测中的应用,亟需开发一种靶向富集兼并引物的设计筛选方法。有鉴于此,提出本专利技术。
技术实现思路
本专利技术要解决的技术问题是提供一种兼并引物的设计筛选方法。考虑到病原靶向检测需要富集目标物种特定序列,然后测序进行物种鉴定,以达到临床病原检测目的,这就要求富集引物能够覆盖到多种病原物种,且富集序列需具备一定地物种区分度用于后续物种鉴定分析。为推进靶向富集在临床病原检测中的应用,本专利技术通过深入挖掘大量多物种序列数据,从物种基因或全基因组多重序列比对结果入手,惊奇发现在多物种基因多重序列比对下,可通过k-mer方法将所有序列划分为k长度的短序列,便于后续对引物设计区域进行筛选。同时为了设计兼并引物,本专利技术还开发了一种碱基转码规则及其反向互补规则,在物种个数等于序列数时,保障了引物设计区域的特异性,对该区域的k-mer进行碱基转码形成兼并k-mer,同时记录其位置信息和反向互补序列,进一步对兼并k-mer以不同引物长度L进行划分,便于筛选最优引物对。基于对此的研究发现,本专利技术构建了一套兼并引物的设计筛选方法,并通过大量多物种兼并引物设计对该方法进行验证,又利用生信、湿实验方法对兼并引物进行特异性验证,结果表明该方法所设计出的兼并引物可以对多物种进行特异性扩增。因此,本专利技术的第一目的是提供一种兼并引物的设计筛选方法。本专利技术的第二目的是提供一种兼并引物的设计筛选产品。为实现上述目的,本专利技术采用如下技术方案:一种兼并引物的设计筛选方法,所述方法包括:1)多重比对:物种序列进行多重比对;2)k-mer划分:多重比对序列进行k-mer划分;3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-merF引物集合和候选k-merR引物集合;5)组合引物对:对候选k-merF引物集合和候选k-merR引物集合中的引物进行两两引物对组合,筛选最优引物对。在一些实施方式中,所述步骤5)中筛选的条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。在一些实施方式中,所述步骤3)还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;在一些优选的实施方式中,所述P(max)取值范围为20%-30%;更优选地为25%。在一些实施方式中,所述步骤3)中基础引物设计条件为:序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。在一些实施方式中,所述步骤3)中碱基转码规则为A→A,T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;转码后的反向互补规则为A→T,T→A,C→G,G→C,R→Y,Y→R,M→K,K→M,S→S,W→W,H→D,D→H,B→V,V→B,N→N;在一些实施方式中,所述步骤5)中兼并引物Tm值计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3),兼并引物GC含量计算公式为GC=(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。在一些实施方式中,所述步骤2)中所述k-mer,k取值范围为20-38;优选为25。在一些实施方式中,所述步骤4)中所述L取值范围为L(min)≤L≤k;L(min)取值范围为18-21,优选为20。在一些实施方式中,所述步骤5)中所述引物对组合取决于目标扩增区间长度T,T的取值范围为80-5k;优选为1-5k。本专利技术还提供一种兼并引物的设计筛选系统/装置/产品,其特征在于,所述系统/装置/产品包含如下模块:1)多重比对模块:物种序列进行多重比对;2)k-mer划分模块:多重比对序列进行k-mer划分;3)形成兼并k-mer模块:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;4)形成候选引物集合模块:以不同引物长度L划分步骤3)后的序列,分别形成候选k-merF引物集合和候选k-merR引物集合;5)组合引物对模块:对候选k-merF引物集合和候选k-merR引物集合中的引物进行两两引物对组合,筛选最优引物对。在一些实施方式中,所述5)组合引物对模块中筛选条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。在一些实施方式中,所述3)形成兼并k-mer模块还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;优选地,所述P(max)取值范围为20%-30%,更优选地为25%;在一些实施方式中,所述3)形成兼并k-mer模块中,基础引物设计条件为序列不存在gap,GC含量为40%-60%,引物Tm为50-70本文档来自技高网
...

【技术保护点】
1.一种兼并引物的设计筛选方法,其特征在于,所述方法包括:/n1)多重比对:物种序列进行多重比对;/n2)k-mer划分:多重比对序列进行k-mer划分;/n3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;/n4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-mer F引物集合和候选k-mer R引物集合;/n5)组合引物对:对候选k-mer F引物集合和候选k-mer R引物集合中的引物进行两两引物对组合,筛选最优引物对。/n

【技术特征摘要】
1.一种兼并引物的设计筛选方法,其特征在于,所述方法包括:
1)多重比对:物种序列进行多重比对;
2)k-mer划分:多重比对序列进行k-mer划分;
3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;
4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-merF引物集合和候选k-merR引物集合;
5)组合引物对:对候选k-merF引物集合和候选k-merR引物集合中的引物进行两两引物对组合,筛选最优引物对。


2.根据权利要求1所述的设计筛选方法,其特征在于,所述步骤5)中筛选的条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。


3.根据权利要求1-2任一所述的设计筛选方法,其特征在于,所述步骤3)还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;优选地,所述P(max)取值范围为20%-30%,更优选地为25%。


4.根据权利要求1-3任一所述的设计筛选方法,其特征在于,所述步骤3)中基础引物设计条件为:序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。


5.根据权利要求1-4任一所述的设计筛选方法,其特征在于,所述步骤3)中碱基转码规则为A→A,T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;转码后的反向互补规则为A→T,T→A,C→G,G→C,R→Y,Y→R,M→K,K→M,S→S,W→w,H→D,D→H,B→V,V→B,N→N;所述步骤5)中兼并引物Tm值计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3),兼并引物GC含量计算公式为GC=(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。


6.根据权利要求1-5任一所述的设计筛选方法,其特征在于,所述步骤2)中所述k-mer,k取值范围为20-38,优选为25。


7.根据权利要求1-6任一所述的设计筛选方法,其特征在于,所述步骤4)中所述L取值范围为L(min)≤L≤k;L(min)取值范围为18-21,优选为20。


8.根据权利要求1-7任一所述的设计筛选方法,其特征在于,所述步...

【专利技术属性】
技术研发人员:梁相志周水莲胡龙张烨任用
申请(专利权)人:江苏先声医学诊断有限公司北京先声医学检验实验室有限公司江苏先声医疗器械有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1