【技术实现步骤摘要】
一种兼并引物的设计筛选方法
本专利技术涉及生物信息学分析领域,特别是涉及一种兼并引物的设计筛选方法。
技术介绍
在临床病原诊断领域,常用检测方法为PCR扩增、16SrRNA测序和宏基因组测序,其中PCR扩增主要面向靶向扩增检测,16S测序物种区分度不足以作病原鉴定,宏基因组测序在解决大量的宿主DNA占比问题上仍有很大的挑战。鉴于常规检测方法中的各种局限和挑战,提供一套临床常见病原菌的靶向检测解决方案尤为重要。病原靶向检测需要富集目标物种特定序列后测序作物种鉴定,达到临床关注病原检测的目的。这就要求富集引物能够覆盖到多种病原物种,且富集序列需具备一定地物种区分度用于后续作物种鉴定分析。靶向富集技术需要在物种序列的保守区设计兼并引物,同时要求富集区间包含一定比例地可变区用于物种区分。靶向富集序列可应用于下一代测序(NextGenerationSequencing,NGS)和纳米孔测序(OxfordNanoporeTechnologies,ONT)。关于靶向富集引物的设计筛选,现有技术主要根据蛋白保守性domain结构作兼并引物设计,该方法需要预知基因对应地蛋白序列,且引物对组合时具有一定地随意性,比较适用于同属相似物种间的引物设计,而对于非相似物种的引物设计并不适用。目前linux端引物设计经常调用primer3软件,但该软件只适用于提供特定序列设计非兼并引物,并不支持兼并引物设计。为推进靶向富集在临床病原检测中的应用,亟需开发一种靶向富集兼并引物的设计筛选方法。有鉴于此,提出本专利技术。 ...
【技术保护点】
1.一种兼并引物的设计筛选方法,其特征在于,所述方法包括:/n1)多重比对:物种序列进行多重比对;/n2)k-mer划分:多重比对序列进行k-mer划分;/n3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;/n4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-mer F引物集合和候选k-mer R引物集合;/n5)组合引物对:对候选k-mer F引物集合和候选k-mer R引物集合中的引物进行两两引物对组合,筛选最优引物对。/n
【技术特征摘要】
1.一种兼并引物的设计筛选方法,其特征在于,所述方法包括:
1)多重比对:物种序列进行多重比对;
2)k-mer划分:多重比对序列进行k-mer划分;
3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;
4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-merF引物集合和候选k-merR引物集合;
5)组合引物对:对候选k-merF引物集合和候选k-merR引物集合中的引物进行两两引物对组合,筛选最优引物对。
2.根据权利要求1所述的设计筛选方法,其特征在于,所述步骤5)中筛选的条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。
3.根据权利要求1-2任一所述的设计筛选方法,其特征在于,所述步骤3)还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;优选地,所述P(max)取值范围为20%-30%,更优选地为25%。
4.根据权利要求1-3任一所述的设计筛选方法,其特征在于,所述步骤3)中基础引物设计条件为:序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。
5.根据权利要求1-4任一所述的设计筛选方法,其特征在于,所述步骤3)中碱基转码规则为A→A,T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;转码后的反向互补规则为A→T,T→A,C→G,G→C,R→Y,Y→R,M→K,K→M,S→S,W→w,H→D,D→H,B→V,V→B,N→N;所述步骤5)中兼并引物Tm值计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3),兼并引物GC含量计算公式为GC=(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。
6.根据权利要求1-5任一所述的设计筛选方法,其特征在于,所述步骤2)中所述k-mer,k取值范围为20-38,优选为25。
7.根据权利要求1-6任一所述的设计筛选方法,其特征在于,所述步骤4)中所述L取值范围为L(min)≤L≤k;L(min)取值范围为18-21,优选为20。
8.根据权利要求1-7任一所述的设计筛选方法,其特征在于,所述步...
【专利技术属性】
技术研发人员:梁相志,周水莲,胡龙,张烨,任用,
申请(专利权)人:江苏先声医学诊断有限公司,北京先声医学检验实验室有限公司,江苏先声医疗器械有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。