引物探针序列组合设计方法和装置制造方法及图纸

技术编号:37596167 阅读:30 留言:0更新日期:2023-05-18 11:43
本申请涉及一种引物探针序列组合设计方法,包括以下步骤:获取基于目标模板序列生成的引物探针序列组合集,引物探针序列组合集包括至少一个用于对目标模板执行甲基化检测的引物探针序列组合,每个引物探针序列组合用相应的参数信息表示,参数信息用于确定相应的引物探针序列组合的序列特征;构建评分模型,评分模型用于根据引物探针序列组合的序列特征计算引物探针序列组合的评分;采用优化算法在引物探针序列组合集中搜索评分模型的最优解处理评分模型,根据最优解对应的参数信息输出相应的引物探针序列组合作为目标引物探针序列组合。本申请能够有效筛选扩增性能高、特异性高的引物对和探针检测甲基化的DNA,节约筛选的人工成本和耗材成本。选的人工成本和耗材成本。选的人工成本和耗材成本。

【技术实现步骤摘要】
引物探针序列组合设计方法和装置


[0001]本申请涉及生物信息学
,具体而言,涉及一种引物探针序列组合设计方法和装置。

技术介绍

[0002]DNA甲基化指在DNA甲基转移酶的作用下,以S

腺苷甲硫氨酸作为甲基供体,将一个甲基基团共价转移到核苷酸上,最常见的是将甲基基团转移到胞嘧啶碱基第5位的碳原子上,生成5

甲基胞嘧啶。在哺乳动物的个体发育过程中,DNA的甲基化在调控基因表达、形成基因组印记及X染色体失活中起着重要作用。DNA甲基化不仅能够维持正常的生物功能,其异常可导致多种疾病的发生,如生长发育、行为异常以及癌症的发生和发展。因此,对基因中的特异位点进行甲基化检测有利于深入了解和阐明甲基化的生物学功能,也有利于筛查、诊断和评估疾病及其进展情况。
[0003]甲基化特异性PCR是一种经典的检测基因特定位点甲基化水平的方法,其引物设计的主要方法为:DNA首先用亚硫酸氢盐处理,并针对DNA序列中富含C的区域设计引物,同时CpG二核苷酸位点尽量位于引物的3

端,以区分甲基化和未甲基化的模板。甲基化特异性PCR法需要电泳检测或桑格尔测序来分析结果,步骤较为繁琐。
[0004]利用甲基化特异性引物和TaqMan MGB探针来覆盖甲基化位点,通过荧光定量PCR的方法对甲基化模板/非甲基化模板进行定量或定性分析成为最常用的甲基化检测的替代方法。具体地,DNA模板经历亚硫酸氢盐转化后会形成新的DNA序列,原序列中未甲基化的胞嘧啶C会转变为尿嘧啶U且在随后的PCR过程中转变为胸腺嘧啶T,而甲基化的胞嘧啶C仍为胞嘧啶。如此以来,原来互补配对的双链DNA不再配对,成为两条单链,且DNA的复杂度降低,GC含量降低,AT含量增加,极大地增加了引物和探针的设计难度。
[0005]因此,通过荧光定量PCR进行甲基化检测需要对模板目标区域同时设计几对甚至几十对甲基化/非甲基化引物和探针,再分别进行荧光定量PCR实验测试每一对引物和探针的性能,从而筛选用于甲基化检测的引物和探针。然而,上述引物和探针筛选方法十分繁琐,且工作量巨大。
[0006]如何有效筛选荧光定量PCR的检测引物和探针是对甲基化模板/非甲基化模板进行定量或定性分析的难点。

技术实现思路

[0007]为了解决上述问题,有效筛选用于甲基化检测的荧光定量PCR引物和探针,本申请的第一目的在于提供一种引物探针序列组合的设计方法,包括以下步骤:
[0008]获取基于目标模板序列生成的引物探针序列组合集,引物探针序列组合集包括至少一个用于对目标模板执行甲基化检测的引物探针序列组合,每个引物探针序列组合用相应的参数信息表示,参数信息用于确定相应的引物探针序列组合的序列特征;
[0009]构建评分模型,评分模型用于根据引物探针序列组合的序列特征计算引物探针序
列组合的评分;
[0010]采用优化算法处理评分模型,以获得引物探针序列组合集中评分满足算法终止条件的目标引物探针序列组合。
[0011]本申请的引物探针序列组合设计方法通过设置引物探针序列组合的参数信息,构建引物探针序列组合的评分模型,结合优化算法的处理,获得评分满足算法终止条件的目标引物探针序列组合,可以有效筛选扩增性能良好的引物探针序列组合,扩增效率可达90%以上,用于甲基化检测,实现对甲基化模板/非甲基化模板进行定量或定性分析,减少复杂的人工劳动,同时还可以节约试剂、耗材,节约成本。
[0012]在其中一个实施例中,引物探针序列组合的序列特征包括引物对序列特征、探针序列特征、引物探针相互作用的序列特征,根据引物探针序列组合的序列特征计算引物探针序列组合的评分具体包括:
[0013]根据引物对的序列特征确定引物探针序列组合的引物评分;
[0014]根据探针的序列特征确定引物探针序列组合的探针评分;
[0015]根据引物探针相互作用的序列特征确定引物探针序列组合的引物探针相互作用评分;
[0016]根据引物探针序列组合的引物评分、探针评分、引物探针相互作用评分计算引物探针序列组合对应的评分。
[0017]在其中一个实施例中,评分模型为:
[0018][0019]其中,TS表示每个引物探针序列组合对应的评分,S1表示根据引物对序列特征确定的引物评分,S2表示根据探针序列特征确定的探针评分,S3表示根据引物探针相互作用的序列特征确定的引物探针相互作用评分,W
x
表示S
x
对应的权重,且
[0020]在其中一个实施例中,引物对序列特征包括扩增子长度、上下游引物Tm值差值的绝对值、上下游引物各自形成发夹结构的长度之和、上下游引物之间形成二聚体的长度和引物对的CG位点数量中的至少一种;及/或
[0021]探针序列特征包括探针的5

端是否以G碱基开头、探针长度和探针内CG位点数量中的至少一种;及/或
[0022]引物探针相互作用的序列特征包括探针分别与上下游引物形成二聚体的长度之和以及探针Tm值与上下游引物的Tm均值的差值中的至少一种。
[0023]在其中一个实施例中,S1的计算公式为:S1=100*exp(

(S
a
β1+S
b
β2+S
c
β3+S
d
β4+Seβ5;
[0024]其中,
[0025]S
a
为扩增子长度,β1为S
a
的系数;
[0026]S
b
为上下游引物Tm值的差值的绝对值,β2为S
b
的系数;
[0027]S
c
为上下游引物各自形成发夹结构长度之和,β3为S
c
的系数;
[0028]S
d
为上下游引物之间形成二聚体的长度,β4为S
d
的系数;
[0029]S
e
为上下游引物的CG位点数量,β5为S
e
的系数;
[0030]及/或
[0031]S2的计算过程包括:
[0032]判断探针的5

端是否以G碱基开头;
[0033]若探针的5

端以G碱基开头,则S2的计算公式为:S2=0;
[0034]若探针的5

端不以G碱基开头,则S2的计算公式为:S2=100*exp(

(S
f
β6+S
g
β7));
[0035]其中,
[0036]S
f
为探针的长度,β6为S
f
的系数;
[0037]S
g
为探针内CG位点数量,β7为S
g
的系数;
[0038]及/或
[0039]S3的计算公式为:S3=100本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种引物探针序列组合设计方法,其特征在于,包括以下步骤:获取基于目标模板序列生成的引物探针序列组合集,所述引物探针序列组合集包括至少一个用于对目标模板执行甲基化检测的引物探针序列组合,每个引物探针序列组合用相应的参数信息表示,所述参数信息用于确定相应的引物探针序列组合的序列特征;构建评分模型,所述评分模型用于根据引物探针序列组合的序列特征计算引物探针序列组合的评分;采用优化算法在所述引物探针序列组合集中搜索所述评分模型的最优解,所述最优解包括满足所述优化算法终止条件的评分及其对应的参数信息,根据所述最优解对应的参数信息输出相应的引物探针序列组合作为目标引物探针序列组合。2.根据权利要求1所述的方法,其特征在于,所述引物探针序列组合的序列特征包括引物对序列特征、探针序列特征、引物探针相互作用的序列特征,所述根据引物探针序列组合的序列特征计算引物探针序列组合的评分具体包括:根据所述引物对的序列特征确定引物探针序列组合的引物评分;根据所述探针的序列特征确定引物探针序列组合的探针评分;根据所述引物探针相互作用的序列特征确定引物探针序列组合的引物探针相互作用评分;根据引物探针序列组合的引物评分、探针评分、引物探针相互作用评分计算引物探针序列组合的评分。3.根据权利要求2所述的方法,其特征在于,所述评分模型为:其中,TS表示每个引物探针序列组合对应的评分,S1表示根据引物对序列特征确定的引物评分,S2表示根据探针序列特征确定的探针评分,S3表示根据引物探针相互作用的序列特征确定的引物探针相互作用评分,W
x
表示S
x
对应的权重,且4.根据权利要求2或3所述的方法,其特征在于,所述引物对序列特征包括扩增子长度、上下游引物Tm值差值的绝对值、上下游引物各自形成发夹结构的长度之和、上下游引物之间形成二聚体的长度和引物对的CG位点数量中的至少一种;及/或所述探针序列特征包括探针的5

端是否以G碱基开头、探针长度和探针内CG位点数量中的至少一种;及/或所述引物探针相互作用的序列特征包括探针分别与上下游引物形成二聚体的长度之和以及探针Tm值与上下游引物的Tm均值的差值中的至少一种。5.根据权利要求4所述的方法,其特征在于,S1的计算公式为:S1=100*exp(

(S
a
β1+S
b
β2+S
c
β3+S
d
β4+S
e
β5));其中,S
a
为扩增子长度,β1为S
a
的系数;S
b
为上下游引物Tm值的差值的绝对值,β2为S
b
的系数;S
c
为上下游引物各自形成发夹结构长度之和,β3为S
c
的系数;S
d
为上下游引物之间形成二聚体的长度,β4为S
d
的系数;S
e
为上下游引物的CG位点数量,β5为S
e
的系数;
及/或S2的计算过程包括:判断探针的5

端是否以G碱基开头;若探针的5

端以G碱基开头,则S2的计算公式为:S2=0;若探针的5

端不以G碱基开头,则S2的计算公式为:S2=100*exp(

(
f
β6+
g
β7));其中,S
f
为探针的长度,6为S
f
的系数;S
g
为探针内CG位点数量,β7为S
g
的系数;及/或所述S3的计算公式为:S3=100*exp(
‑1*(d+1)/ΔT);其中,k1为系数,d表示探针分别与上下游引物形成二聚体的长度之和,ΔT为探针的Tm值与上下游引物的Tm均值之间的差值。6.根据权利要求5所述的方法,其特征在于,所述评分模型中的系数使用多元回归模型确定。7.根据权利要求6所述的方法,其特征在于,所述评分模型中,β1=0.001,β2=0.03,β3=0.05,β4=0.08,β5=

0.1,β6=0.8,β7=

4,k1=1.57,W1=0.5,W2=0.3,W3=0.2。8.根据权利要求1~7任一项所述的方法,其特征在于,所述参数信息包括上游引物位置、上游引物长度、下游引物位置、下游引物长度、探针位置、探针长度以及探针方向。9.根据权利要求1所述的方法,其特征在于,所述优化算法包括模拟退火算法、遗传算法、爬山算法、粒子群算法、蚁群算法中的至少一种。10.根据权利要求9所述的方法,其特征在于,所述优化算法为模拟退火算法。11.根据权利要求10所述的方法,其特征在于,所述采用优化算法在所述引物探针序列组合集中搜索所述评分模型的最优解,所述最优解包括满足所述优化算法终...

【专利技术属性】
技术研发人员:万康康吴志诚董兰兰张良禄赵巴丽黄越
申请(专利权)人:武汉艾米森生命科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1