【技术实现步骤摘要】
引物探针序列组合设计方法和装置
[0001]本申请涉及生物信息学
,具体而言,涉及一种引物探针序列组合设计方法和装置。
技术介绍
[0002]DNA甲基化指在DNA甲基转移酶的作用下,以S
‑
腺苷甲硫氨酸作为甲基供体,将一个甲基基团共价转移到核苷酸上,最常见的是将甲基基团转移到胞嘧啶碱基第5位的碳原子上,生成5
‑
甲基胞嘧啶。在哺乳动物的个体发育过程中,DNA的甲基化在调控基因表达、形成基因组印记及X染色体失活中起着重要作用。DNA甲基化不仅能够维持正常的生物功能,其异常可导致多种疾病的发生,如生长发育、行为异常以及癌症的发生和发展。因此,对基因中的特异位点进行甲基化检测有利于深入了解和阐明甲基化的生物学功能,也有利于筛查、诊断和评估疾病及其进展情况。
[0003]甲基化特异性PCR是一种经典的检测基因特定位点甲基化水平的方法,其引物设计的主要方法为:DNA首先用亚硫酸氢盐处理,并针对DNA序列中富含C的区域设计引物,同时CpG二核苷酸位点尽量位于引物的3
’
端,以区分甲基化和未甲基化的模板。甲基化特异性PCR法需要电泳检测或桑格尔测序来分析结果,步骤较为繁琐。
[0004]利用甲基化特异性引物和TaqMan MGB探针来覆盖甲基化位点,通过荧光定量PCR的方法对甲基化模板/非甲基化模板进行定量或定性分析成为最常用的甲基化检测的替代方法。具体地,DNA模板经历亚硫酸氢盐转化后会形成新的DNA序列,原序列中未甲基化的胞嘧啶C会转变为尿嘧啶U且在 ...
【技术保护点】
【技术特征摘要】
1.一种引物探针序列组合设计方法,其特征在于,包括以下步骤:获取基于目标模板序列生成的引物探针序列组合集,所述引物探针序列组合集包括至少一个用于对目标模板执行甲基化检测的引物探针序列组合,每个引物探针序列组合用相应的参数信息表示,所述参数信息用于确定相应的引物探针序列组合的序列特征;构建评分模型,所述评分模型用于根据引物探针序列组合的序列特征计算引物探针序列组合的评分;采用优化算法在所述引物探针序列组合集中搜索所述评分模型的最优解,所述最优解包括满足所述优化算法终止条件的评分及其对应的参数信息,根据所述最优解对应的参数信息输出相应的引物探针序列组合作为目标引物探针序列组合。2.根据权利要求1所述的方法,其特征在于,所述引物探针序列组合的序列特征包括引物对序列特征、探针序列特征、引物探针相互作用的序列特征,所述根据引物探针序列组合的序列特征计算引物探针序列组合的评分具体包括:根据所述引物对的序列特征确定引物探针序列组合的引物评分;根据所述探针的序列特征确定引物探针序列组合的探针评分;根据所述引物探针相互作用的序列特征确定引物探针序列组合的引物探针相互作用评分;根据引物探针序列组合的引物评分、探针评分、引物探针相互作用评分计算引物探针序列组合的评分。3.根据权利要求2所述的方法,其特征在于,所述评分模型为:其中,TS表示每个引物探针序列组合对应的评分,S1表示根据引物对序列特征确定的引物评分,S2表示根据探针序列特征确定的探针评分,S3表示根据引物探针相互作用的序列特征确定的引物探针相互作用评分,W
x
表示S
x
对应的权重,且4.根据权利要求2或3所述的方法,其特征在于,所述引物对序列特征包括扩增子长度、上下游引物Tm值差值的绝对值、上下游引物各自形成发夹结构的长度之和、上下游引物之间形成二聚体的长度和引物对的CG位点数量中的至少一种;及/或所述探针序列特征包括探针的5
’
端是否以G碱基开头、探针长度和探针内CG位点数量中的至少一种;及/或所述引物探针相互作用的序列特征包括探针分别与上下游引物形成二聚体的长度之和以及探针Tm值与上下游引物的Tm均值的差值中的至少一种。5.根据权利要求4所述的方法,其特征在于,S1的计算公式为:S1=100*exp(
‑
(S
a
β1+S
b
β2+S
c
β3+S
d
β4+S
e
β5));其中,S
a
为扩增子长度,β1为S
a
的系数;S
b
为上下游引物Tm值的差值的绝对值,β2为S
b
的系数;S
c
为上下游引物各自形成发夹结构长度之和,β3为S
c
的系数;S
d
为上下游引物之间形成二聚体的长度,β4为S
d
的系数;S
e
为上下游引物的CG位点数量,β5为S
e
的系数;
及/或S2的计算过程包括:判断探针的5
’
端是否以G碱基开头;若探针的5
’
端以G碱基开头,则S2的计算公式为:S2=0;若探针的5
’
端不以G碱基开头,则S2的计算公式为:S2=100*exp(
‑
(
f
β6+
g
β7));其中,S
f
为探针的长度,6为S
f
的系数;S
g
为探针内CG位点数量,β7为S
g
的系数;及/或所述S3的计算公式为:S3=100*exp(
‑1*(d+1)/ΔT);其中,k1为系数,d表示探针分别与上下游引物形成二聚体的长度之和,ΔT为探针的Tm值与上下游引物的Tm均值之间的差值。6.根据权利要求5所述的方法,其特征在于,所述评分模型中的系数使用多元回归模型确定。7.根据权利要求6所述的方法,其特征在于,所述评分模型中,β1=0.001,β2=0.03,β3=0.05,β4=0.08,β5=
‑
0.1,β6=0.8,β7=
‑
4,k1=1.57,W1=0.5,W2=0.3,W3=0.2。8.根据权利要求1~7任一项所述的方法,其特征在于,所述参数信息包括上游引物位置、上游引物长度、下游引物位置、下游引物长度、探针位置、探针长度以及探针方向。9.根据权利要求1所述的方法,其特征在于,所述优化算法包括模拟退火算法、遗传算法、爬山算法、粒子群算法、蚁群算法中的至少一种。10.根据权利要求9所述的方法,其特征在于,所述优化算法为模拟退火算法。11.根据权利要求10所述的方法,其特征在于,所述采用优化算法在所述引物探针序列组合集中搜索所述评分模型的最优解,所述最优解包括满足所述优化算法终...
【专利技术属性】
技术研发人员:万康康,吴志诚,董兰兰,张良禄,赵巴丽,黄越,
申请(专利权)人:武汉艾米森生命科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。