一种基于最大点权重团的CE平台多重多通道STR引物的设计方法和系统技术方案

技术编号:34902833 阅读:21 留言:0更新日期:2022-09-10 14:11
本申请涉及生物信息学分析技术领域,具体提供一种基于最大点权重团的CE平台多重多通道STR引物的设计方法和系统,通过合理的设计权重和边的连接,把多重多通道的毛细管电泳STR引物设计转换为求解带点权重的最大团(MVWCP)问题,设计的引物检出率高,且非特异极少。少。少。

【技术实现步骤摘要】
一种基于最大点权重团的CE平台多重多通道STR引物的设计方法和系统


[0001]本申请涉及生信分析
,具体涉及一种基于最大点权重团的CE平台多重多通道STR引物的设计方法及系统。
技术背景
[0002]短串联重复序列(short tandem repeat),也称做微卫星DNA(micrositellite DNA),是由2

6个碱基作为核心串联合成的DNA序列,STR具有变异率高,多态性,易检测等特点,因此广泛的应用与法医相关的检测。
[0003]从1985年开始,STR就已经被应用到法医领域。检测的方法通常是通过毛细管电泳配合荧光标记来达到较高的通量。不同的STR位点被设计成有不同产物长度或者不同的荧光标记,这样就可以区分不同的STR位点。然而跟美国的情形略有不同的是,中国国内的人口基数大,因此需要设计更多的位点来进行个体区分,另一方面,在实际的案件侦破中,经常出现“异系同型”的问题,即不同的家系中的男性会有相同的Y

STR分型。这两个方面都促使STR的panel变得越来越大。目前主流的panel都包含有几十个位点。然而,毛细管电泳的通量有限,一方面这是来自于长度的限制,虽然毛细管电泳能够检测到长度为1000bp的片段,但是只有在0

500bp的长度内荧光强度和产物浓度具有线性关系。另一方面,目前成熟的6色荧光技术在扩展到8色荧光的时候,经常出现荧光渗漏的现象,这会导致其它的通道内出现杂峰从而影响对最终分型结果的判断。因此需要在有限的通道和长度内尽可能的设计更多的STR位点。
[0004]STR引物设计有一些天然的难题,例如,个别STR位点的两侧会有大的重复区域,TPOX的右侧就有一个大的重复区域,这导致它的右侧只有很少一段的区域可以设计引物。Y

STR由于染色体长度短,而且STR密度大,好多STR位点都高度同源,设计起来难度就更大。例如,DYS389II包含了两个重复区域,两个重复区域间隔48bp,其中DYS389I是指第一个重复区域,而DYS389II则包含两个重复区域,也即DYS389I完全的包含在DYS389II内部,如果要在CE平台上区分这两个点,他们的左侧引物必须相同,而右侧引物只能设计在这48个bp里面。而且,STR引物设计要尽可能的避开SNP的位置,因为覆盖SNP的引物会导致无法扩增或者扩增效率降低,从而进一步导致分型错误。而STR附近天然的富集indel和SNP,例如D13S317在两个侧翼就包含了3个高频SNP位点,这也导致了一些试剂盒在实际应用中出现问题。除此之外,STR引物设计还要考虑多重、多通道、二聚体、非特异等因素。
[0005]针对以上的问题,本申请提出了一种自动设计毛细管电泳多重多通道引物的算法逻辑。通过合理的设计权重和边的连接,把多重多通道的毛细管电泳STR引物设计转换为求解带点权重的最大团问题。鉴于此,提出本申请。

技术实现思路

[0006]本申请要解决的核心技术问题是寻求一种基于最大点权重团的CE平台多重多通
道STR引物的设计方法和系统。
[0007]为解决上述技术问题,本申请建立了多重、多通道引物设计和最大权重团算法之间的联系。因为要考虑不同的位点之间扩增子长度的兼容性,这里的每一个顶点代表了一对引物而不是单个引物;又为了实现多通道的设计,这里把引物对进行了复制,其中的每一个拷贝代表一个通道。通过合理的设计权重和边的连接,把多重多通道的毛细管电泳STR引物设计转换为求解带点权重的最大团问题。
[0008]具体的,本申请提出如下技术方案:
[0009]本申请首先提供一种基于最大点权重团的CE平台多重、多通道STR引物的设计方法,所述方法包括:
[0010]1)获取初始引物集,针对每一个STR位点获得所有可能引物:
[0011]2)引物初筛过滤,针对得到初始引物集,对于每个STR位点,根据正反向引物集遍历所有的正反引物对组合,对于每个引物对,根据GC含量、二级结构、二聚体和/或Tm值进行引物对初筛过滤;
[0012]3)引物特异性检查,对非特异性引物进行删除或标记;
[0013]4)构建引物对间兼容性关系,建立引物对设计和MVWCP之间关系:
[0014]a、确定任意引物对之间是否兼容,制备候选引物对;
[0015]b、对于每个STR位点的每个候选引物对,将扩增子长度、Tm值、GC含量、引物长度信息分别赋权重;
[0016]c、对于每个STR位点的每个候选引物对,复制N份,所述N为CE荧光通道数,每份添加对应荧光颜色信息;汇总所有STR位点包含荧光颜色信息的引物对组成多重、多通道引物对候选集,把每个引物对作为一个顶点Vertex,并按规则连接成边;
[0017]基于上述权重以及顶点和边关系,建立引物对设计和MVWCP之间关系;
[0018]5)选取最优引物对,针对步骤4)的引物对设计和MVWCP之间关系,基于MVWCP相关算法获取引物最优组合。
[0019]进一步的,所述步骤1)中,所述获得为:
[0020]根据每个STR位点位置信息,分别在其上下游500bp序列中,以19

33bp为滑动窗口,以1

5个碱基为单位滑动,得到STR位点的正反向引物集合。
[0021]进一步的,所述步骤2)中,所述初筛条件包括如下任一或多个:
[0022]a、引物GC含量为20%

80%;
[0023]b、引物范围内不包含人群中MAF>1%的SNP;
[0024]c、引物之间不形成二聚体;
[0025]d、单条引物不形成二级结构;
[0026]e、引物Tm值范围54

60℃,任意两引物间温度最大差异为2℃;
[0027]f、引物对扩增长度小于panel规定的大小。
[0028]进一步的,所述步骤3)中,所述特异性检查包括如下任一或多个:
[0029]a、位点内部引物的特异性检查:若位点1中某对引物能够非特异扩增,则删除位点1中的此对引物;
[0030]b、位点间引物的特异性检查:若位点1中的某引物与位点2中的某引物能够非特异扩增,不删除该2个引物,将其分别标记;
[0031]进一步优选的,所述非特异扩增的扩增片段<1000bp。
[0032]进一步的,所述步骤4)中,所述兼容包括如下任一或多个:
[0033]a、引物之间不能形成二聚体;
[0034]b、引物之间Tm差异不超过2℃;
[0035]c、引物之间长度差异不超过5bp;
[0036]d、引物之间不产生非特异性扩增。
[0037]进一步的,所述步骤4)中,所述权重优先级为:扩增子长度权重>引物TM权重>GC含量权重>引物长度权重;
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于最大点权重团的CE平台多重、多通道STR引物的设计方法,其特征在于,所述方法包括:1)获取初始引物集,针对每一个STR位点获得所有可能引物:2)引物初筛过滤,针对得到初始引物集,对于每个STR位点,根据正反向引物集遍历所有的正反引物对组合,对于每个引物对,根据GC含量、二级结构、二聚体和/或Tm值进行引物对初筛过滤;3)引物特异性检查,对非特异性引物进行删除或标记;4)构建引物对间兼容性关系,建立引物设计和最大点权重团MVWCP之间的关系:a、确定任意引物对之间是否兼容,制备候选引物对;b、对于每个STR位点的每个候选引物对,将扩增子长度、Tm值、GC含量、引物长度信息分别赋权重;c、对于每个STR位点的每个候选引物对复制N份,所述N为CE荧光通道数;每份添加对应荧光颜色信息;汇总所有STR位点包含荧光颜色信息的引物对,组成多重多通道引物对候选集,把每个引物对作为一个顶点Vertex,并按规则连接成边;基于权重、顶点和边的关系,建立引物设计和MVWCP之间关系;5)选取最优引物对,基于MVWCP相关算法,获取引物最优组合。2.根据权利要求1所述的引物设计方法,其特征在于,所述步骤1)中,所述获得为:根据每个STR位点位置信息,分别在其上下游500bp序列中,以19

33bp为滑动窗口,以1

5个碱基为单位滑动,得到STR位点的正反向引物集合。3.根据权利要求1所述的引物设计方法,其特征在于,所述步骤2)中,所述初筛条件包括如下任一或多个:a、引物GC含量为20%

80%;b、引物范围内不包含人群中MAF>1%的SNP;c、引物之间不形成二聚体;d、单条引物不形成二级结构;e、引物Tm值范围54

60℃,任意两引物间温度最大差异为2℃。4.根据权利要求1所述的引物设计方法,其特征在于,所述步骤3)中,所述特异性检查包括...

【专利技术属性】
技术研发人员:李梦郭茂平徐朝阳吕换男黄舒张奇胡欢陈初光
申请(专利权)人:北京阅微基因技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1