System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物检测领域,具体涉及判断ssr毛细管电泳内标位置的方法。
技术介绍
1、ssr(simple sequence repeats)即为简单重复序列,又称为微卫星dna(microsatellite dna),通常是由1~6个核苷酸为基础,经过多次重复串联构成dna序列,长度在数十到数百bp之间不等。moore和sollotterer等在1991年创立的ssr分子标记是以特异引物pcr(polymerase chain reaction,聚合酶链式反应)技术为基础的第二代分子标记技术。
2、毛细管荧光电泳是广泛应用于检测ssr分子标记的技术,该技术原理是将荧光检测的高灵敏度和毛细管电泳的高效性结合,利用电泳和电渗流的电动力学原理,在毛细管中灌满胶分离pcr产物,检测荧光信号,数据软件分析系统将其转化成峰图,常用软件有thermo公司genemapper等。ssr数据分析的核心是确认目标dna片段长度,为了判断其长度,在目标样品中加入了内标,即带有与目标样品不同荧光信号已知片段长度的dna片段,内标与目标片段同时进行毛细管电泳,进而根据内标的位置判断目的片段的长度。
3、在内标判读过程中,最为重要的步骤是在毛细管电泳峰图中准确找到已知长度dna片段的峰图位置,但当前存在许多问题,一是毛细管电泳本身重现性较差,相同长度的内标在不同实验中其峰图位置有显著差异,二是分子生物学实验中干扰因素较多,因为杂质、实验过程问题等导致在峰图中经常出现大量的干扰峰,三是ssr主流测试仪器thermo公司3730测序
技术实现思路
1、本专利技术针对以上的问题,提出了一种判读ssr内标在电泳峰图中位置的方法,其是通过算法来以提高其判读准确率,特别是在有明显干扰峰情况下准确率。具体是,本专利技术针对毛细管电泳重现性较差以及干扰峰的问题,提出了通过各片段间距的相对比例计算相邻峰位置的算法,经过大量真实实验数据证明可有效提高峰位置判读的准确性,由此提出本专利技术。
2、参数说明:
3、图1为某已知片段长度的内标峰图。片段长度b,按照内标长度(bp,碱基对)从小到大为第1至第n个片段,其长度分别标识为b1至bn;片段间距离d,d1为第1与第2个片段之间的距离,dn为第n与第n+1个片段之间的距离。每bp平均距离db,第1和第2个片段之间每bp的平均距离db1=d1/(b2-b1),第n与第n+1个片段之间的距离dbn=dn/(bn+1-bn)。正向平均距离比p,p1=db2/db1,pn=dbn+1/dbn,反向平均距离比p′,p′n=dbn-1/dbn。不同的内标其片段长度b是固定的,如liz500即为50、75、100、139、150、160、200、250、300、340、350、400、450、490、500,可依据若干人工识别后的片段峰的位置可首先计算dn,再依照公式dbn=dn/(bn+1-bn)计算dbn,再依照公式pn=dbn+1/dbn和p′n=dbn-1/dbn计算p和p′,因此p和p′对于某种内标可视为一组已知的经验性常数。
4、本专利技术提供一种判断ssr毛细管电泳内标位置的方法,其包括如下步骤:一种判断ssr毛细管电泳内标位置的方法,其中内标位置,按最短的内标片段标为x1,依次标为x2,直到最长的内标片段标为xn,其包括如下步骤:
5、第一步、对信号值进行滤波降噪并找到所有可能的片段峰;
6、第二步根据选择最高峰原则在起始内标经验位置附近找到长度最短的两个内标片段x1和x2;
7、第三步计算之后内标片段的位置:针对与x2最近的内标片段x3,在确定x1和x2后,可知d1与db1,计算得内标片段b3与b2之间的距离d2=d1+db1×(b3-b2)×p1,同时根据实验经验引入误差系数e=0.007以确定x3所在的范围,(x2+d2)×(1-e)≤x3≤(x2+d2)×(1+e),选择此范围内峰值最高的峰为x3,以此类推可计算其余片段位置。
8、优选地,第三步中,如出现片段峰缺失情况,在计算得到的判读窗口范围未找到该片段峰,跳过当前xn的计算,继续计算n+1片段的距离dn+1,dn+1=dn+dbn×(bn+2-bn+1)×pn,并按照(xn+dn)×(1-e)≤xn+1≤(xn+dn)×(1+e)计算xn+1的范围,并确定位置。
9、更优选地,在连续跳过时,每跳过一次误差系数e增加1.5倍,e=e×2.5,当e≥0.05时,e不再增加,改取固定值0.05,当再次找到峰位置时,e重置为原来的值。
10、本专利技术提供另一种判断ssr毛细管电泳内标位置的方法,其中内标位置,按最短的内标片段标为x1,依次标为x2,直到最长的内标片段标为xn,其包括如下步骤:
11、第一步、对信号值进行滤波降噪并找到所有可能的片段峰;
12、第二步根据选择最高峰原则在结尾内标经验位置附近找到的长度最长的两个内标片段xn-1和xn;
13、第三步计算之前内标片段的位置,针对xn-1最接近的内标片段xn-2,在确定xn-1和xn后,可知dn-1与dbn-1,计算得内标片段bn-2与bn-1之间的距离dn-2=dn-1-dbn-1×(bn-1-bn-2)×p′n,通过误差系数e确定xn-2位置范围(xn-2-dn-2)×(1-e)≤xn-2≤(xn-2-dn-2)×(1+e),按照选取最高峰原则确定位置xn-2,以此类推可计算其余片段位置。
14、优选地,第五步中,如出现片段峰缺失情况,跳过当前xm的计算,继续计算m-1片段的距离dm-1,dm-1=dm-dbm×(bm-bm-1)×p′n,并按照(xm-1-dm-1)×(1-e)≤xm-1≤(xm-1-dm-1)×(1+e)计算xm-1的范围,并确定位置。
15、更优选地,在连续跳过时,每跳过一次误差系数e增加1.5倍,e=e×2.5,当e≥0.05时,e不再增加,改取固定值0.05,当再次找到峰位置时,e重置为原来的值。
16、在具体实施方式中,第一步是使用开源软件以savitzky-golay方法对信号值进行滤波降噪并找到所有可能的片段峰。
17、具体地,第三步中实验经验引入的误差系数为e=0.007。
18、本专利技术也提供一种判断ssr毛细管电泳内标位置的方法,其分别采用上述的两种方法确定内标位置,并比较两者的结果,如有不同按照选取信号值更高峰的原则确定内标位置,由此最终确定了一系列内标的峰位置,可进一步用于判读未知样品的片段长度。
19、本专利技术通过总结ssr实验特点与毛细管电泳实验特性,采用实验间重现性优秀的平均距离比常数p(两个相邻片段单位碱基长度的比值)辅助计算片段位置的算法,大幅度提高了ssr毛细管电泳内标位置判读的准确性,并可有效本文档来自技高网...
【技术保护点】
1.一种判断SSR毛细管电泳内标位置的方法,其中内标位置,按最短的内标片段标为x1,依次标为x2,直到最长的内标片段标为xn,其包括如下步骤:
2.如权利要求1所述的方法,其特征在于,第三步中,如出现片段峰缺失情况,在计算得到的判读窗口范围未找到该片段峰,跳过当前xn的计算,继续计算n+1片段的距离dn+1,dn+1=dn+dbn×(bn+2-bn+1)×pn,并按照(xn+dn)×(1-E)≤ xn+1≤(xn+dn)×(1+E)计算xn+1的范围,并确定位置。
3.如权利要求2所述的方法,其特征在于,在连续跳过时,每跳过一次误差系数E增加1.5倍,E=E×2.5,当E≥0.05时,E不再增加,改取固定值0.05,当再次找到峰位置时,E重置为原来的值。
4.一种判断SSR毛细管电泳内标位置的方法,其特征在于,其中内标位置,按最短的内标片段标为x1,依次标为x2,直到最长的内标片段标为xn,其包括如下步骤:
5.如权利要求4所述的方法,其特征在于,第五步中,如出现片段峰缺失情况,跳过当前xm的计算,继续计算m-1片段的距离dm-1,
6.如权利要求5所述的方法,其特征在于,,在连续跳过时,每跳过一次误差系数E增加1.5倍,E=E×2.5,当E≥0.05时,E不再增加,改取固定值0.05,当再次找到峰位置时,E重置为原来的值。
7.如权利要求1至6任一项所述的方法,其特征在于,第一步是使用开源软件以Savitzky-Golay方法对信号值进行滤波降噪并找到所有可能的片段峰。
8.如权利要求1或4所述的方法,其特征在于,第三步中实验经验引入的误差系数为E=0.007。
9.一种判断SSR毛细管电泳内标位置的方法,其特征在于,分别采用如权利要求1至3任一项所述的方法确定内标位置,采用如权利要求4-6任一项所述的方法确定内标位置,以及比较两者的结果,如有不同按照选取信号值更高峰的原则确定内标位置,由此最终确定了一系列内标的峰位置,可进一步用于判读未知样品的片段长度。
...【技术特征摘要】
1.一种判断ssr毛细管电泳内标位置的方法,其中内标位置,按最短的内标片段标为x1,依次标为x2,直到最长的内标片段标为xn,其包括如下步骤:
2.如权利要求1所述的方法,其特征在于,第三步中,如出现片段峰缺失情况,在计算得到的判读窗口范围未找到该片段峰,跳过当前xn的计算,继续计算n+1片段的距离dn+1,dn+1=dn+dbn×(bn+2-bn+1)×pn,并按照(xn+dn)×(1-e)≤ xn+1≤(xn+dn)×(1+e)计算xn+1的范围,并确定位置。
3.如权利要求2所述的方法,其特征在于,在连续跳过时,每跳过一次误差系数e增加1.5倍,e=e×2.5,当e≥0.05时,e不再增加,改取固定值0.05,当再次找到峰位置时,e重置为原来的值。
4.一种判断ssr毛细管电泳内标位置的方法,其特征在于,其中内标位置,按最短的内标片段标为x1,依次标为x2,直到最长的内标片段标为xn,其包括如下步骤:
5.如权利要求4所述的方法,其特征在于,第五步中,如出现片段峰缺失情况,跳过当前xm的计算,继续计算m-1片段...
【专利技术属性】
技术研发人员:巫祥云,张丽娜,关荣霞,陈祥燕,张晓,刘君,孙莹璐,杨佳莹,
申请(专利权)人:中国农业科学院作物科学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。