System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种异源六倍体不平衡系数的测定方法技术_技高网

一种异源六倍体不平衡系数的测定方法技术

技术编号:41334890 阅读:7 留言:0更新日期:2024-05-20 09:54
本申请涉及生物技术领域,尤其涉及一种异源六倍体不平衡系数的测定方法。方法包括:构建包括HWD系数和LD系数的亲代配子频率计算模型。代入亲代配子频率计算模型至子代合子频率分布模型,得到子代合子频率计算模型;构建测定模型;获取自然群体中异源六倍体子代合子频率的实际数值,输入子代合子频率的实际数值至测定模型,确定亲代配子频率的估计数值;通过数值优化算法针对测定模型进行参数估计,得到HWD系数的测定数值和LD系数的测定数值。本申请通过利用HWD系数和LD系数反映异源六倍体基因组标记之间复杂的LD网络,解决当前通用多倍体LD估计没有考虑两位点多等位基因之间复杂的LD网络的问题以及异源六倍体LD网络模型缺乏的问题。

【技术实现步骤摘要】

本申请涉及生物,尤其涉及一种异源六倍体不平衡系数的测定方法


技术介绍

1、连锁不平衡(linkage disequilibrium,ld)是指基因组中不同位点等位基因之间非随机关联的现象。ld在基因组的程度和分布为推断自然群体的种群差异和进化事件提供了重要的参考。考虑ld与重组率的关系,ld为复杂性状的全基因组关联研究与高解析度定位提供了强有力的支撑。异源六倍体在动植物中广泛存在,例如,小麦等重要粮食作物,因此,对异源六倍体ld的准确度量具有重要的应用价值。

2、尽管ld在二倍体动植物群体遗传研究中被广泛使用,但考虑异同源六倍体位于同一位点的等位基因和位于不同位点的非等位基因形成的复杂配子组合以及异源多倍体存在的特殊减数分裂机制,需要针对异源六倍体开发相适应的ld模型,现有的二倍体ld模型无法准确度量异源六倍体复杂的配子ld的程度。

3、当前,针对异源六倍体的ld模型存在以下不足:第一,通用的多倍体ld复合模型,只是利用一个连锁不平衡参数度量两个位点多等位基因的关联程度,没有考虑两个位点多等位基因之间复杂的ld网络;第二,已有技术对异源四倍体自然群体基因组两位点之间复杂的ld网络展开估计,但不能用于异源六倍体,异源六倍体的复合网络ld模型比四倍体更加复杂。


技术实现思路

1、本申请提供了一种异源六倍体不平衡系数的测定方法,能够解决当前通用多倍体ld估计没有考虑两位点多等位基因之间复杂的ld网络的问题以及异源六倍体ld网络模型缺乏的问题。

2、本申请的技术方案是一种异源六倍体不平衡系数的测定方法,包括:

3、s1:基于哈迪-温伯格不平衡,构建包括若干个hwd系数和ld系数的异源六倍体亲代配子频率计算模型;

4、s2:确认异源六倍体的子代合子频率分布模型,代入亲代配子频率计算模型至子代合子频率分布模型,相应地得到子代合子频率计算模型;

5、s3:基于对数似然函数,根据子代合子频率计算模型,构建以亲代配子频率为参数并且以子代合子频率为变量的测定模型;

6、s4:获取自然群体中异源六倍体子代合子频率的实际数值,输入子代合子频率的实际数值至测定模型,基于em算法确定亲代配子频率的估计数值;

7、s5:根据亲代配子频率的估计数值,通过数值优化算法针对测定模型进行参数估计,相应地得到若干个hwd系数的测定数值和ld系数的测定数值。

8、可选地,所述hwd系数为标记内的等位基因之间的hwd系数;

9、以及,所述ld系数包括:标记内的等位基因之间的hwd系数、不同标记的二等位基因之间的ld系数、不同标记的三等位基因之间的ld系数、不同标记的四等位基因之间的ld系数、不同标记的五等位基因之间的ld系数和不同标记的六等位基因之间的ld系数。

10、可选地,所述子代合子频率计算模型如下所示:

11、

12、

13、

14、

15、

16、

17、

18、

19、

20、

21、

22、式中,表示双标记亲代配子频率;

23、m1、m2和m3表示标记snp1的单标记亲代配子,n1、n2和n3表示标记snp2的单标记亲代配子;m1=m2=m3=n1=n2=n3=a,a;

24、k1、k2和k3表示snp1的单标记亲代配子中等位基因组成的指示变量;

25、l1、l2和l3表示snp2的单标记亲代配子中等位基因组成的指示变量;

26、q1表示二等位基因的连锁不平衡系数计算式;

27、q2表示三等位基因的连锁不平衡系数计算式;

28、q3表示四等位基因的连锁不平衡系数计算式;

29、q4表示五等位基因的连锁不平衡系数计算式;

30、q5表示六等位基因的连锁不平衡系数计算式;

31、q6表示二等位基因与二等位基因互作的连锁不平衡系数计算式;

32、q7表示二等位基因与三等位基因互作的连锁不平衡系数计算式;

33、q8表示二等位基因与四等位基因互作的连锁不平衡系数计算式;

34、q9表示三等位基因与三等位基因互作的连锁不平衡系数计算式;

35、q10表示三个二等位基因互作的连锁不平衡系数计算式;

36、da2表示snp1两个等位基因的hwd系数;

37、da3表示snp1三个等位基因的hwd系数;

38、db2表示snp2两个等位基因的hwd系数;

39、db3表示snp2三个等位基因的hwd系数;

40、dab表示两个snp之间同一配子两个非等位基因的ld系数;

41、da/b表示两个snp之间不同配子两个非等位基因的ld系数;

42、dab表示snp1两个等位基因与snp2一个等位基因的ld系数;

43、dab表示snp1一个等位基因与snp2两个等位基因的ld系数;

44、dab表示snp1两个等位基因与snp2两个等位基因的ld系数;

45、daab表示snp1三个等位基因与snp2一个等位基因的ld系数;

46、dabb表示snp1一个等位基因与snp2三个等位基因的ld系数;

47、daab表示snp1三个等位基因与snp2二个等位基因的ld系数;

48、dabb表示snp1二个等位基因与snp2三个等位基因的ld系数;

49、daabb表示snp1三个等位基因与snp2三个等位基因的ld系数。

50、可选地,所述测定模型如下所示:

51、

52、式中,表示标记snp1的亲代配子和标记snp2的亲代配子形成的49个子代合子的数量;表示标记snp1的亲代配子和标记snp2的亲代配子形成的49个子代合子的频率;

53、ja=1,2,……,7,相应地代表snp1的基因型aaaaaa,aaaaaa,……,aaaaaa;

54、jb=1,2,……,7,相应地代表snp2的基因型bbbbbb,bbbbbb,……,bbbbbb;

55、c表示常数。

56、可选地,还包括:

57、s6:针对子代合子的hwd系数的连锁不平衡系数进行检验,相应地得到似然比;

58、根据似然比,判断连锁不平衡系数的显著性。

59、可选地,所述步骤s6包括:

60、s61:针对子代合子进行hwd系数和连锁不平衡系数的假设检验,相应地得到若干个似然比;

61、检验公式包括但不限于下述公式:

62、h0:daab=0;h1:daab≠0;

63、s62:分别针对若干个似然比与临界值的大小进行比较,相应地得到若干个比较结果;<本文档来自技高网...

【技术保护点】

1.一种异源六倍体不平衡系数的测定方法,其特征在于,包括:

2.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,所述HWD系数为标记内的等位基因之间的HWD系数;

3.根据权利要求2所述的异源六倍体不平衡系数的测定方法,其特征在于,所述子代合子频率计算模型如下所示:

4.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,所述测定模型如下所示:

5.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,还包括:

6.根据权利要求5所述的异源六倍体不平衡系数的测定方法,其特征在于,所述步骤S6包括:

7.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,还包括:

8.根据权利要求7所述的异源六倍体不平衡系数的测定方法,其特征在于,所述步骤S7包括:

9.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,还包括:

【技术特征摘要】

1.一种异源六倍体不平衡系数的测定方法,其特征在于,包括:

2.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,所述hwd系数为标记内的等位基因之间的hwd系数;

3.根据权利要求2所述的异源六倍体不平衡系数的测定方法,其特征在于,所述子代合子频率计算模型如下所示:

4.根据权利要求1所述的异源六倍体不平衡系数的测定方法,其特征在于,所述测定模型如下所示:

5.根据权利要求...

【专利技术属性】
技术研发人员:姜立波吕忠璠吕娟娟朱梦圆
申请(专利权)人:山东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1