一种估计基因组育种值的方法、装置及系统制造方法及图纸

技术编号:28225313 阅读:21 留言:0更新日期:2021-04-28 09:58
本申请涉及一种估计基因组育种值的方法、装置及系统,估计基因组育种值的方法包括:获取高密度的全基因组分子标记;对全基因组分子标记进行修剪,得到第一基因组分子标记;利用第一基因组分子标记构建亲缘关系矩阵;利用亲缘关系矩阵对全基因组分子标记进行全基因组关联分析,筛选出性状相关标记;针对中遗传力和低遗传力性状,将第一基因组分子标记和性状相关标记进行合并,并基于第一混合模型方程组得到育种值;针对高遗传力的性状,将第一基因组分子标记与性状相关标记作为具有不同遗传方差的两个组分,并基于第二混合模型方程组得到育种值。如此,提高了计算效率,减少了计算资源的消耗,提高了基因组选择准确性,能够加快动植物遗传改良。动植物遗传改良。动植物遗传改良。

【技术实现步骤摘要】
一种估计基因组育种值的方法、装置及系统


[0001]本申请涉及生物
,具体涉及一种估计基因组育种值的方法、装置及系统。

技术介绍

[0002]随着测序技术的发展,测序成本的下降,利用重测序进行基因组选择成为可能。覆盖全基因组的高密度分子标记为解析复杂性状遗传机制创造了条件,同时为提高基因组选择准确性提供了机会。
[0003]相关技术中,高密度分子标记的基因组预测方法主要有两类:一类是基因组最佳无偏线性预测(GBLUP)方法,该方法假定所有标记都存在效应,不对标记进行筛选,采用所有分子标记构建亲缘矩阵,进而对混合模型方程组进行求解,得到育种值;另一类是贝叶斯分析法(Bayes),该方法通过模拟抽样得到各标记的效应值,进而由标记效应值对育种值进行预测。然而,通过直接的GBLUP法得到的预测值并不能有效利用高密度标记信息,导致基因组预测准确性还有待提高;而Bayes方法通过抽样来估计标记效应的过程不仅耗时长,还会占用大量的内存资源,且预测准确性并不稳定。

技术实现思路

[0004]有鉴于此,本申请的目的在于克服现有技术的不足,提供一种估计基因组育种值的方法、装置及系统。
[0005]为实现以上目的,本申请采用如下技术方案:
[0006]本申请的第一方面提供一种估计基因组育种值的方法,包括:
[0007]获取高密度的全基因组分子标记;
[0008]对所述全基因组分子标记进行修剪,得到第一基因组分子标记;
[0009]利用所述第一基因组分子标记构建亲缘关系矩阵;
[0010]利用所述亲缘关系矩阵对所述全基因组分子标记进行全基因组关联分析,筛选出性状相关标记;
[0011]针对中遗传力和低遗传力的性状,将所述第一基因组分子标记和所述性状相关标记进行合并,并基于第一混合模型方程组,得到育种值;针对高遗传力的性状,将所述第一基因组分子标记与所述性状相关标记作为具有不同遗传方差的两个组分,并基于第二混合模型方程组,得到育种值。
[0012]可选的,所述对所述全基因组分子标记进行修剪之前,所述方法还包括:
[0013]基于预设条件对所述全基因组分子标记进行过滤,得到第二基因组分子标记;
[0014]所述对所述全基因组分子标记进行修剪,包括:
[0015]对所述第二基因组分子标记进行修剪。
[0016]可选的,所述对所述全基因组分子标记进行修剪,包括:
[0017]采用聚类法对所述全基因组分子标记进行修剪。
[0018]可选的,所述对所述全基因组分子标记进行修剪,包括:
[0019]采用平均距离法对所述全基因组分子标记进行修剪。
[0020]可选的,所述利用所述第一基因组分子标记构建亲缘关系矩阵,包括:
[0021]利用所述第一基因组分子标记,按照如下公式构建所述亲缘关系矩阵:
[0022][0023]其中,Z表示中心化的基因型矩阵,Z

表示Z矩阵的转置矩阵,p表示最小等位基因频率。
[0024]可选的,所述利用所述亲缘关系矩阵对所述全基因组分子标记进行全基因组关联分析,筛选出性状相关标记,包括:
[0025]基于所述亲缘关系矩阵,对所述全基因组分子进行统计检验,将显著性水平值小于第一预设阈值的标记作为性状相关标记。
[0026]可选的,所述第一混合模型方程组,包括:
[0027]y=μ+Zg+e
[0028]其中,y表示表型向量,μ表示整体均值,g表示加性遗传效应,即育种值,G
m
为采用合并标记构建的亲缘关系矩阵,e表示残差,Z为关联矩阵。
[0029]可选的,所述第二混合模型方程组,包括:
[0030]y=μ+Z1g1+Z2g2+e
[0031]其中,y表示表型向量,μ表示整体均值,g1和g2分别表示基于修剪标记和性状相关标记的加性遗传效应,e表示残差,Z1和Z2为关联矩阵,育种值为g1+g2。
[0032]本申请的第二方面提供一种估计基因组育种值的装置,包括:
[0033]获取模块,用于获取高密度的全基因组分子标记;
[0034]处理模块,用于对所述全基因组分子标记进行修剪,得到第一基因组分子标记;
[0035]构建模块,用于利用所述第一基因组分子标记构建亲缘关系矩阵;
[0036]筛选模块,用于利用所述亲缘关系矩阵对所述全基因组分子标记进行全基因组关联分析,筛选出性状相关标记;
[0037]计算模块,用于针对中遗传力和低遗传力的性状,将所述第一基因组分子标记和所述性状相关标记进行合并,并基于第一混合模型方程组,得到育种值;针对高遗传力的性状,将所述第一基因组分子标记与所述性状相关标记作为具有不同遗传方差的两个组分,并基于第二混合模型方程组,得到育种值。
[0038]本申请的第三方面提供一种估计基因组育种值的系统,包括:
[0039]处理器,以及与所述处理器相连接的存储器;
[0040]所述存储器用于存储计算机程序;
[0041]所述处理器用于调用并执行所述存储器中的所述计算机程序,以执行如本申请的第一方面所述的方法。
[0042]本申请提供的技术方案可以包括以下有益效果:
[0043]本申请的方案中,在获取到高密度的全基因组分子标记后,可以通过对全基因组分子标记进行修剪来得到第一基因组分子标记,以降低标记冗余,减少计算消耗;继而利用
第一基因组分子标记构建亲缘关系矩阵,再利用得到的亲缘关系矩阵对全基因组分子标记进行关联分析,从而筛选出性状相关标记。在确定得到第一基因组分子标记和性状相关标记后,针对中、低遗传力性状,可以将第一基因组分子标记和性状相关标记进行合并,继而采用第一混合模型方程组计算育种值;针对高遗传力性状,可以将全基因组分子标记和性状相关标记作为具有不同遗传方差的两个组分,采用第二混合模型方程组计算育种值。如此,利用高密度分子标记进行基因组预测,提高了基因组选择准确性,同时,提高了计算效率、减小了对计算资源的消耗,有利于加快动植物的遗传改良。
附图说明
[0044]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1是本申请一个实施例提供的一种估计基因组育种值的方法的流程图。
[0046]图2是本申请另一个实施例提供的一种估计基因组育种值的装置的结构示意图。
[0047]图3是本申请另一个实施例提供的一种估计基因组育种值的系统的结构示意图。
具体实施方式
[0048]为使本申请的目的、技术方案和优点更加清楚,下面将对本申请的技术方案进行详细的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种估计基因组育种值的方法,其特征在于,包括:获取高密度的全基因组分子标记;对所述全基因组分子标记进行修剪,得到第一基因组分子标记;利用所述第一基因组分子标记构建亲缘关系矩阵;利用所述亲缘关系矩阵对所述全基因组分子标记进行全基因组关联分析,筛选出性状相关标记;针对中遗传力和低遗传力的性状,将所述第一基因组分子标记和所述性状相关标记进行合并,并基于第一混合模型方程组,得到育种值;针对高遗传力的性状,将所述第一基因组分子标记与所述性状相关标记作为具有不同遗传方差的两个组分,并基于第二混合模型方程组,得到育种值。2.根据权利要求1所述的方法,其特征在于,所述对所述全基因组分子标记进行修剪之前,所述方法还包括:基于预设条件对所述全基因组分子标记进行过滤,得到第二基因组分子标记;所述对所述全基因组分子标记进行修剪,包括:对所述第二基因组分子标记进行修剪。3.根据权利要求1所述的方法,其特征在于,所述对所述全基因组分子标记进行修剪,包括:采用聚类法对所述全基因组分子标记进行修剪。4.根据权利要求1所述的方法,其特征在于,所述对所述全基因组分子标记进行修剪,包括:采用平均距离法对所述全基因组分子标记进行修剪。5.根据权利要求1所述的方法,其特征在于,所述利用所述第一基因组分子标记构建亲缘关系矩阵,包括:利用所述第一基因组分子标记,按照如下公式构建所述亲缘关系矩阵:其中,Z表示中心化的基因型矩阵,Z

表示Z矩阵的转置矩阵,p表示最小等位基因频率。6.根据权利要求1所述的方法,其特征在于,所述利用所述亲缘关系矩阵对所述全基因组分子标记进行全基因组关联分析,筛选出性状相关标记,包括:基于所述亲缘关系矩阵,对...

【专利技术属性】
技术研发人员:苗泽圃李勇杨漫漫沈俊燃王然韩虎
申请(专利权)人:深圳市华大农业应用研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1