The invention relates to the technical field of crop molecular breeding and genome-wide association analysis, in particular to a method for improving the accuracy of genome-wide prediction (GP). This method includes: (1) phenotypic and genotype identification of the target crop population, and then based on the genome-wide association analysis (GWAS) of the whole population, four single base mutations (SNPs) with the greatest effect are found; (2) taking the four SNPs with the greatest effect as the fixed effect, adding genotype and environment interaction components into the combined GP model can maximize the accuracy of prediction. The invention can improve the prediction accuracy as much as possible by only using the existing data information after completing the genotype and phenotype identification without increasing other human and material resources input. When the invention is applied to molecular breeding, the prediction efficiency will be improved, the reliability of prediction will be improved and the breeding cost will be saved.
【技术实现步骤摘要】
一种提高全基因组预测准确性的方法
本专利技术属于作物分子育种领域,具体涉及到通过改良全基因组预测(GP)线性模型组分来提高GP预测准确性的方法,具体方向为现代农业技术。
技术介绍
全基因组预测(GP)是一种新型的分子育种技术,这种技术需要建立两个群体,一个是训练群体,一个是预测群体。其中训练群体需要进行表型和基因型鉴定,利用训练群体估计分子标记的标记效应,从而根据标记效应来估计预测群体的育种值。与常规的分子标记辅助育种(MAS)相比,GP具有如下优点,一是GP不需要鉴定显著性的数量性状位点(QTL),二是GP可以照顾到微效QTL的信息,三是GP可以通过加快育种周期和提高遗传增益,从而提高育种效率。提高GP预测的准确性可以提高GP辅助育种的效率,从而更加准确地预测测试材料的表型。前人对GP预测准确性的影响因素的研究主要集中于群体大小、标记密度、遗传基础、群体间的亲缘关系、连锁不平衡程度等。这些影响因素是进行GP育种项目前需要考虑的工作。本专利技术关注的重点在于,当所有数据已经获得,通过对数据进行处理能不能提高预测的准确性。典型的GP模型是y=Xβ+Zu+ε,在这个模型中,β是固定效应,u是随机效应。对小麦的抗锈病的研究发现,使用与Sr2连锁的标记作为固定效应的GBLUP模型的预测准确性(PA)比普通GBLUP更准确。利用一个水稻育种群体进行全基因组关联分析(GWAS),把显著的标记作为固定效应的GP模型的预测准确性优于其他六个模型(Spindel等,2016)。在玉米中,通常从两个优良自交系杂交产生的F1植株后 ...
【技术保护点】
1.一种提高全基因组预测准确性的方法,其特征在于,包括以下步骤:/n(1)对目标作物群体进行表型和基因型鉴定,然后基于对整个群体的全基因组关联分析,找到效应最大的N个单碱基变异SNPs;所述N为正整数,其取值由基于GP预测准确性的显著性检验而定;/n(2)把效应最大的N个SNPs作为固定效应,在并全基因组预测模型中加入基因型与环境互作组分,进行全基因组预测分析。/n
【技术特征摘要】
1.一种提高全基因组预测准确性的方法,其特征在于,包括以下步骤:
(1)对目标作物群体进行表型和基因型鉴定,然后基于对整个群体的全基因组关联分析,找到效应最大的N个单碱基变异SNPs;所述N为正整数,其取值由基于GP预测准确性的显著性检验而定;
(2)把效应最大的N个SNPs作为固定效应,在并全基因组预测模型中加入基因型与环境互作组分,进行全基因组预测分析。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中,对目标作物群体的表型分析,确保目标作物种群在不同环境中有共同的遗传基础。
3.根据权利要求1所述的方法,其特征在于,步骤(1)中,进行表型分析时,计算整个群体的最佳线性无偏估计值BLUE值和广义遗传力H2,BLUE值用于后续关联分析,H2用于评估数据质量,在计算BLUEs和H2时,利用如下模型:
yijm=μ+gi+ej+geij+δ(j)m+εijm,
其中yijm是第ith(i=1,2...,481)个基因型在第jth(j=1,2,3,4)环境下表型,mth(m=1,2)表示镶嵌在环境下的重复;μ是总体平均,gi是基因型效应,ej是环境效应,geij是基因型与环境互作效应,δ(j)m是重复效应,εijm是剩余残差;当计算BLUEs时,gi作为固定效应,其他变量作为随机效应。
4.根据权利要求3所述的方法,其特征在于,H2的计算公式是:
在计算H2时,所有效应均为随机效应以便估计每个效应的方差,其中和分别代表遗传方差、遗传与环境互作方差和残差,Ne表示环境数,r表示重复数。
5.根据权利要求1所述的方法,其特征在于,步骤(1)中,全基因组关联分析的模型是:
y*=Xβ+Zg+Wτ+ε
其中y*是BLUEs,β是固定效应,在这里只包含总体平均值,g是遗传背景效应,τ是标记效应作为随机变量,ε是残差;X、Z和W是设计矩阵。
6.根据权利要求1-5任一所述的方法,其特征在于,步骤(1)中,找到效应最大的4个单碱基变异SNPs...
【专利技术属性】
技术研发人员:张红伟,李冬冬,王国英,
申请(专利权)人:中国农业科学院作物科学研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。