【技术实现步骤摘要】
一种基于遗传算法的全基因组预测方法及其应用
[0001]本专利技术属于生物信息领域,涉及一种基于遗传算法的全基因组预测方法及其应用。
技术介绍
[0002]培育优质高产、绿色高效的农作物品种是当前作物遗传育种工作的重中之重。传统的作物育种依赖于表型选择:育种家们通过在田间和实验室考察作物品系的表型,结合他们的育种经验,从中挑选出具有目标性状的品系以供进一步鉴定。然而,许多与作物的产量、品质有关的性状属于数量性状,它们由大量微效数量性状基因座控制,易受环境的影响,仅仅依靠表型进行选择是不可靠的。分子生物学的发展使得分子标记辅助选择育种成为可能,然而,分子标记辅助选择只适用于由少数主效数量性状基因座控制的性状,对作物产量、品质这样的性状,分子标记辅助选择同样无能为力。全基因组选择技术利用覆盖全基因组的高密度分子标记和作物表型构建统计模型,从而预测基因型已知但表型未知的材料的性状。全基因组选择将基因组上所有标记的效应纳入模型当中而不考虑他们的显著性水平,因而尤其适合作物产量、品质这样由微效多基因控制的数量性状。基因组最佳线性无偏估 ...
【技术保护点】
【技术特征摘要】
1.一种基于遗传算法的全基因组预测方法,其特征在于,采用遗传算法选择最优的分子标记,在此基础上结合基因组最佳线性无偏估计模型来预测个体的育种值,包括以下步骤:获取待预测作物的分子标记;随机选择一定比例的分子标记进行遗传算法初始化,并构建基因组预测模型,计算不同分子标记子集的适合度,保留适合度较高的分子标记子集,将保留的分子标记子集以一定的比率进行突变、配对、交叉互换,产生新的分子标记子集;再次计算不同分子标记子集的适合度,保留适合度较高的分子标记子集,直到达到最大迭代次数或者收敛,得到最终的分子标记子集并构建基因组最佳线性无偏估计模型;将待预测作物的基因型带入基因组最佳线性无偏估计模型,得到待预测作物的表型值。2.根据权利要求1所述的基于遗传算法的全基因组预测方法,其特征在于,所述构建基因组亲缘关系矩阵预测模型的方法包括:y是一个n
×
1的向量,代表一个数量性状的表型值,包含m个标记的混合线性模型表示为:其中X是一个n
×
q的固定效应矩阵,β是一个q
×
1的向量,表示固定效应的大小,Z
k
是一个n
×
1的向量,代表第k个标记处所有个体的基因型,ε是一个服从N(0,Iσ2)的向量,表示残差;m代表全部标记的数量,n表示样本个数,q表示固定效应的个数,γ
k
表示第k个标记效应的大小;利用限制性极大似然估计方法来求解上述的混合线性模型,估计固定效应β和随机效应γ的大小;并基于估计的参数获得测试集的预测值,进而进行交叉验证,评价模型的预测力。3.根据权利要求1所述的基于遗传算法的全基因组预测方法,其特征在于,所述随机选择的步骤包括:将所有的m个分子标记以0/1的方式进行编码,得到一个向量δ=[δ1δ2...δ
m
],其中δ
k
=0表示这个标记被排除,δ
k
=1代表这个标记被保留,上述过程随机重复100次,得到100个不同的δ向量进行GA算法初始化。4.根据权利要求1所述的基于遗传算法的全基...
【专利技术属性】
技术研发人员:徐扬,张宇翔,周恺,于广宁,李成,杨文艳,王欣,徐辰武,杨泽峰,鲁月,陈茹佳,陶天云,李鹏程,
申请(专利权)人:扬州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。