当前位置: 首页 > 专利查询>集美大学专利>正文

一种通过基因组数据对遗传力进行评估的方法技术

技术编号:14564892 阅读:66 留言:0更新日期:2017-02-05 22:13
本发明专利技术公开了一种通过基因组数据对遗传力进行评估的方法,对于某一数量性状,通过使用不同数量的参考群个体利用GBLUP算法进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出估计准确度;通过基因组估计准确度与参考群体大小进行曲线直线化拟合,拟合出的回归方程的截距的倒数为遗传力的估计值;本发明专利技术通过基因组的数据对数量性状的遗传力进行评估,所研究的成果可直接应用于动植物数量性状育种中,本发明专利技术的算法不对个体进行系谱记录而是对个体基因组进行测序,通过全基因组标记来预测性状的遗传力,遗传力估计结果主要用于将来的育种工作中,另外,测序可以捕获到孟德尔抽样误差,相对记录系谱数据能够获得更准确的系谱信息。

【技术实现步骤摘要】

本专利技术涉及基因工程领域,具体是一种通过基因组数据对遗传力进行评估的算法。
技术介绍
目前的遗传力评估方法主要利用个体间的亲缘关系,采用各种统计手段,如方差分析法、相关分析法等进行推断,该方法要进行完整的系谱记录,然而对于有些物种来说,进行系谱记录工作量非常大甚至很难实现,比如水产动物;另外,传统的遗传力评估方法是把基因组信息当作“黑箱子”进行处理,这样无法捕获到基因从亲本到子代传递的具体信息,即无法准备捕获到孟德尔抽样误差,导致估计误差较大;为了解决传统遗传力估计方法中系谱记录工作量大和无法准确捕获孟德尔抽样误差的问题,需要对现有技术进行改进改良。
技术实现思路
本专利技术的目的在于提供一种克服传统遗传力估计中的误差较大和系谱记录繁琐的问题。通过基因组数据对遗传力进行评估的算法,以解决上述
技术介绍
中提出的问题。本专利技术不进行个体的系谱记录,直接对所有个体的基因组进行测序,结合个体的性能记录和基因组标记信息,估计出基因组育种值的估计准确度,进而估计出性状的遗传力。为实现上述目的,本专利技术提供如下技术方案:一种通过基因组数据对遗传力进行评估的算法,对于某一数量性状,通过使用不同数量的参考群个体进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出估计准确度;上述过程其实就是基因组选择的具体过程,此专利技术中采用GBLUP作为计算标记效应的算法,GBLUP算法在2001年由Meuwissen等人专利技术,其先验分布认为基因组所有标记位点的效应方差是相等的,标记效应可以通过下述公式计算得出:ln′lnln′XX′lnX′X+Iλμ^g^ln′yX′y---(1)]]>其中,为总体平均值;为所有标记位点的效应向量;基因组估计育种值(GEBV)通过将所有标记位点的效应相加而获得,即GEBV=∑Xigi;GEBV估计准确性通过计算GEBV与真实育种值(TBV)的相关系数,即r(GEBV,TBV);同时,Daetwyler等人在2008年推导出了在GBLUP算法估计育种值的情况下,r(GEBV,TBV)的另一计算公式为:r(GEBV,TBV)=Nph2Nph2+M---(2)]]>其中,Np为参考群的个体数量;h2为所研究的性状的遗传力;M为决定该性状的有效基因组片段的数目;然而在实际生产中,无法得知TBV的具体数值,因此用表型值(Y)替代TBV,推导出GEBV与Y的关系为:r(GEBV,Y)=r(GEBV,TBV)*h=Nph2Nph2+M*h---(3)]]>在公式(3)中,通过调整Np的大小可获得不同的r(GEBV,Y)的值,拟合该曲线方程,拟合的方式采用曲线直线化,对公式(3)进行整理,得到线性方程:1r(GEBV,Y)2=1h2+Mh4*1Np---(4)]]>该方程相当于线性回归模型y=a+bx,其中y为r(GEBV,Y)的平方的倒数,x为Np的倒数,方程的截距a即是遗传力的倒数,通过求该方程的截距的倒数,求出遗传力的估计值。作为本专利技术进一步的方案:对所有个体基因组进行测序,获得SNP信息,所有个体的SNP位点对应,缺失数据通过imputation方法补齐。作为本专利技术再进一步的方案:为防止单次估计误差较大,采用多次杂交验证的方法,反复从总体中随机抽取参考群体和估计群体,来获得接近真实值的估计结果。作为本专利技术再进一步的方案:使用不同的参考群数目结合GBLUP算法来计算基因组各个标记的效应值,以得到估计群的育种值,通过对估计群的育种值和表型值进行相关分析得到估计准确度与现有技术相比,本专利技术的有益效果是:本专利技术通过基因组的数据对数量性状的遗传力进行评估,所研究的成果可直接应用于动植物数量性状育种中,本专利技术的算法可以在不建立家系的基础上,通过全基因组标记来预测性状的遗传力,解决了系谱记录繁琐甚至很难实现的问题,并且由于测序可以捕获到孟德尔抽样误差,本专利技术的算法相对记录系谱数据能够获得更准确的系谱信息。附图说明图1为本专利技术的算法流程图。图2为本专利技术中体重和体长两个性状的GEBV准确度随参考群体大小变化的趋势图。图3为本专利技术中体重和体长两个性状的GEBV准确度和参考群体大小按照公式4转换后的趋势图。其中,横坐标的值为参考群个体数的倒数值;纵坐标的值为GEBV准确度的平方的倒数;R2为回归方程的决定系数。具体实施方式下面结合具体实施方式对本专利的技术方案作进一步详细地说明。请参阅附图1-3,一种通过基因组数据对遗传力进行评估的算法,对于某一数量性状,通过使用不同数量的参考群个体进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出估计准确度;通过基因组估计准确度与参考群体大小进行曲线直线化拟合,拟合出的回归方程的截距的倒数为遗传力的估计值;其特征在于:基因组选择的具体过程采用GBLUP作为计算标记效应的算法,基因组所有标记位点的效应方差是相等的,标记效应通过以下公式计算得出:ln′lnln′XX′lnX′X+Iλμ^g^ln′yX′y---(1)]]>其中,为总体平均值;为所有标记位点的效应向量;基因组估计育种值(GEBV)通过将所有标记位点的效应相加获得,即GEBV=∑Xigi;GEBV估计准确性通过计算GEBV与真实育种值(TBV)的相关系数,即r(GEBV,TBV)得出;在GBLUP算法估计育种值的情况下,r(GEBV,TBV)的另一计算公式为:r(GEBV,TBV)=Nph2Nph2+M---(2)]]>其中,Np为参考群的个体数量;h2为所研究的性状的遗传力;M为决定该性状的有效基因组片段的数目;在实际生产中,无法得知TBV的具体数值,因此用表型值(Y)替代TBV,推导出GEBV与Y的关系为:r(GEBV,Y)=r(GEBV,TBV)*h=Nph2Nph2+M*h---(3)]]>在公式(3)中,通过调整Np的大小可获得不同的r(GEBV,Y)的值,拟合该曲线方程,拟合的方式采用曲线直线化,对公式(3)进行整理,得到线性方程:1r(GEBV,Y)2=1h2+Mh4*1Np---(4)]]>该方程相当于线性回归模型y=a+bx,其中y为r(GEBV,Y)的平方的倒数,x为Np的倒数,方程的截距a即是遗传力的倒数,通过求该方程的截距的倒数,求出遗传力的估计值。对所有个体基因组进行测序,获得SNP信息,所有个体的SNP位点对应,缺失数据通过i本文档来自技高网...

【技术保护点】
一种通过基因组数据对遗传力进行评估的算法,对于某一数量性状,通过使用不同数量的参考群个体进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出估计准确度;通过基因组估计准确度与参考群体大小进行曲线直线化拟合,拟合出的回归方程的截距的倒数为遗传力的估计值;其特征在于:基因组选择的具体过程采用GBLUP作为计算标记效应的算法,基因组所有标记位点的效应方差是相等的,标记效应通过以下公式计算得出:1n′1n1n′XX′1nX′X+Iλμ^g^=1n′yX′y---(1)]]>其中,为总体平均值;为所有标记位点的效应向量;基因组估计育种值(GEBV)通过将所有标记位点的效应相加获得,即GEBV=∑Xigi;GEBV估计准确性通过计算GEBV与真实育种值(TBV)的相关系数,即r(GEBV TBV)得出;在GBLUP算法估计育种值的情况下,r(GEBV TBV)的另一计算公式为:r(GEBV,TBV)=Nph2Nph2+M---(2)]]>其中,Np为参考群的个体数量;h2为所研究的性状的遗传力;M为决定该性状的有效基因组片段的数目;在实际生产中,无法得知TBV的具体数值,因此用表型值(Y)替代TBV,推导出GEBV与Y的关系为:r(GEBV,Y)=r(GEBV,TBV)*h=Nph2Nph2+M*h---(3)]]>在公式(3)中,通过调整Np的大小可获得不同的r(GEBV,Y)的值,拟合该曲线方程,拟合的方式采用曲线直线化,对公式(3)进行整理,得到线性方程:1r(GEBV,Y)2=1h2+Mh4*1Np---(4)]]>该方程相当于线性回归模型y=a+bx,其中y为r(GEBV,Y)的平方的倒数,x为Np的倒数,方程的截距a即是遗传力的倒数,通过求该方程的截距的倒数,求出遗传力的估计值。...

【技术特征摘要】
1.一种通过基因组数据对遗传力进行评估的算法,对于某一数量性状,通过使用不同
数量的参考群个体进行全基因组的标记效应的估计,进而得到估计群的育种值,并计算出
估计准确度;通过基因组估计准确度与参考群体大小进行曲线直线化拟合,拟合出的回归
方程的截距的倒数为遗传力的估计值;其特征在于:基因组选择的具体过程采用GBLUP作为
计算标记效应的算法,基因组所有标记位点的效应方差是相等的,标记效应通过以下公式
计算得出:
1n′1n1n′XX′1nX′X+Iλμ^g^=1n′yX′y---(1)]]>其中,为总体平均值;为所有标记位点的效应向量;基因组估计育种值(GEBV)通过
将所有标记位点的效应相加获得,即GEBV=∑Xigi;GEBV估计准确性通过计算GEBV与真实育
种值(TBV)的相关系数,即r(GEBVTBV)得出;在GBLUP算法估计育种值的情况下,r(GEBVTBV)的另
一计算公式为:
r(GEBV,TBV)=Nph2Nph2+M---(2)]]>其中,Np为参考群的个体数量;h2为所研究的性状的遗传力;M为决定该性状的有效基因
组片段的数目;在实际生产中,无法得知TBV的具体数值,因此用表型值(Y)替代TBV,推导出

【专利技术属性】
技术研发人员:肖世俊董林松王志勇
申请(专利权)人:集美大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1