当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于混合线性模型的种子数量性状位点定位方法技术

技术编号:9766078 阅读:310 留言:0更新日期:2014-03-15 12:19
本发明专利技术公开了一种基于混合线性模型的种子数量性状位点定位方法,包括:建立统计遗传模型;在全基因组范围内搜索所有可能存在QTL的候选标记区间:将所述的候选标记区间作为协变量,在全基因组范围内搜索显著的QTL位点和二互作标记区间;以所述的QTL位点和二互作标记区间作为协变量,在显著的互作标记区间内搜索显著的二互作上位性的位点;通过所述QTL位点和二互作上位性的位点,获得统计遗传模型中各种效应的系数,然后通过统计遗传模型,计算这些位点的效应以及估算每个位点的遗传率。本发明专利技术将种子性状分成二倍体种子和三倍体种子,考虑了上位性效应及基因与环境互作的效应,可快速无偏的估计种子数量性状位点的位置及各种效应。

【技术实现步骤摘要】

本专利技术涉及种子数量性状位点定位领域,具体涉及一种基于混合线性模型种子数量性状位点定位方法。技术背景作物种子是人类食物,动物饲料以及工业原料的主要来源。胚或胚乳是种子中的主要成分。胚乳作为储藏营养物质的主要器官,比如碳水化合物,蛋白质和矿物质等,它同时也会胚的发育提供营养。胚乳在有些物种成熟时会消失,比如拟南芥。无论胚乳消失与否,它都将会对胚的发育产生影响。此外,种子是长在母体植株中,因此母体植株对种子的发育也会产生影响。种子数量性状位点定位的研究已经成为数量遗传领域的研究热点之 一 O近年来,种子数量性状位点的定位尤其是对农作物品质性状的研究方面的应用十分广泛。早在1994年,莫惠栋(Mo HD.Genetic analysis for qualitative-quantitativetraits II1.Endosperm character under triploid genetic control.Acta agronomicaSinica,1994,20 (5):513-519)提出了一个统计遗传模型,可以把种子性状的表型方差分解为各种各样的遗传和环境因子。1994年,朱军和Bruce Weir (Zhu J, Weir.BSAnalysisof Cytoplasmic and Maternal Effects.2.Genetic Models for Triploid Endosperms.Theor Appl Genet,1994,89 (2-3): 160-166)进一步提出了混合线性模型方法,利用双列杂交试验分析了母体效应,胚,胚乳和细胞质效应,以及各种效应与环境的互作。以上这些方法都只能把种子性状的遗传变异分解为各种各样的方差分量,把控制性状的所有基因当做一个整体来分析,而不能得到单个基因水平上的更详细的信息,比如数量性状位点的位置以及存在的各种效应。随着分子标记技术的发展,数量性状位点定位的方法被提出和运用到作物种子性状的定位研究中。但是种子中的主要成分胚乳是三倍体,因此不能用一般的定位方法。基于这个遗传背景,Kao (Kao CH.Multiple-1nterval Mapping for Quantitative Trait LociControlling Endosperm Traits.Genetics, 2004, 167 (4): 1987-2002)在 2004 年提出运用多区间作图方法,同时充分考虑到三倍体胚乳的性质。这种方法可以分析胚乳的各种效应。然而,种子一个很重要的特征是,它长在母体植株上,因此种子的发育也会受到母体植株的影响。鉴于此,Hu 和 Xu(Hu ZQ, Xu Cff.A New Statistical Method for Mapping QTLsunderlying Endosperm Traits.Chinese Sci Bull, 2005, 50 (14): 1470-1476)提出了一个统计遗传模型,他们把母体基因组和后代基因组整合在同一个模型中,使模型更加接近种子性状发育的遗传机制。据我们所知,上位性,即一个基因的表达依赖于另外一个基因,在数量性状的发育和进化中起着重要的作用。大量的研究已经表明,上位性对性状的遗传变异也产生了不可忽略的贡献。通常所说的上位性,指的是来自同一基因组的两个基因之间的互作;然而在种子性状中,存在着两个不同的基因组,因此上位性的两个基因可能是来自不同的基因组。随着人们对上位性的重要性的深入了解,大量的遗传模型已经被提出来。在种子性状的研究中,Cui (Cui Y, Wu R.Mapping Genome-genome Epistasis: A High-dimensional Model.Bioinformatics, 2005, 21 (10):2447-2455)提出了一种统计方法和框架去探索母体和后代的基因组之间的互作关系。然而,迄今为止,尚未见有报道环境效应以及基因与环境的互作效应,也没有把上位性和基因与环境互作效应整合在一个模型中的方法。
技术实现思路
本专利技术提供了一种基于混合线性模型种子数量性状位点定位方法,充分考虑到种子性状的遗传机制,把种子性状分成主要以胚控制的二倍体种子和主要以胚乳控制的三倍体种子。在本专利技术中,把母体基因组和后代基因组整合在同一个遗传模型中,同时把同一基因组和不同基因组之间的上位性效应以及基因与环境互作的效应加入到模型中,能够快速无偏的估计种子数量性状位点的位置以及各种效应,提高了育种学家进行分子辅助育种的效率和精确性。一种基于混合线性模型的三倍体种子数量性状位点定位方法,包括:( 1)统计遗传模型的建立:对一衍生于两个纯合亲本(Pl,P2)的交配作图群体,假设在t个不同的环境下进行遗传实验,每个环境设置b个区组,某一种子数量性状的变异受s个QTL (Ql,Q2,……,Qs)和t个上位性的调控,则环境h中第j个区组内第i个株系后代种子性状表型观测值(yhiJ)可用下面的混合线性模型(I)表示:本文档来自技高网
...

【技术保护点】
一种基于混合线性模型的三倍体种子数量性状位点定位方法,其特征在于,包括:(1)统计遗传模型的建立:对一衍生于两个纯合亲本(P1,P2)的交配作图群体,假设在t个不同的环境下进行遗传实验,每个环境设置b个区组,某一种子数量性状的变异受s个QTL(Q1,Q2,……,Qs)和t个上位性的调控,则环境h中第j个区组内第i个株系后代种子性状表型观测值(yhij)可用下面的混合线性模型(1)表示:yhij=μh+Σks(akmxkiAm+dkmxkiDm+akexkiAe+dkexkiDe)+eh+Σk,l∈(1,2,...s),k≠lt(aaklmmxkiAmxliAm+aakleexkiAexliAe+aaklmexkiAmxliAe+aaklemxkiAexliAm)+Σks(aekhmxkiAm+dekhmxkiDm+aekhexkiAe+dekhexkiDe)+Σk,l∈(1,2,...s),k≠lt(aaeklhmmxkiAmxliAm+aaeklheexliAe+aaeklhmexkiAmxliAe+aaeklhemxkiAexliAm)+Bj(h)+ϵhij---(1);其中,模型(1)中的和分别是Qk的母体加性和母体显性效应,对应的系数分别为和和分别是Qk的母体加性与环境h的互作效应,母体显性效应与环境h的互作效应,分别是Qk的胚乳加性、胚乳显性效应,对应系数分别是和分别是Qk的胚乳加性与环境的互作效应、胚乳显性效应与环境的互作效应,分别是Qk母体加性和Ql母体加性的互作效应,Qk胚乳加性和Ql胚乳加性的互作效应,Qk母体加性和Ql胚乳加性的互作效应,Qk胚乳加性和Ql母体加性的互作效应,对应的系数分别是是和环境h的互作效应;是和环境h的互作效应;是和环境h的互作效应;是和环境h的互作效应;μh是群体在环境h中的平均数;eh是第h个环境的随机效应,是环境内的区组效应,εhij是剩余效应,(2)全基因组扫描显著的标记区间:基于模型(2),在全基因组范围内,通过表型和每个标记区间做基于HendersonⅢ的F检验,搜索得到所有可能存在QTL的候选标记区间:yhij=μh+ζti+Amath+m+ζti+Dmdth+m+ζti+Aeath+e+ζti+Dedth+e+ζti-Amath-m+ζti-Dmdth-m+ζti-Aeath-e+ζti-Dedth-e+Bj(h)+ϵhij---(2);其中,t(t=1,…,T)表示在T个总区间中的第t个标记区间;和分别代表在环境h中第t个区间的右边标记的母体加性和在环境h中第t个区间的右边标记的母体显性效应,对应的系数分别为和和分别代表在环境h中第t个区间的左边标记的母体加性和在环境h中第t个区间的左边标记的母体显性效应,对应的系数分别为和和分别代表在环境h中第t个区间的右边标记的胚乳加性,在环境h中第t个区间的右边标记的胚乳显性效应,对应的系数分别为和和分别代表在环境h中第t个区间的左边标记的胚乳加性,在环境h中第t个区间的左边标记的胚乳显性效应,对应的系数分别为和其余参数的含义与模型(1)中的相同;(3)在全基因组范围内搜索显著的数量性状位点:将步骤(2)中得到的候选标记区间作为模型(3)的协变量,然后基于模型(3),以1cM为步长,在全基因组范围内做基于HendersonⅢ的F检验,搜索显著的QTL位点;如果已经搜索到s个显著的候选区间,那么检测一个位点k的显著性模型如下:yhij=μh+xkiAm+akhm+xkiDmdkhm+xkiAeakhe+xkiDedkhe+Σt=1s(ζti+Amath+m+ζti+Dmdth+m+ζti+Aeath+e+ζti+Dedth+e)+Σt=1s(ζti-Amath-m+ζti-Dmdth-m+ζti-Aeath-e+ζti-Dedth-e)+Bj(h)+ϵhij---(3);其中,和分别是QTL?k在环境h中的母体加性和显性效应;和分别是胚乳加性和显性效应;其余参数的含义与模型(1)和模型(2)中的相同;(4)在全基因组范围内搜索显著的二互作标记区间:将步骤(2)中得到的候选标记区间作为模型...

【技术特征摘要】
1.一种基于混合线性模型的三倍体种子数量性状位点定位方法,其特征在于,包括: (1)统计遗传模型的建立: 对一衍生于两个纯合亲本(Pl,P2)的交配作图群体,假设在t个不同的环境下进行遗传实验,每个环境设置b个区组,某一种子数量性状的变异受s个QTL (Q1,Q2,……,Qs)和t个上位性的调控,则环境h中第j个区组内第i个株系后代种子性状表型观测值(yhij)可用下面的混合线性模型(I)表示: 2.如权利要求1所述的基于混合线性模型的三倍体种子数量性状位点定位方法,其特征在于,步骤(6)中,通过模型(1),计算得到这些位点的效应以及估算每个位点的遗传率时,首先给每个未知的参数一个初始值,随机效应的方差估计通过最小范数二阶无偏估计法获得,固定效应的估计通过最小二乘法获得,随机效应通过调整的无偏预测法预测,然后把这些得到的值作为后验值通过吉布斯抽样放入马尔科夫链蒙特卡洛循环链中,通过归纳吉布斯的所有样本的结果,最终得到每个效应的估计值以及估算每个位点的遗传...

【专利技术属性】
技术研发人员:徐海明祁婷曹玉杰祝水金楼向阳
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1