一种生物育种的基因型测定方法及系统技术方案

技术编号:24358116 阅读:102 留言:0更新日期:2020-06-03 03:00
本发明专利技术提出了一种生物育种的基因型测定方法和系统,所属方法包括:选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T‑H)在子集H基础上的条件方差最小;对子集H测定高密度的基因型,对子集L测定低密度的基因型,其中L=T‑H;利用子集H的测定结果对子集L的测定结果进行参考填充。本发明专利技术通过子集L在子集H基础上的条件方差最小来选择子集H,可以选择最优的子集H,可以获得子集L的最优填充率,进而获得更准确的全基因组的育种值估计。

A method and system for genotyping in biological breeding

【技术实现步骤摘要】
一种生物育种的基因型测定方法及系统
本专利技术涉及生物育种
,尤其涉及一种生物育种的基因型测定方法及系统。
技术介绍
在一些单个个体价值不高的物种的育种中,基因型测定成本成为阻碍推广基因组选择的主要因素。同时使用高密度和低密度基因型测定,并且利用高密度结果做参考,对低密度的结果进行填充可以大大降低基因型测定成本。而这样的基因型测定策略有两个制约因素:一个是填充的方法/软件,用于填充的软件有很多,例如Beagle,α-impute,F-impute等,关于同样数据的填充,它们的效果相近;另外一个因素则是选择哪些个体来做高密度的基因型测定,选择合适的个体集来做参考可获得更高的填充准确度。若将需要测定基因型的个体用T表示,其中测定高密度基因型的个体用H表示,测定低密度基因型的个体用L表示,传统方法通常是选择那些与L平均亲缘关系最大的那些个体做H,但通过这些方法选择的H对L进行填充后,L的填充率不佳,进而导致全基因组的育种值估计的准确性低。
技术实现思路
有鉴于此,本专利技术提出了一种生物育种的基因型测定方法,以解决传统基因型测定方法选择H的方式导致L的填充率不佳,进而导致全基因组的育种值估计准确性低的问题。本专利技术的技术方案是这样实现的:本专利技术提供了一种生物育种的基因型测定方法,包括:选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T-H)在子集H基础上的条件方差最小;对子集H测定高密度的基因型,对子集L测定低密度的基因型,其中L=T-H;利用子集H的测定结果对子集L的测定结果进行参考填充。可选的,所述选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T-H)在子集H基础上的条件方差最小,包括:获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体;根据矩阵A计算使子集L在子集H基础上条件方差最小的子集H。可选的,所述获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体,包括:重新编码系谱中的个体,形成两列数据,每个个体一行,起始值为1的行号即为个体号,每行的两个数字分别是该个体的父号和母号,未知的父或母用0来表示;从子集T中个体的父母开始递归追溯所有祖先,设每次追溯的祖代编码为i和j;若i或j为零即未知的祖先,则返回0;若i>j则交换i和j;若已有个体i和个体j之间的关系记录,返回该记录;若i==j,返回1+Aii/2;否则,查找i的父母p和m,递归计算p与j和m与j的关系,此时p和m为递归函数参数的新的i;利用二叉树记录记录路径中非零个体间的亲缘关系数值并构建矩阵A;其中Aii为矩阵A中个体i对应的对角线元素。可选的,所述获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体,还包括:若所有子集T已具有低密度基因型数据,则用所述低密度基因型数据构建的矩阵G替代矩阵A。可选的,所述获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体,还包括:若只有部分子集T已具有低密度基因型数据,则用所述低密度基因型数据与矩阵A整合的新矩阵作为矩阵A。可选的,所述根据矩阵A计算使子集L在子集H基础上条件方差最小的子集H,包括:设定新生代候选育种个体为目标群体;从所述目标群体的整个系谱中选择使得A:iAi:/Aii的迹最大的个体i并作为子集H的成员;计算A(1)=A-A:iAi:/Aii,选择使得的迹最大的个体i并作为子集H的成员;计算选择使得的迹最大的个体i并作为子集H的成员;重复上述步骤,直至子集H满员;其中A:i为个体i与所述目标群体在矩阵A中的关系列向量,Ai:为个体i与所述目标群体在矩阵A中的关系行向量,A(1)为所述目标群体关于个体i的条件关系矩阵,A(2)为所述目标群体关于子集H中前两个个体的条件关系矩阵。本专利技术的生物育种的基因型测定方法相对于现有技术具有以下有益效果:(1)本专利技术的生物育种的基因型测定方法通过子集L在子集H基础上的条件方差最小来选择子集H,可以选择最优的子集H,可以获得子集L的最优填充率,进而获得更准确的全基因组的育种值估计;(2)本专利技术的生物育种的基因型测定方法采用递归加二叉树存储中间结果来计算局部的矩阵A,极大地简化了存储、加快了计算;(3)本专利技术的生物育种的基因型测定方法逐步递增H,先找出能够使最小的那个个体,之后以此类推的方法从T中选最优的H子集,可以进一步的简化计算。另一方面,本专利技术还提出一种生物育种的基因型测定系统,以解决传统基因型测定方法选择H的方式导致L的填充率不佳,进而导致全基因组的育种值估计准确性低的问题。本专利技术的技术方案是这样实现的:一种生物育种的基因型测定系统,包括:子集H计算模块,用于选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T-H)在子集H基础上的条件方差最小;基因型测定模块,用于对子集H测定高密度的基因型,对子集L测定低密度的基因型,其中L=T-H;参考填充模块,用于利用子集H的测定结果对子集L的测定结果进行参考填充。所述生物育种的基因型测定系统与上述生物育种的基因型测定方法相对于现有技术所具有的优势相同,在此不再赘述。另一方面,本专利技术还提出一种计算机可读存储介质,以解决传统基因型测定方法选择H的方式导致L的填充率不佳,进而导致全基因组的育种值估计准确性低的问题。本专利技术的技术方案是这样实现的:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器读取并运行时,实现上述任一项所述的生物育种的基因型测定方法。所述计算机可读存储介质与上述生物育种的基因型测定方法相对于现有技术所具有的优势相同,在此不再赘述。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的生物育种的基因型测定方法的流程图;图2为本专利技术的步骤S1的流程图;图3为本专利技术的步骤S11的流程图;图4为本专利技术的步骤S12的流程图;图5为本专利技术的各种基因型测定方法填充结果的比较图;图6为本专利技术在极低密度50SNP/摩尔根时,子集H大小(200,100)以及标记最低频率对填充效果的影响示意图;图7为本专利技术的生物育种的基因型测定系统的结构框图。附图标记说明:10-子集H计算模块;20-基因型测定模块;30-参考填充模块。具体实施方式下面将结合本专利技术实施方式,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本专利技术一部分实施方式,而不是全部的实施方本文档来自技高网...

【技术保护点】
1.一种生物育种的基因型测定方法,其特征在于,包括:/n选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T-H)在子集H基础上的条件方差最小;/n对子集H测定高密度的基因型,对子集L测定低密度的基因型,其中L=T-H;/n利用子集H的测定结果对子集L的测定结果进行参考填充。/n

【技术特征摘要】
1.一种生物育种的基因型测定方法,其特征在于,包括:
选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T-H)在子集H基础上的条件方差最小;
对子集H测定高密度的基因型,对子集L测定低密度的基因型,其中L=T-H;
利用子集H的测定结果对子集L的测定结果进行参考填充。


2.如权利要求1所述的生物育种的基因型测定方法,其特征在于,所述选择需要测定基因型的育种候选个体子集T中的子集H,其中子集(T-H)在子集H基础上的条件方差最小,包括:
获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体;
根据矩阵A计算使子集L在子集H基础上条件方差最小的子集H。


3.如权利要求2所述的生物育种的基因型测定方法,其特征在于,所述获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体,包括:
重新编码系谱中的个体,形成两列数据,每个个体一行,起始值为1的行号即为个体号,每行的两个数字分别是该个体的父号和母号,未知的父或母用0来表示;
从子集T中个体的父母开始递归追溯所有祖先,设每次追溯的祖代编码为i和j;
若i或j为零即未知的祖先,则返回0;若i>j则交换i和j;若已有个体i和个体j之间的关系记录,返回该记录;若i==j,返回1+Aii/2;否则,查找i的父母p和m,递归计算p与j和m与j的关系,此时p和m为递归函数参数的新的i;
利用二叉树记录记录路径中非零个体间的亲缘关系数值并构建矩阵A;
其中Aii为矩阵A中个体i对应的对角线元素。


4.如权利要求3所述的生物育种的基因型测定方法,其特征在于,所述获取子集T的局部分子血缘系数矩阵A,所述局部为需要测定基因型的部分个体,还包括:
若所有子集T已具有低密度基因型数据...

【专利技术属性】
技术研发人员:于希江梅森贾伟
申请(专利权)人:多谱武汉生物科技有限公司
类型:发明
国别省市:湖北;42

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1