一种基于遗传背景的鱼类亲本选择系统及方法技术方案

技术编号:10261810 阅读:214 留言:0更新日期:2014-07-26 20:49
一种基于遗传背景的鱼类亲本选择系统及方法,属于利用分子生物学DNA分子标记进行鱼类繁殖时亲本选择的数据分析技术领域。本发明专利技术解决了现有基于遗传背景的分析过程复杂、需要多个处理工具配合实现的问题。所述亲本选择系统包括数据转换装置、格式转换装置、构建聚类树装置、遗传距离计算装置、近交系数计算装置、亲缘系数计算装置、群体繁殖亲本选择装置、家系繁殖亲本选择装置、家系繁殖组合装置和群体繁殖组合装置。所述亲本选择方法包括数据转换、格式转换、构建聚类树、遗传距离计算、近交系数计算、亲缘系数计算、群体繁殖亲本选择、家系繁殖亲本选择、家系繁殖组合和群体繁殖组合的步骤。本发明专利技术适用于对鱼类繁殖时亲本选择技术领域。

【技术实现步骤摘要】
一种基于遗传背景的鱼类亲本选择系统及方法
本专利技术属于利用分子生物学DNA分子标记进行鱼类繁殖时亲本选择的数据分析
,具体涉及到利用DNA分子标记进行聚类树计算、近交系数和亲缘系数计算、鱼类繁殖的亲本组合及组合评估,尤其指共显性分子标记(如微卫星分子标记(SSR或MS或SSLP或STR)、单核苷酸多态性(SNP))在鱼类繁殖时的数据分析。
技术介绍
利用分子标记进行鱼类的遗传育种,大体可以分为三个阶段:第一采用分子标记进行遗传背景分析,根据遗传背景进行亲本选择和繁殖配组;第二,通过构建遗传连锁图谱和对经济性状进行数量性状定位(QTL)分析,获得决定数量性状的标记或基因,进行分子标记辅助选择(MAS);第三,通过对全基因分析和转录分析,基于基因组或转录组在全基因组范围内进行分子设计育种(孙效文等,2010)。后两个阶段的应用中需要对研究的物种进行深入的遗传和分子生物学研究,对大部分物种(特别是鱼类)来说应用有限,而第一阶段所采用的技术手段相对简单,不需要深入的遗传学分析,只需一定数量的多态性分子标记即可进行育种应用。在第一阶段的鱼类遗传育种应用中,孙效文等设计了基于遗传背景的群体选育、家系选育和群体遗传结构优化技术,将微卫星分子标记(SSR)应用到鲤的分子育种中,成功获得鲤的新品系(ZL2007710144365.1)。基于遗传背景分析的应用中,还包括通过分子标记计算个体间的亲缘系数,通过亲缘系数进行繁殖亲本的选择(Ballou&Lacy,1996;Doyleet.al.,2001;Sekino,2004)和进行养殖群体的遗传管理(Ashieet.al.,2000;Javieret.al.,2006;Norriset.al.,2000;Panteet.al.,2001;Sanchezet.al.,2003;Yaiselet.al.,2001),以及评估个体间亲缘系数和近交系数对性状的影响等(Amoset.al.,2001;Fessehayeet.al.,2009;Suet.al.,1996)。亲缘系数、近交系数等还可以应用在种群的遗传结构分析上(Ballouxet.al.,2004;Ritlandet.al.,2004;Saleet.al.,2004;Sweigartet.al.,1999),因此利用分子标记进行遗传背景的分析具有广泛的应用。
技术实现思路
现有基于遗传背景的分析,主要包括亲缘系数、近交系数、遗传距离及遗传距离聚类树的计算等,采用这四个参数已在鱼类的遗传育种、养殖群体的遗传管理及种群的遗传结构分析上得到了应用,但尚未形成根据分子标记进行亲缘系数、近交系数的计算,及鱼类繁殖时的亲本选择、亲本组合、及组合评估的数据分析的自动处理工具,为解决此问题,本专利技术提出了基于遗传背景的鱼类亲本选择系统及方法。本专利技术所述的基于遗传背景的鱼类亲本选择系统由以下部分组成:数据转换装置,用于将分子标记凝胶电泳分析软件获得的结果转换成0/1矩阵格式;格式转换装置,用于常用群体遗传学分析软件输入数据格式转换;构建聚类树装置,用于利用分子标记数据采用phylip软件构建个体间聚类树;遗传距离计算装置,用于利用分子标记数据采用phylip软件进行个体间的遗传距离计算;近交系数计算装置,用于利用分子标记数据进行个体的近交系数计算;亲缘系数计算装置,用于利用分子标记数据进行个体间的亲缘系数计算;群体繁殖亲本选择装置,用于利用分子标记数据进行基于亲缘系数的群体繁殖亲本选择;家系繁殖亲本选择装置,用于利用分子标记数据、个体的性别数据进行基于亲缘系数的家系繁殖亲本选择;家系繁殖组合装置,用于利用分子标记数据、个体的性别数据、个体聚类树数据进行遗传距离聚类树结合亲缘系数评估的家系繁殖亲本组合;群体繁殖组合装置,用于利用分子标记数据、个体的性别数据、个体聚类树数据进行遗传距离聚类树结合亲缘系数进行的群体繁殖组合。上述遗传距离计算装置由下述模块组成:读取0/1矩阵数据格式基因型文件的模块;调用格式转换装置将个体的基因数据转换为phylip软件所需输入的数据格式的模块,所述数据格式为个体的基因频率数据格式;针对共显性标记数据,调用gendist程序计算个体间的遗传距离的模块;针对显性标记数据,调用restdist程序计算个体间的遗传距离的模块;所述近交系数计算装置由以下模块组成:读取0/1矩阵数据格式基因型文件的模块;计算等位基因频率的模块;针对共显性标记数据,采用Ritland(1996)或Lynch&Ritland(1999)计算个体的近交系数的模块;针对显性标记数据,采用Dasmahapatra(2007)计算个体的近交系数的模块;将计算获得的所有近交系数输出到文件的模块;所述亲缘系数计算装置由下述模块组成:读取0/1矩阵数据格式基因型文件的模块;计算等位基因频率的模块;针对共显性标记,采用Ritlang(1996)或Lynch&Ritland(1999)的计算个体间的亲缘系数的模块;将计算获得的所有亲缘系数输出到文件的模块;所述群体繁殖亲本选择装置由下述模块组成:调用亲缘系数计算装置、获得个体间亲缘系数的模块;根据个体间亲缘系数计算个体的平均亲缘系数的模块;根据个体的平均亲缘系数进行群体繁殖时亲本选择的模块,即根据个体的平均亲缘系数选择平均亲缘系数最小的前M个体,M表示所需要选择的个体数量;所述家系繁殖亲本选择装置由下述模块组成:调用亲缘系数计算装置、获得个体间亲缘系数的模块;根据个体间亲缘系数计算个体的平均亲缘系数的模块;根据个体的平均亲缘系数和个体的性别数据进行家系繁殖时亲本选择的模块;所述家系繁殖组合装置由下述模块组成:根据个体间聚类树和性别数据进行分组的模块;调用家系繁殖亲本选择装置、获得相应的家系繁殖亲本的模块;调用遗传距离计算装置、计算获得所有个体间的遗传距离的模块;根据聚类树分组结果、家系繁殖亲本选择结果和个体间遗传距离进行亲本组合的模块;所述群体繁殖组合装置由以下模块组成:根据个体间聚类树和性别数据进行个体分组的模块;调用亲缘系数计算装置、计算获得个体间的亲缘系数的模块;根据个体间亲缘系数计算组间雌雄亲本的平均亲缘系数的模块;根据组间雌雄亲本的平均亲缘系数进行亲本组合的模块。上述根据个体的平均亲缘系数进行群体繁殖时亲本选择的模块进一步包括:标记个体的平均亲缘系数选择平均亲缘系数最小的前M个体的单元,M表示所需要选择的个体数量;计算每个个体的近交系数的单元;获得选择的M个个体、剩余个体和全部个体的遗传多样性参数的单元,所述遗传多样性参数包括观测等位基因、期望等位基因、观测杂合度、期望杂合度和多态性信息含量PIC;将选择的M个个体的名称、平均亲缘系数mki和近交系数输出到文件的单元;输出选择个体、剩余个体的基因型及遗传多样性参数到文件的单元。上述根据个体的平均亲缘系数和个体的性别数据进行家系繁殖时亲本选择的模块进一步包括:单元一、用于选择平均亲缘系数最小的一个雌性个体和平均亲缘系数最小的雄性个体组成一个组合;单元二、用于判断选择的组合数是否已达到所要选择的家系数量M,如果不满足,则调用单元三,否则调用单元四;单元三、将剩余的个体作为一个新的数据集,重复执行根据个体间亲缘系数计算个本文档来自技高网
...
一种基于遗传背景的鱼类亲本选择系统及方法

【技术保护点】
一种基于遗传背景的鱼类亲本选择系统,其特征在于,所述装置由以下部分组成:格式转换装置,用于常用群体遗传学分析软件输入数据格式转换;构建聚类树装置,用于利用分子标记数据采用phylip软件构建个体间聚类树;遗传距离计算装置,用于利用分子标记数据采用phylip软件进行个体间的遗传距离计算;近交系数计算装置,用于利用分子标记数据进行个体的近交系数计算;亲缘系数计算装置,用于利用分子标记数据进行个体间的亲缘系数计算;群体繁殖亲本选择装置,用于利用分子标记数据进行基于亲缘系数的群体繁殖亲本选择;家系繁殖亲本选择装置,用于利用分子标记数据、个体的性别数据进行基于亲缘系数的家系繁殖亲本选择;家系繁殖组合装置,用于利用分子标记数据、个体的性别数据、个体聚类树数据进行遗传距离聚类树结合亲缘系数评估的家系繁殖亲本组合;群体繁殖组合装置,用于利用分子标记数据、个体的性别数据、个体聚类树数据进行遗传距离聚类树结合亲缘系数进行群体繁殖组合。

【技术特征摘要】
1.一种基于遗传背景的鱼类亲本选择系统,其特征在于,所述系统由以下部分组成:格式转换装置,用于常用群体遗传学分析软件输入数据格式转换;构建聚类树装置,用于利用分子标记数据采用phylip软件构建个体间聚类树;遗传距离计算装置,用于利用分子标记数据采用phylip软件进行个体间的遗传距离计算;近交系数计算装置,用于利用分子标记数据进行个体的近交系数计算;亲缘系数计算装置,用于利用分子标记数据进行个体间的亲缘系数计算;群体繁殖亲本选择装置,用于利用分子标记数据进行基于亲缘系数的群体繁殖亲本选择;家系繁殖亲本选择装置,用于利用分子标记数据、个体的性别数据进行基于亲缘系数的家系繁殖亲本选择;家系繁殖组合装置,用于利用分子标记数据、个体的性别数据、个体聚类树数据进行遗传距离聚类树结合亲缘系数评估的家系繁殖亲本组合;群体繁殖组合装置,用于利用分子标记数据、个体的性别数据、个体聚类树数据进行遗传距离聚类树结合亲缘系数进行的群体繁殖组合。2.根据权利要求1所述的一种基于遗传背景的鱼类亲本选择系统,其特征在于,所述遗传距离计算装置由下述模块组成:读取0/1矩阵数据格式基因型文件的模块;调用格式转换装置将个体的基因数据转换为phylip软件所需输入的数据格式的模块,所述数据格式为个体的基因频率数据格式;针对共显性标记数据,调用gendist程序计算个体间的遗传距离的模块;针对显性标记数据,调用restdist程序计算个体间的遗传距离的模块;所述近交系数计算装置由以下模块组成:读取0/1矩阵数据格式基因型文件的模块;计算等位基因频率的模块;针对共显性标记数据,采用或计算个体的近交系数的模块;其中,p′i表示某一位点中第i个等位基因的基因频率,δij表示个体在某一位点中含等位基因A的基因型纯合情况,基因型的第一个等位基因为A,第二个等位基因为B,若A=B,即个体含等位基因A的基因型为纯合,则δij=1,否则δij=0,n′表示该位点的等位基因数量;针对显性标记数据,采用计算个体的近交系数的模块;其中,pi表示第i个位点上隐性等位基因的频率,Pobs表示隐性等位基因的观测值,Pexp表示隐性等位基因的期望值:其中n表示个体含有的条带的总数量;将计算获得的所有近交系数输出到文件的模块;所述亲缘系数计算装置由下述模块组成:读取0/1矩阵数据格式基因型文件的模块;计算等位基因频率的模块;针对共显性标记,采用或计算个体间的亲缘系数的模块;其中,m表示位点的数量,h表示第h个位点,第一个个体在第h个位点上的等位基因的序号用i,j表示,第二个个体在第h个位点上的等位基因的序号用k、l表示,nh表示第h位点的等位基因数量,phi和phj分别表示第h位点第i和第j个等位基因的频率,δhik表示第一个个体在第h个位点的第i个等位基因与第二个个体在第h个位点的第k个等位基因的等位基因相似度,若第一个个体在第h个位点的第i等位基因与第二个个体在第h个位点的第k个等位基因一致,则δhik=1,否则δhik=0,同理可以推断δhil、δhjk和δhjl的值;将计算获得的所有亲缘系数输出到文件的模块。3.根据权利要求1所述的一种基于遗传背景的鱼类亲本选择系统,其特征在于,所述群体繁殖亲本选择装置由下述模块组成:调用亲缘系数计算装置、获得个体间亲缘系数的模块;根据个体间亲缘系数计算个体的平均亲缘系数的模块;根据个体的平均亲缘系数进行群体繁殖时亲本选择的模块,即标记个体的平均亲缘系数选择平均亲缘系数最小的前M个个体,M表示所需要选择的个体数量。4.根据权利要求1所述的一种基于遗传背景的鱼类亲本选择系统,其特征在于,所述家系繁殖亲本选择装置由下述模块组成:调用亲缘系数计算装置、获得个体间亲缘系数的模块;根据个体间亲缘系数计算个体的平均亲缘系数的模块;根据个体的平均亲缘系数和个体的性别数据进行家系繁殖时亲本选择的模块。5.根据权利要求1所述的一种基于遗传背景的鱼类亲本选择系统,其特征在于,所述家系繁殖组合装置由下述模块组成:根据个体间聚类树和性别数据进行分组的模块;调用家系繁殖亲本选择装置、获得相应的家系繁殖亲本的模块;调用遗传距离计算...

【专利技术属性】
技术研发人员:匡友谊佟广香郑先虎孙效文
申请(专利权)人:中国水产科学研究院黑龙江水产研究所
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1