【技术实现步骤摘要】
本专利技术涉及计算生物学,尤其是一种能够促进区域试验中候选品种理想试验点选择的作物区域试验生物-环境多维信息数据模型及其研究框架。
技术介绍
1、培育优质高产的水稻品种是提高水稻单产的主要途径之一。区域试验(multi-environment trials)旨在评估未经测试的候选品种在多种环境条件下的适应性和稳定性,以及为农民和种植者提供有关种植决策的依据。区域试验往往需要考虑多个因素,如品种、肥料、施药、灌溉等,为了减少因干扰因素而导致的误差,往往需要进行多次重复实验。然而,由于不同候选品种适应的环境不一致,区域试验生成的表型数据矩阵(品种×环境)可能不完整。因此,获得完整的区域试验数据,进一步对数据进行合理的分析,为不同种植区水稻品种的培育选择合适的试验点,提高区域试验的效率和精度,节约资源和时间成本。选择合适的统计模型是全面评价区域试验质量的一个重要因素。通过使用方差分析模型、线性回归模型、加性主效应和乘性交互作用模型、聚类分析和灰色关联度分析法等方法,对农作物品种区域试验进行综合评价。目前,区域试验数据主要是用于比较和评价参试品
...【技术保护点】
1.作物区域试验生物-环境多维信息数据模型,其特征在于:该数据模型融合全基因组生物信息及环境-表型数据对作物区域试验中候选品种理想试验点进行数据关注。
2.根据权利要求1所述的作物区域试验生物-环境多维信息数据模型,其特征在于:在数据模型的前端,载入已获取的区域试验数据集并进行底层数据处理后,内嵌全基因组生物信息数据分析框架并对现有区域试验数据集中表型缺失的区域试验数据进行插补以获得完整的表型数据。
3.根据权利要求2所述的作物区域试验生物-环境多维信息数据模型,其特征在于:区域试验数据集的载入以表型数据文件为载体,并设置如下数据进程:读取亲缘
...【技术特征摘要】
1.作物区域试验生物-环境多维信息数据模型,其特征在于:该数据模型融合全基因组生物信息及环境-表型数据对作物区域试验中候选品种理想试验点进行数据关注。
2.根据权利要求1所述的作物区域试验生物-环境多维信息数据模型,其特征在于:在数据模型的前端,载入已获取的区域试验数据集并进行底层数据处理后,内嵌全基因组生物信息数据分析框架并对现有区域试验数据集中表型缺失的区域试验数据进行插补以获得完整的表型数据。
3.根据权利要求2所述的作物区域试验生物-环境多维信息数据模型,其特征在于:区域试验数据集的载入以表型数据文件为载体,并设置如下数据进程:读取亲缘关系矩阵并将其转换为对称矩阵,对称矩阵中的行和列名均为基因型genotype数据,对于环境、基因型和产量及其他关联数据进行整理将其转换为宽格式数据框spread_data使其每一列代表一个环境下的产量数据;底层数据处理包括生成训练集和测试集,通过循环重复n次生成训练集和测试集,并在每次循环中对每个环境的数据随机选择一定比例数据作为测试集且令剩余作为训练集;同时记录每次生成的测试集中的位置和真实值备用。
4.根据权利要求2所述的作物区域试验生物-环境多维信息数据模型,其特征在于:基于完整的作物表型数据集,该数据模型构建由关键环境信息参数指向作物表型的真实效价数据,对作物区域试验中候选品种理想试验点进行定性或定量数据关注。
5...
【专利技术属性】
技术研发人员:郭婷婷,裴贺,苟香建,张振威,曹艺兰,曾令举,
申请(专利权)人:华中农业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。