水稻粒长预测模型的训练方法、形态预测方法及装置制造方法及图纸

技术编号:38252916 阅读:12 留言:0更新日期:2023-07-27 10:17
本发明专利技术公开了一种水稻粒长预测模型的训练方法、形态预测方法及装置,所述方法包括:在获取多份水稻个体基因数据后,对每份所述水稻个体基因数据进行矩阵转换和基因填充得到基因型矩阵,并计算每个所述基因型矩阵对应的全基因关系矩阵;从多个所述全基因关系矩阵筛选若干个具有生长表型的目标全基因关系矩阵,并采用若干个所述目标全基因关系矩阵进行模型训练和优化筛选得到水稻粒长预测模型。本发明专利技术可以对水稻个体基因数据进行矩阵转换和基因填充,根据其水稻个体亲缘关系构建并筛选出若干个表型相关的微点,最后采用若干个筛选出的表型相关的微点进行模型训练和优化筛选得到水稻粒长预测模型,从而减少数据误差,并提升训练模型的预测精度。训练模型的预测精度。训练模型的预测精度。

【技术实现步骤摘要】
水稻粒长预测模型的训练方法、形态预测方法及装置


[0001]本专利技术涉及模型训练的
,尤其涉及一种水稻粒长预测模型的训练方法、形态预测方法及装置。

技术介绍

[0002]随着科技的发展和普及,越来越多的行业向信息科技和智能化科技转型。例如生物研究行业,可以构建符合植物生长形态研究的神经网络模型,调用神经网络模型进行植物生长预测的处理,能有效提升植物生长研究的效率。目前,关于植物生长研究的模型训练方法主要是先收集关于植物生长的基因位点数据,将基因位点数据转化成训练因子并进行模型训练,以得到满足研究要求的模型。
[0003]但上述训练方式有下述技术问题:现有的基因位点数据是通过图位克隆或突变体定位得到,图位克隆仅能提取目标基因附近位点的数据,而通过突变体定位仅能提取变异基因位点的数据,导致采集的数据与实际有较大的误差,进而降低后续模型预测的精度。

技术实现思路

[0004]本专利技术提出一种水稻粒长预测模型的训练方法、形态预测方法及装置,所述方法在收集水稻的变异或附件位点的基因数据后,对数据进行填充并根据水稻个体亲缘关系构建基因网络矩阵,利用基因网络矩阵进行模型训练,在减少数据误差的基础上提升训练模型的预测精度。
[0005]本专利技术实施例的第一方面提供了一种水稻粒长预测模型的训练方法,所述方法包括:
[0006]在获取多份水稻个体基因数据后,对每份所述水稻个体基因数据进行矩阵转换和基因填充得到基因型矩阵,并计算每个所述基因型矩阵对应的全基因关系矩阵,所述全基因关系矩阵是与所述基因型矩阵构成个体亲缘关系的基因矩阵;
[0007]从多个所述全基因关系矩阵筛选若干个具有生长表型的目标全基因关系矩阵,并采用若干个所述目标全基因关系矩阵进行模型训练和优化筛选得到水稻粒长预测模型。
[0008]在第一方面的一种可能的实现方式中,所述对每份所述水稻个体基因数据进行矩阵转换和基因填充得到基因型矩阵,并计算每个所述基因型矩阵对应的全基因关系矩阵,包括:
[0009]基于预设的变异矩阵对每份水稻个体基因数据进行过滤,并对过滤后的每份水稻个体基因数据进行矩阵转换,得到多个个体基因矩阵,其中,预设的变异矩阵是对水稻基因组的比对数据库进行过滤得到的关于变异位点的矩阵;
[0010]对每个所述个体基因矩阵缺失的基因型进行填充,得到基因型矩阵,所述基因型矩阵为完整基因型的矩阵;
[0011]利用预设的emmax软件获取关于亲缘关系的矩阵参数;
[0012]利用所述矩阵参数计算每个所述基因型矩阵对应的全基因关系矩阵。
[0013]在第一方面的一种可能的实现方式中,所述从多个所述全基因关系矩阵筛选若干个具有生长表型的目标全基因关系矩阵,包括:
[0014]将每个所述全基因关系矩阵转换成模型格式矩阵;
[0015]将每个所述模型格式矩阵输入至预设的混合线性模型,计算得到每个所述模型格式矩阵对应的得到表型信息;
[0016]从多个所述表型信息中筛选若干个为生长表型的目标信息,并以所述目标信息对应的全基因关系矩阵为目标全基因关系矩阵。
[0017]在第一方面的一种可能的实现方式中,所述采用若干个所述目标全基因关系矩阵进行模型训练和优化筛选得到水稻粒长预测模型,包括:
[0018]从每个所述目标全基因关系矩阵中提取与水稻生长相关的相关基因位点,得到若干个相关基因位点;
[0019]计算每个所述相关基因位点的假定值,并将小于预设值的假定值对应的相关基因位点合并两两合并,得到多个合并位点;
[0020]根据所述多个合并位点对应的基因转型信息构建多个模型并对多个模型进行优化筛选得到水稻粒长预测模型。
[0021]在第一方面的一种可能的实现方式中,所述根据所述多个合并位点对应的基因转型信息构建多个模型并对多个模型进行优化筛选得到水稻粒长预测模型,包括:
[0022]获取每个所述合并位点的基因转型信息,并按照每个所述基因转换信息对应的基因型对每个所述基因转换信息进行赋值,得到基因转型值,其中,所述基因转型信息包括杂合、纯合和变异;
[0023]将所述基因转型值输入至预设的线性回归模型计算得到与基因型和表型相关的重要值;
[0024]按照数值大小从多个所述重要值中筛选若干个目标重要性值,并采用每个所述目标重要性值对应的合并位点构建线性回归模型,得到若干个待训练模型;
[0025]采用所述多份水稻个体基因数据分别对每个所述待训练模型进行模型训练,得到若干个训练模型;
[0026]计算每个所述训练模型的准确率,并筛选准确率最大的训练模型为水稻粒长预测模型。
[0027]在第一方面的一种可能的实现方式中,所述计算每个所述训练模型的准确率,包括:
[0028]按照数值大小从多个所述重要值中筛选若干个检测重要性值;
[0029]将所述若干个检测重要性值分别代入每个所述训练模型,求得每个所述训练模型对应的准确率。
[0030]在第一方面的一种可能的实现方式中,在所述将小于预设值的假定值对应的相关基因位点合并两两合并,得到多个合并位点的步骤后,所述方法还包括:
[0031]按照所述多个合并位点对应的基因转型信息,对多份水稻个体基因数据进行聚合分类,得到若干个分类结果;
[0032]可视化展示所述若干个分类结果在第一方面的一种可能的实现方式中。
[0033]本专利技术实施例的第二方面提供了一种水稻粒长的预测方法,所述方法包括:
[0034]获取待预测的水稻基因数据;
[0035]将所述待预测的水稻基因数据输入至根据上述实施例所述的水稻粒长预测模型的训练方法生成的水稻粒长预测模型,得到水稻粒长的预测结果。
[0036]本专利技术实施例的第三方面提供了一种水稻粒长预测模型的训练装置,所述装置包括:
[0037]获取个体基因数据模块,用于在获取多份水稻个体基因数据后,对每份所述水稻个体基因数据进行矩阵转换和基因填充得到基因型矩阵,并计算每个所述基因型矩阵对应的全基因关系矩阵,所述全基因关系矩阵是与所述基因型矩阵构成个体亲缘关系的基因矩阵;
[0038]模型训练模块,用于从多个所述全基因关系矩阵筛选若干个具有生长表型的目标全基因关系矩阵,并采用若干个所述目标全基因关系矩阵进行模型训练得到水稻粒长预测模型。
[0039]本专利技术实施例的第四方面提供了一种水稻粒长的预测装置,所述装置包括:
[0040]获取待检测基因数据模块,用于获取待预测的水稻基因数据;
[0041]生长预测模块,用于将所述待预测的水稻基因数据输入至根据上述实施例所述的水稻粒长预测模型的训练方法生成的水稻粒长预测模型,得到水稻粒长的预测结果。
[0042]相比于现有技术,本专利技术实施例提供的一种水稻粒长预测模型的训练方法、形态预测方法及装置,其有益效果在于:本专利技术可以在获取多份水稻个体基因数据后,对每份数据进行矩阵转换和基因填充,并根据其水稻个体亲缘关系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水稻粒长预测模型的训练方法,其特征在于,所述方法包括:在获取多份水稻个体基因数据后,对每份所述水稻个体基因数据进行矩阵转换和基因填充得到基因型矩阵,并计算每个所述基因型矩阵对应的全基因关系矩阵,所述全基因关系矩阵是与所述基因型矩阵构成个体亲缘关系的基因矩阵;从多个所述全基因关系矩阵筛选若干个具有生长表型的目标全基因关系矩阵,并采用若干个所述目标全基因关系矩阵进行模型训练和优化筛选得到水稻粒长预测模型。2.根据权利要求1所述的水稻粒长预测模型的训练方法,其特征在于,所述对每份所述水稻个体基因数据进行矩阵转换和基因填充得到基因型矩阵,并计算每个所述基因型矩阵对应的全基因关系矩阵,包括:基于预设的变异矩阵对每份水稻个体基因数据进行过滤,并对过滤后的每份水稻个体基因数据进行矩阵转换,得到多个个体基因矩阵,其中,预设的变异矩阵是对水稻基因组的比对数据库进行过滤得到的关于变异位点的矩阵;对每个所述个体基因矩阵缺失的基因型进行填充,得到基因型矩阵,所述基因型矩阵为完整基因型的矩阵;利用预设的emmax软件获取关于亲缘关系的矩阵参数;利用所述矩阵参数计算每个所述基因型矩阵对应的全基因关系矩阵。3.根据权利要求1所述的水稻粒长预测模型的训练方法,其特征在于,所述从多个所述全基因关系矩阵筛选若干个具有生长表型的目标全基因关系矩阵,包括:将每个所述全基因关系矩阵转换成模型格式矩阵;将每个所述模型格式矩阵输入至预设的混合线性模型,计算得到每个所述模型格式矩阵对应的得到表型信息;从多个所述表型信息中筛选若干个为生长表型的目标信息,并以所述目标信息对应的全基因关系矩阵为目标全基因关系矩阵。4.根据权利要求1

3任意一项所述的水稻粒长预测模型的训练方法,其特征在于,所述采用若干个所述目标全基因关系矩阵进行模型训练和优化筛选得到水稻粒长预测模型,包括:从每个所述目标全基因关系矩阵中提取与水稻生长相关的相关基因位点,得到若干个相关基因位点;计算每个所述相关基因位点的假定值,并将小于预设值的假定值对应的相关基因位点合并两两合并,得到多个合并位点;根据所述多个合并位点对应的基因转型信息构建多个模型并对多个模型进行优化筛选得到水稻粒长预测模型。5.根据权利要求4所述的水稻粒长预测模型的训练方法,其特征在于,所述根据所述多个合并位点对应的基因转型信息构建多个模型并对多个模型进行优化筛选得到水稻粒长预测模型,包括:获取每个所述合并位点的基因...

【专利技术属性】
技术研发人员:赵华刘玉涛吴惠粦黄郑晖林珊珊王庆林李丽梅杨欣华刘骋骋
申请(专利权)人:广州国家现代农业产业科技创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1