System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于小麦育种管理系统的育种材料优化评估方法技术方案_技高网

用于小麦育种管理系统的育种材料优化评估方法技术方案

技术编号:41132483 阅读:2 留言:0更新日期:2024-04-30 18:02
本发明专利技术涉及数据处理技术领域,具体涉及一种用于小麦育种管理系统的育种材料优化评估方法;根据小麦的育种指标数据进行决策树模型的预构建,获得不同的子节点;在散点图中根据育种指标数据之间的距离特征获取同类变化特征值和第一分类效果因子。根据子节点中育种指标数据之间的数量差异特征获得育种指标数据的区间插值量和育种数据曲线;根据育种数据曲线与育种数据整体曲线的趋势关联特征获得第二分类效果因子。本发明专利技术根据第一分类效果因子和第二分类效果因子对基尼系数进行加权获得加权基尼系数和最优决策树模型;根据最优决策树模型对小麦育种进行分类,提高决策树模型的分类以及小麦种子选取的准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及一种用于小麦育种管理系统的育种材料优化评估方法


技术介绍

1、小麦育种的监测与管理对小麦品种培育具有重要作用,能够帮助育种人员筛选出高产量、抗病虫害和适应性强等优良特性的小麦品种。通过小麦育种管理系统中记录的不同生长指标数据和环境指标数据,能够对不同生长状况的小麦进行分类,育种人员基于分类结果可对不同种植地区选取合适的小麦品种。

2、使用传统的决策树模型可根据不同的育种指标数据对不同的小麦进行分类,但由于小麦育种过程中监测获取的指标维度和数据量繁多,决策树模型在机器学习过程中容易受到决策类别特征的选取异常而导致的决策树构建的子节点分类效果不理想。并且在子节点中选取根节点的过程通常是比较不同子节点的基尼系数大小,但基尼系数只基于熵值的变化而获得,未考虑到小麦的育种指标数据之间的关联特征,使得决策树模型对小麦分类的效果不准确。


技术实现思路

1、为了解决上述决策树模型对小麦分类效果不准确的技术问题,本专利技术的目的在于提供一种用于小麦育种管理系统的育种材料优化评估方法,所采用的技术方案具体如下:

2、获取监测小麦育种的不同的育种指标数据;根据所有小麦的育种指标数据进行决策树模型的预构建,获得不同决策分类的子节点和对应的基尼系数;

3、构建子节点中小麦的育种指标数据的散点图;在散点图中根据小麦相同的育种指标数据之间的距离特征获取同类变化特征值;根据散点图中所述同类变化特征值之间的差异特征获得子节点的第一分类效果因子;</p>

4、根据子节点中育种指标数据之间的数量差异特征获得任意育种指标数据的区间插值量;根据区间插值量对散点图中所述任意育种指标数据的相邻数据点进行插值并拟合获得育种数据曲线;根据散点图中所有的育种指标数据进行拟合获得育种数据整体曲线;根据育种数据曲线与育种数据整体曲线之间的趋势关联特征获得子节点的第二分类效果因子;

5、根据所述第一分类效果因子和所述第二分类效果因子对基尼系数进行加权获得子节点的加权基尼系数;根据所述加权基尼系数获得最优决策树模型;根据最优决策树模型对小麦育种进行分类。

6、进一步地,所述在散点图中根据小麦相同的育种指标数据之间的距离特征获取同类变化特征值的步骤包括:

7、计算散点图中小麦任意一种的育种指标数据的任意两个数据点之间的欧几里得距离的平均值,获得任意一种的育种指标数据的同类变化特征值。

8、进一步地,所述根据散点图中所述同类变化特征值之间的差异特征获得子节点的第一分类效果因子的步骤包括:

9、计算散点图中每个种类的育种指标数据的同类变化特征值的平均值,获得同类变化平均值;计算散点图中所有同类变化特征值与所述同类变化平均值的差值绝对值的平均值并负相关映射,获得散点图对应的子节点的第一分类效果因子。

10、进一步地,所述根据子节点中育种指标数据之间的数量差异特征获得任意育种指标数据的区间插值量的步骤包括:

11、计算子节点中任意育种指标数据的数量值与常数1的差值,获得所述任意育种指标数据的区间数量值;计算子节点中所有育种指标数据与所述任意育种指标数据的数据点数量的差值,获得总插值量;计算所述总插值量与所述区间数量值的比值,获得所述任意育种指标数据的区间插值量。

12、进一步地,所述根据育种数据曲线与育种数据整体曲线之间的趋势关联特征获得子节点的第二分类效果因子的步骤包括:

13、计算散点图中每个种类的育种指标数据对应的育种数据曲线与所述育种数据整体曲线的皮尔逊相关系数的绝对值,获得第一关联特征值;计算散点图中每个种类的育种指标数据对应的育种数据曲线与所述育种数据整体曲线的斯皮尔曼相关系数的绝对值,获得第二关联特征值;将所述第一关联特征值和所述第二关联特征值中的最大值作为育种指标数据的关联因子,计算散点图中所有种类的育种指标数据的关联因子的平均值,获得所述子节点的第二分类效果因子。

14、进一步地,所述根据所述第一分类效果因子和所述第二分类效果因子对基尼系数进行加权获得子节点的加权基尼系数的步骤包括:

15、计算所述第一分类效果因子和所述第二分类效果因子的平均值,获得子节点的分类效果特征值;计算预设第一常数与所述分类效果特征值的差值,获得加权系数;计算所述加权系数与子节点的基尼系数的乘积,获得所述子节点的加权基尼系数。

16、进一步地,所述根据所述加权基尼系数获得最优决策树模型的步骤包括:

17、将所述加权基尼系数最小值对应的子节点作为决策树模型的根节点,获得最优决策树模型。

18、进一步地,所述构建子节点中小麦的育种指标数据的散点图的步骤包括:

19、将子节点中所有小麦的不同种类的育种指标数据置于散点图中,散点图的横轴为时间戳、纵轴为数据值。

20、本专利技术具有如下有益效果:

21、在本专利技术中,获得不同决策分类的子节点和对应的基尼系数能够初步确定决策树模型中不同子节点的分类效果,便于选取决策树模型的根节点;获取子节点的散点图能够直观表征育种指标数据中数据点的分布特征。获取同类变化特征值能够表征育种指标数据中数据点之间的距离特征,根据同类变化特征值获取第一分类效果因子能够根据小麦育种过程中不同指标的关联特征表征子节点的分类效果;获取区间插值量能够对育种指标数据进行补充,提高分析不同育种指标数据关联性的准确性;获取第二分类效果因子能够表征子节点中任意育种指标数据和其他育种指标数据之间的变化关联性,从而反映子节点的分类效果。获取加权基尼系数能够基于子节点中不同小麦的育种指标数据之间的关联特征并结合基尼系数确定分类效果最好的根节点,进而获得最优决策数据模型。最终根据最优决策树模型对对小麦育种进行分类,提高了决策树模型的分类以及小麦种子选取的准确性。

本文档来自技高网...

【技术保护点】

1.一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述在散点图中根据小麦相同的育种指标数据之间的距离特征获取同类变化特征值的步骤包括:

3.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据散点图中所述同类变化特征值之间的差异特征获得子节点的第一分类效果因子的步骤包括:

4.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据子节点中育种指标数据之间的数量差异特征获得任意育种指标数据的区间插值量的步骤包括:

5.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据育种数据曲线与育种数据整体曲线之间的趋势关联特征获得子节点的第二分类效果因子的步骤包括:

6.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据所述第一分类效果因子和所述第二分类效果因子对基尼系数进行加权获得子节点的加权基尼系数的步骤包括:

7.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据所述加权基尼系数获得最优决策树模型的步骤包括:

8.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述构建子节点中小麦的育种指标数据的散点图的步骤包括:

...

【技术特征摘要】

1.一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述在散点图中根据小麦相同的育种指标数据之间的距离特征获取同类变化特征值的步骤包括:

3.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据散点图中所述同类变化特征值之间的差异特征获得子节点的第一分类效果因子的步骤包括:

4.根据权利要求1所述的一种用于小麦育种管理系统的育种材料优化评估方法,其特征在于,所述根据子节点中育种指标数据之间的数量差异特征获得任意育种指标数据的区间插值量的步骤包括:

5.根据权利要求...

【专利技术属性】
技术研发人员:侯亮吕亮杰齐浩王雪孙海芳田哲浩
申请(专利权)人:河北省农林科学院农业信息与经济研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1