基于机器学习的NDVI预测集成优化方法及系统技术方案

技术编号：40122164 阅读：5 留言：0更新日期：2024-01-23 20:49

本发明专利技术公开了一种基于机器学习的NDVI预测集成优化方法及系统，包括获取研究区域的研究数据并筛选和预处理，形成输入变量数据集；所述研究数据至少包括NDVI数据集和气候变量数据集；选取至少一种类型的NDVI预测模型，构建包括至少两种NDVI预测模型在内的NDVI预测模型集合；构建NDVI预测集成优化模型，包括目标函数、权重矩阵和约束条件；采用预配置的算法求解NDVI预测集成优化模型，确定最优权重，计算和评价预测精度，并输出预测结果。针对单个机器学习模型易出现欠拟合或过拟合问题，构建基于线性加权的NDVI预测集成模型，并通过增强精英保留的遗传算法确定各模型的权重，降低模型不确定性的不利影响。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及遥感图像或光谱数据处理技术，尤其是一种基于机器学习的ndvi预测集成优化方法及系统。

技术介绍

1、中国西南流域横跨寒带、温带、亚热带和热带等多个气候带，气温和降水由南向北逐渐递减，地形自西向东落差较大，植被类型较丰富，不同区域气候因子对植被影响程度不一。植被是陆地生态系统重要组分，在陆地表面的能量交换过程、生物地球化学循环过程和水文循环过程中扮演着重要的角色。因此，了解植被覆盖对区域可持续发展、生态环境保护有着重大意义。

2、植被指数是对地表植被状况的简单、有效和经验的度量，能检测植被生长状态、植被覆盖度和消除部分辐射误差等。ndvi（normalized difference vegetation index）是研究植被覆盖变化的重要工具，也是目前应用最广泛的植被指数，能够较好地反映出区域下垫面植被动态变化的规律。

3、ndvi预测的研究主要用到多因子模型，包含多因子参数模型和多因子非参数模型。多因子参数模型是研究因变量对两个及以上自变量的统计关系。该类模型的自变量较多，部分自变量（如气候因子）存在空间量化有较大误差等问题，具有一定的局限性和不确定性。多因子非参数模型是根据遥感数据自身特征直接定义的一类函数，可将不同结构特征的数据与植被指数按线性或非线性的形式通过特定的规则进行关联。基于机器学习方法的非参数模型相对于参数模型来说，具有较优的植被指数估算和预测能力，且随着输入数据样本的增加，模型精度会得到相应的改善。然而，基于机器学习方法的非参数模型内部机制复杂，不能直观的表达，容易出现欠

4、所以，如何改进或优化基于机器学习的非参数模型并精准估算和预测西南流域植被指数需要研究创新，以解决现有技术存在的上述问题。

技术实现思路

1、专利技术目的，提供一种基于机器学习的ndvi预测集成优化方法及系统，以解决现有技术存在的上述问题。

2、技术方案，根据本申请的一个方面，基于机器学习的ndvi预测集成优化方法，其特征在于，包括如下步骤：

3、步骤s1、获取研究区域的研究数据并筛选和预处理，形成输入变量数据集；所述研究数据至少包括ndvi数据集和气候变量数据集；

4、步骤s2、选取至少两种类型的ndvi预测模型，构建包括至少两个ndvi预测模型在内的ndvi预测模型集合；

5、步骤s3、构建ndvi预测集成优化模型，包括目标函数、权重矩阵和约束条件；

6、步骤s4、采用预配置的算法求解ndvi预测集成优化模型，确定最优权重，输出预测结果，计算和评价预测精度。

7、根据本申请的一个方面，所述步骤s1进一步包括：

8、步骤s11、确定研究区域的范围，并将研究区域，根据流域区划标准划分为至少两个子流域，获取预定格式的时间序列数据作为研究数据；所述研究数据至少包括ndvi数据集和气候变量数据集；

9、步骤s12、利用变量优选方法筛选出与流域各子流域ndvi具有强相关的气候变量及其滞时影响因子，构建输入变量集；所述输入变量包括：短波辐射、风速、降水、温度、气压、露点温度和水汽压差vpd。

10、根据本申请的一个方面，所述步骤s2进一步包括：

11、步骤s21、筛选至少两种类型的机器学习模型，每种类型的机器学习模型包括至少一种机器学习模型；所述机器学习模型至少包括：线性回归模型、支持向量机模型、knn模型、随机森林模型和极端梯度提升决策树模型；

12、步骤s22、针对每种机器学习模型，分别建立ndvi预测模型并得到每个模型的预测结果。

13、根据本申请的一个方面，所述步骤s3进一步包括：

14、步骤s31、构建基于线性加权的ndvi预测集成优化模型，包括目标函数、权重矩阵和约束条件；

15、步骤s32、通过增强精英保留的遗传算法确定各模型的权重，使得集成模型预测值与观测值之间的均方根误差最小。

16、根据本申请的一个方面，所述步骤4进一步包括：

17、步骤s41、构建求解算法集合，所述求解算法包括遗传算法；

18、步骤s42、采用求解算法求解ndvi预测集成优化模型，获得各子模型权重，并采用相关系数、相对偏差和均方根误差分析在验证期内预测ndvi的性能和适应性。

19、根据本申请的一个方面，所述步骤s12进一步包括：

20、步骤s12a、使用广义线性回归法对每个子流域分别建立ndvi与气候变量之间的线性关系模型，并计算各变量的系数和显著性水平，选择显著性水平小于预定值的变量作为候选变量；

21、步骤s12b、使用逐步回归法对每个子流域分别进行向前、向后或双向的逐步变量选择，根据aic指标或bic指标选择最优的变量组合作为候选变量；

22、步骤s12c、使用aic指标或bic指标对每个子流域分别比较广义线性回归法和逐步回归法得到的候选变量组合，选择指标值最小的变量组合作为输入变量集。

23、根据本申请的一个方面，所述步骤s22进一步为：

24、步骤s22a、采用线性回归模型对每个子流域分别建立ndvi与输入变量集之间的线性回归模型，并使用最小二乘法或岭回归法进行参数估计，得到线性回归模型的预测结果；

25、步骤s22b、使用支持向量机模型对每个子流域分别建立ndvi与输入变量集之间的支持向量回归模型，并使用核函数进行非线性映射，得到支持向量机模型的预测结果；

26、步骤s22c、使用knn模型对每个子流域分别建立ndvi与输入变量集之间的k近邻回归模型，并使用欧氏距离或曼哈顿距离进行相似度计算，得到knn模型的预测结果；

27、步骤s22d、使用随机森林模型对每个子流域分别建立ndvi与输入变量集之间的随机森林回归模型，并使用自助采样法和随机特征选择法进行特征和样本的随机化处理，得到随机森林模型的预测结果；

28、步骤s22e、使用极端梯度提升决策树模型，对每个子流域分别建立ndvi与输入变量集之间的极端梯度提升决策树回归模型，并使用梯度提升法和正则化项进行模型优化和过拟合控制，得到极端梯度提升决策树模型的预测结果；

29、步骤s22f、针对每一子流域，按照拟合效果降序排列，获取前n项效果最佳的机器学习模型，并获取加权结果，获得每个子流域对应的最佳机器学习模型，并存储。在后续步骤中，根据每个子流域的机器学习模型，构建流域整体的ndvi预测集成优化模型。

30、或者s22f还可以为、根据流域内植被的ndvi情况，构建子流域的类别标识符，为每个子流域分配类别标识符，形成至少两类子流域；

31、基于各个机器学习模型的预测结果（即步骤s22a至步骤s22e中的本文档来自技高网...

【技术保护点】

1.基于机器学习的NDVI预测集成优化方法，其特征在于，包括如下步骤：

2.如权利要求1所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S1进一步包括：

3.如权利要求2所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S2进一步包括：

4.如权利要求3所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S3进一步包括：

5.如权利要求4所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S4进一步包括：

6.如权利要求2所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S12进一步包括：

7.如权利要求6所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S22进一步为：

8.如权利要求6所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S32进一步为：

9.如权利要求6所述的基于机器学习的NDVI预测集成优化方法，其特征在于，所述步骤S11还包括判断数据值是否有效以及判断时间

10.一种基于机器学习的NDVI预测集成优化系统，其特征在于，包括：

...

【技术特征摘要】

1.基于机器学习的ndvi预测集成优化方法，其特征在于，包括如下步骤：

2.如权利要求1所述的基于机器学习的ndvi预测集成优化方法，其特征在于，所述步骤s1进一步包括：

3.如权利要求2所述的基于机器学习的ndvi预测集成优化方法，其特征在于，所述步骤s2进一步包括：

4.如权利要求3所述的基于机器学习的ndvi预测集成优化方法，其特征在于，所述步骤s3进一步包括：

5.如权利要求4所述的基于机器学习的ndvi预测集成优化方法，其特征在于，所述步骤s4进一步包括：

6.如权利要求2所述的基...

【专利技术属性】
技术研发人员：周泽慧，黄卫东，翟青，孙殿臣，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人