本发明专利技术公开一种基于高光谱影像数据的杨树叶片氮含量反演方法和系统,所述方法包括:S1、获取杨树种植区无人机高光谱影像数据和叶片样本氮含量数据;S2、对所述高光谱影像数据进行预处理,根据叶片样本位置和预处理后的高光谱影像数据提取对应的波段反射率数据,构建数据集,所述数据集包括叶片样本氮含量和对应的波段反射率数据,并划分训练集和验证集;S3、使用深度神经网络DNN结合SHAP算法,确定杨树叶片氮含量反演的初始波段集合;S4、使用序列浮动后向选择算法,确定杨树叶片氮含量反演的最优波段集合,并进而确定最终的杨树叶片氮含量反演模型。采用本发明专利技术,对不同氮含量的叶片样本均可以实现较高精度的反演。
【技术实现步骤摘要】
本专利技术涉及林业生理生化表型参数反演,特别是指一种基于高光谱影像数据的杨树叶片氮含量反演方法和系统。
技术介绍
1、杨树是中国温带平原地区广泛栽培的重要速生木材树种之一,该树种生长迅速,在生态保护林业和工业木材种植方面具有广泛的应用。杨树具有多种基因型,展示出不同的表型性状。了解不同基因型的表型性状不仅为其育种提供了坚实基础,还为开发、改良其品种提供了重要信息。叶片氮含量是一种重要的生理生化表型参数,与杨树光合作用密切相关,影响其生长速率、生物量累计与抗逆性等。近些年来无人机高光谱遥感技术迅速发展,为单木尺度的叶片氮含量反演(预测)提供了丰富的光谱信息,已成为当前低空尺度农林业生理生化参数反演的重要方法。
2、虽然高光谱影像数据具有丰富的冠层反射信息,但由于波段之间的相关性较高,容易产生休斯现象,严重影响反演模型精度与计算效率。当前相关研究主要基于嵌入式特征选择算法得到波段重要性排序,通过预定义模型所用的波段数量或根据预定义步长进行降维。但上述方法对回归模型进行了预定义,导致模型算法形式的选择受限。其次,上述方法忽略了动态集合条件下特征贡献度的变化,增加了波段剔除过程中的误差。此外,嵌入式特征选择算法无法实现最优子集搜索,无法消除因波段间相互作用产生的反演误差。上述因素对杨树叶片氮含量反演的精度与运算速度造成了影响,数据挖掘程度严重不足。
3、因此,研究设计一种合理、高精度的基于无人机高光谱影像数据的杨树叶片氮含量反演方法是目前亟需解决的问题。
技术实现思路
<
p>1、本专利技术提供了一种基于高光谱影像数据的杨树叶片氮含量反演方法和系统,用以解决上述现有技术存在的问题。所述技术方案如下:2、一方面,提供了一种基于高光谱影像数据的杨树叶片氮含量反演方法,包括:
3、s1、获取杨树种植区无人机高光谱影像数据和叶片样本氮含量数据;
4、s2、对所述高光谱影像数据进行预处理,根据叶片样本位置和预处理后的高光谱影像数据提取对应的波段反射率数据,构建数据集,所述数据集包括叶片样本氮含量和对应的波段反射率数据,并划分训练集和验证集;
5、s3、使用深度神经网络dnn结合shap算法,确定杨树叶片氮含量反演的初始波段集合;
6、s4、使用序列浮动后向选择算法,确定杨树叶片氮含量反演的最优波段集合,并进而确定最终的杨树叶片氮含量反演模型。
7、可选地,所述s2中对所述高光谱影像数据进行预处理,具体包括:
8、对获取的所述高光谱影像数据进行辐射定标、几何校正及正射校正,得到波段反射率数据;
9、将低于400nm和高于900nm的波段剔除,并将光谱数据进行savitzky-golay滤波平滑处理,得到400-900nm范围内的平滑光谱曲线,共250个波段,计算公式如下:
10、
11、其中是滤波后的反射率值,y(t+i)是滑动窗口内的原始信号值,ci是滤波器的系数,基于最小二乘法拟合的多项式决定,m是窗口大小的一半,窗口长度为2m+1,m取值为5。
12、可选地,所述s3,具体包括:
13、s31、构建初始反演模型:
14、基于训练集数据,使用深度神经网络dnn,构建杨树叶片氮含量初始反演模型,结合shap算法,计算每个波段对模型输出的贡献,输出每个波段的shap值,根据所述shap值对波段进行排序,确定各波段在反演过程中的重要性,并使用验证集验证模型性能,计算并输出验证集精度作为模型的评估指标;
15、s32、逐步去除低重要性波段:
16、设置步长为10,开始去除排名后10位的波段,构建新的反演模型,使用去除后的波段重新训练模型,并计算新的shap值及验证集精度,根据更新后的shap值对剩余波段进行排序;
17、s33、循环迭代直到波段数量为0:
18、迭代重复上一步骤,持续去除排名后10位的波段,构建新的反演模型,计算新的shap值及验证集精度,在每次迭代中,监控模型性能的变化,记录各次迭代的验证集精度,直到波段数量降为0,结束迭代;
19、s34、确定初始波段集合:
20、对比每次迭代过程中的验证集精度,找出精度最高的模型所对应的波段集合,将所述精度最高的模型所对应的波段集合,确定为所述杨树叶片氮含量反演的初始波段集合。
21、可选地,所述shap值的计算公式如下:
22、
23、其中φi表示shap值,n是所有波段的集合;s是一个子集,表示在当前计算shap值时考虑的波段集合,代表了不包含波段i的所有子集;f(s)是波段子集s的模型预测;|s|是子集s中波段的数量;|n|是波段总数,|n|-|s|≥1;f(s∪{i})表示波段集合s与波段i的并集作为输入得到的模型预测输出;是一个组合系数,用于计算波段i加入波段集合s时的边际贡献的权重,这个权重考虑了所有可能的波段组合方式,确保每个波段的贡献被公平地评估。
24、可选地,所述s4,具体包括:
25、s41、波段子集后向选择:
26、依次从当前初始波段集合中移除每一个波段,并重新训练模型,计算并记录每个移除后的波段子集的验证集精度,比较并保留精度最高的波段子集;
27、s42、波段子集前向浮动:
28、在移除波段之后,通过将已移除的波段依次分别添加回当前的波段子集,并重新训练反演模型,评估其验证集精度,如果重新添加某个波段后,模型精度提升,则这个波段被重新加入波段子集;
29、s43、算法迭代与模型确定:
30、通过后向选择和前向浮动步骤的交替进行,不断优化波段子集,当无任何波段可以通过移除或添加来改善模型验证集精度时,迭代过程停止,精度最优模型作为最终的杨树叶片氮含量反演模型。
31、另一方面,提供了一种基于高光谱影像数据的杨树叶片氮含量反演系统,所述系统包括:
32、获取模块,用于获取杨树种植区无人机高光谱影像数据和叶片样本氮含量数据;
33、处理模块,用于对所述高光谱影像数据进行预处理,根据叶片样本位置和预处理后的高光谱影像数据提取对应的波段反射率数据,构建数据集,所述数据集包括叶片样本氮含量和对应的波段反射率数据,并划分训练集和验证集;
34、第一确定模块,用于使用深度神经网络dnn结合shap算法,确定杨树叶片氮含量反演的初始波段集合;
35、第二确定模块,用于使用序列浮动后向选择算法,确定杨树叶片氮含量反演的最优波段集合,并进而确定最终的杨树叶片氮含量反演模型。
36、可选地,所述处理模块,具体用于:
37、对获取的所述高光谱影像数据进行辐射定标、几何校正及正射校正,得到波段反射率数据;
38、将低于400nm和高于900nm的波段剔除,并将光谱数据进行savitzky-golay滤波平滑处理,得到400-900n本文档来自技高网
...
【技术保护点】
1.一种基于高光谱影像数据的杨树叶片氮含量反演方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述S2中对所述高光谱影像数据进行预处理,具体包括:
3.根据权利要求1所述的方法,其特征在于,所述S3,具体包括:
4.根据权利要求3所述的方法,其特征在于,所述SHAP值的计算公式如下:
5.根据权利要求1所述的方法,其特征在于,所述S4,具体包括:
6.一种基于高光谱影像数据的杨树叶片氮含量反演系统,其特征在于,所述系统包括:
7.根据权利要求6所述的系统,其特征在于,所述处理模块,具体用于:
8.根据权利要求6所述的系统,其特征在于,所述第一确定模块,具体用于:
9.根据权利要求8所述的系统,其特征在于,所述SHAP值的计算公式如下:
10.根据权利要求6所述的系统,其特征在于,所述第二确定模块,具体用于:
【技术特征摘要】
1.一种基于高光谱影像数据的杨树叶片氮含量反演方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述s2中对所述高光谱影像数据进行预处理,具体包括:
3.根据权利要求1所述的方法,其特征在于,所述s3,具体包括:
4.根据权利要求3所述的方法,其特征在于,所述shap值的计算公式如下:
5.根据权利要求1所述的方法,其特征在于,所述s4,具体包括:<...
【专利技术属性】
技术研发人员:陈珠琳,徐昇,庞丽峰,陶果丰,
申请(专利权)人:中国林业科学研究院资源信息研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。