一种基于RR-SFS算法的森林蓄积量估测方法技术

技术编号:39044199 阅读:28 留言:0更新日期:2023-10-10 11:57
本发明专利技术公开了一种基于RR

【技术实现步骤摘要】
一种基于RR

SFS算法的森林蓄积量估测方法


[0001]本专利技术属于森林蓄积量估算
,具体的涉及一种基于RR

SFS算法的森林蓄积量估测方法。

技术介绍

[0002]森林蓄积量(Forest Stock Volume,FSV)估测在全球碳循环和气候变化研究中具有重要意义。合成孔径雷达(SAR)数据,特别是具有极化和干涉信息的数据,对于森林蓄积量估测发挥着重要的作用。随着SAR技术的发展和SAR数据的丰富,可以提取多种极化SAR特征用于森林蓄积量的估测。利用SAR数据精确估测森林蓄积量的关键步骤有以下两部分:一是要从数量巨大的特征集中选择最佳的估测输入特征,另一个关键是选择合适的反演模型及模型参数。特征优选。目前通常首先采用人工和自动两种方法来识别合适的SAR特征,然后采用非参数的K近邻(K

NN)、随机森林(RF)和支持向量回归(SVR)等算法进行森林AGB估测。
[0003]顺序要素选择器(Sequential Feature Selector,SFS),通过前向或后向的顺序选择,以贪婪的方式生成要素子集。在每次选择中,该选择器会根据估计器的交叉验证分数选择要素添加或删除子集中的要素,获得最佳特征。前向选择时,首先模型中只有一个单独解释因变量变异最大的自变量,之后尝试将加入另一个自变量,评价加入后整个模型所能解释的因变量变异是否有显著变化,之后将使解释量减少最少的变量剔除;迭代此过程,直到没有自变量符合剔除的条件。后向选择时,首先将所有变量均放入模型,之后尝试将其中一个自变量从模型中剔除,看整个模型解释因变量的变异是否有显著变化,之后将使解释量减少最少的变量剔除;迭代此过程,直到没有自变量符合剔除条件。相比经验阈值的特征优选,SFS可以结合当前场景的回归模型进行特征的优选,获得该过程的最优解。
[0004]岭回归(Ridge Regression,RR)是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。
[0005]然而,传统的RR模型本身存在欠拟合现象,在特征数量太多的情况下,仅利用RR进行回归,会使得拟合精度较低,从而影响估测结果。目前在森林蓄积量估测领域,特征优选和回归估测的过程中,针对不同场景下的数据,不能很好地进行协同选择,进而造成所选择特征与森林蓄积量敏感性和相关性较低,最终导致森林蓄积量估测精度较低。

技术实现思路

[0006]为了解决上述技术问题,本专利技术提供了一种基于RR

SFS算法的森林蓄积量估测方法,RR

SFS算法协同特征优选和回归模型选择,提高森林蓄积量的估测精度。
[0007]为了达到上述技术效果,本专利技术是通过以下技术方案实现的:一种基于RR

SFS算法的森林蓄积量估测方法,包括:
[0008]基于RR

SFS算法共输入样点、特征,利用不同样本数量适应的回归模型组合,对输入参数进行顺序优选,对研究区域的森林蓄积量进行了估测,
[0009]所述特征包括T3矩阵特征、Freeman

Durden和Yamaguchi极化分解特征、综合体现森林场景中各种散射机制且受极化方位角变化影响较小的极化总功率特征,及在极化总功率特征上的0
°
、45
°
、90
°
和135
°
四个角度对应的纹理特征;
[0010]进一步的,所述特征具体包括各极化散射形式下的强度、均值、对比度、熵、非相似性、均匀性和同质性;
[0011]进一步的,所述一种基于RR

SFS算法的森林蓄积量估测方法,具体包括以下步骤:
[0012]S1:获取SAR卫星影像,得到SAR输入参数特征;
[0013]S2:提取预处理后的SAR数据各类参数包括:
[0014]能反映植被结构的各极化后向散射系数;
[0015]表示散射目标的复杂变化的T矩阵部分元素;
[0016]表征森林场景散射特征的Freeman二分量分解;
[0017]模拟真实森林场景的Yamaguchi3分量分解中的体散射分量、地面散射分量、二次散射分量;
[0018]综合体现森林场景中各种散射机制且受极化方位角变化影响较小的极化总功率(SPAN)特征,0
°
、45
°
、90
°
和135
°
四个角度对应的6种纹理特征,具体包括均值、对比度、熵、非相似性、均匀性和同质性,共计48个参数作为输入生物量估测模型的输入变量;
[0019]S3:获取每木检尺的样地调查数据,或者获取角规调查样地数据,进行样地每公顷蓄积量计算;
[0020]S4:根据应用场景及样本量的大小分布等信息选择RR模型,并设置模型参数;
[0021]S5:利用GIS技术赋予48个参数对应的样地调查数据空间位置,结合地面调查数据带入RR模型进行训练,得到森林蓄积量估测的第一个模型M1;
[0022]S6:设计SFS的参数,设置特征优选个数阈值,选择顺序,评分方法,交叉验证折数;
[0023]S7:将上述S5回归模型M1带入SFS中,进行特征优选,得到特征优选子集将特征优选子集与上述S3样地调查数据结合,形成回归模型样本数据;
[0024]S8:进将上述S7的样本训练集带入RR模型进行训练,得到森林蓄积量估测的第二个模型M2;
[0025]S9:利用留一交叉验证,验证模型估测精度,采用决定系数R2、均方根误差RMSE和相对均方根误差rRMSE评价回归模型的拟合的效果及估测精度,计算公式如下:
[0026][0027][0028][0029]式中,y
i
为第i个样地点森林蓄积量的实测值,
[0030]为第i个样地点的森林蓄积量预测值,为为该研究区所有样地点森林蓄积量的实测平均值,
[0031]n为样地数量;
[0032]S10:利用GIS技术,将各个特征的空间属性与值提取记录,带入模型进行估测,并完成森林蓄积量估测制图。
[0033]本专利技术的有益效果:
[0034]本专利技术提供的估测方法,其中RR

SFS算法利用顺序特征优选方法进行特征优选,组合适用于当前场景下的各种不同的回归模型,提高森林蓄积量估测精度;相较于现有技术,本专利技术SFS后的特征子集对于可以减小过多维特征给回归模型带来的负面影响,增加特征集的信噪比,进而提升整个回归估测过程的精度。
附图说明
[0035]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RR

SFS算法的森林蓄积量估测方法,其特征在于,基于RR

SFS算法共输入样点、特征,利用适应当前场景下样本数量的RR模型,高效联合SFS方法对输入参数进行顺序优选,对研究区域的森林蓄积量进行了估测,所述特征包括T3矩阵特征、Freeman

Durden和Yamaguchi极化分解特征、综合体现森林场景中各种散射机制且受极化方位角变化影响较小的极化总功率特征,及在极化总功率特征上的0
°
、45
°
、90
°
和135
°
四个角度对应的纹理特征。2.根据权利要求1所述一种基于RR

SFS算法的森林蓄积量估测方法,其特征在于,所述特征具体包括T3矩阵、极化分解特征、不同散射角下的总功率、均值、对比度、熵、非相似性、均匀性和同质性。3.根据权利要求1所述一种基于RR

SFS算法的森林蓄积量估测方法,其特征在于,具体包括以下步骤:S1:获取SAR卫星影像,得到SAR输入参数特征;S2:提取预处理后的SAR数据各类参数包括:能反映植被结构的各极化后向散射系数;表示散射目标的复杂变化的T矩阵部分元素;表征森林场景散射特征的Freeman二分量分解;模拟真实森林场景的Yamaguchi3分量分解中的体散射分量、地面散射分量、二次散射分量;综合体现森林场景中各种散射机制且受极化方位角变化影响较小的极化总功率(SPAN)特征,0
...

【专利技术属性】
技术研发人员:张王菲黄国然姬永杰
申请(专利权)人:西南林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1