结合长时序数据和机器学习算法的热融塘状态识别方法技术

技术编号:28472722 阅读:10 留言:0更新日期:2021-05-15 21:40
本发明专利技术公开了一种结合长时序数据和机器学习算法的热融塘状态识别方法,首先引入与热融塘状态变化相关的多光谱指数集,并将长时间序列的多光谱指数集的变化趋势参数集作为输入数据集,准确表征热融塘的变化动态;在输出端部分,采用基于像元的机器学习方法对热融塘区域进行变化状态的识别,逐像元地获取热融塘动态变化的结果,最终实现精度和效率均有保障的热融塘变化状态的识别。本发明专利技术在获取与热融塘状态关系密切的多光谱指数集的基础上,额外引入了各个指数长时间变化的趋势参数作为输入参数,克服了仅用静态指数作为输入参数无法准确表征热融塘变化动态的弊端,弥补了传统方法复杂且执行效率方面的不足。法复杂且执行效率方面的不足。法复杂且执行效率方面的不足。

【技术实现步骤摘要】
结合长时序数据和机器学习算法的热融塘状态识别方法


[0001]本专利技术涉及一种热融塘状态识别方法,尤其涉及一种结合长时序数据和机器学习算法的热融塘状态识别方法。

技术介绍

[0002]热融塘是由于富冰多年冻土退化或厚层地下冰发生局部融化,地表土层沉陷而形成的热融洼地并积水形成的湖塘。自上个世纪以来,为满足社会经济发展的需求,青藏高原进行了大规模的工程项目开发,随着人类活动的频繁深入展开以及全球气候变暖的背景下,多年冻土区域的环境和状态发生了很大的变化。青藏高原的多年冻土一直处于强烈的退化过程,而热融塘作为热融灾害中最为典型、对冻土环境影响最为直接的一种热融灾害,也是多年冻土退化的重要标志。热融塘的发育主要是以湖水作为热源,导致热融塘周围及下部多年冻土融化,进一步引起湖面面积扩大、水量增加、湖水深度增加以及湖岸坍塌后退。热融塘的出现改变了多年冻土区原有的地表形态,封存在多年冻土区中的有机质被淹没,并在不同条件下被微生物分解为甲烷和二氧化碳等温室气体,不仅对多年冻土碳循环过程具有重要影响,还将进一步加剧全球气候变暖。因此,准确掌握热融塘的变化状态不仅能够有效辅助热融塘的变化预测和防治工作,对全球气候变化研究也具有重要的现实意义。
[0003]现有技术主要存在以下两方面的技术缺陷:一是传统的热融塘变化状态识别仅仅采用数量有限的影像或静态的多光谱指数进行比较判断,容易受到到季节变化、光照角度、传感器噪声以及大气条件的影响而降低识别的精度;第二,传统方法采取长时间序列影像进行状态识别时,需要对每一景影像都进行感兴趣区的提取以及指数集的计算,需要花费大量计算和手工操作的时间,热融塘识别效率低下,识别过程复杂。

技术实现思路

[0004]为了解决上述技术所存在的不足之处,本专利技术提供了一种结合长时序数据和机器学习算法的热融塘状态识别方法。
[0005]为了解决以上技术问题,本专利技术采用的技术方案是:一种结合长时序数据和机器学习算法的热融塘状态识别方法,包括以下步骤:
[0006]步骤一、长时序反射率产品的获取;
[0007]步骤二、诊断因子集的制备;
[0008]步骤三、训练样本的选取;
[0009]步骤四、机器学习算法的训练;
[0010]步骤五、热融塘变化状态的识别与获取。
[0011]进一步地,步骤一的具体步骤如下:
[0012]根据变化动态识别的空间分辨率和时间尺度需求,下载高空间分辨率的长时间序列的遥感观测数据集,长时间序列的遥感观测数据集的要求包括:
[0013]a、传感器:TM、ETM+和OLI;
[0014]b、空间分辨率=30m;
[0015]c、时间序列>=10年,月份选择7月和8月,这样能够避免冰和雪的干扰;
[0016]d、云量小于70%,这样能够避免云和阴影的影响;
[0017]根据各个波段间的相似度和差异性,通过对遥感观测数据中的蓝光反射率、绿光反射率、红光反射率、近红外反射率、以及短波红外反射率进行波段运算和回归分析,进一步获得对热融塘区域不同状态具有表征性的多光谱指数集。
[0018]进一步地,蓝光反射率的中心波长介于0.45um

0.52um,绿光反射率的中心波长介于0.52um

0.60um,红光反射率的中心波长介于0.63um

0.69um,近红外反射率的中心波长介于0.77um

0.90um,短波红外反射率的中心波长介于1.55um

1.75um和2.09um

2.35um。
[0019]进一步地,步骤二包括多光谱指数集R的制备和基于多光谱指数集获取对应的趋势参数集T,其中,趋势参数集T作为输入部分用于机器学习算法的训练。
[0020]进一步地,多光谱指数集R的制备的具体步骤为:
[0021]a、将下载的地表反射率产品进行几何纠正和重投影,裁剪成30
×
30km的子集,其相当于每个子图像包括1000
×
1000个像元;
[0022]b、利用预处理后的地表反射率产品,通过相应的波段运算获取所需的八类多光谱指数,包括:穗帽亮度TCB、穗帽绿度TCG、穗帽湿度TCW、归一化植被指数NDVI、土壤调节植被指数SAVI、植被覆盖度FVC、归一化多波段干旱指数NMDI以及改进的归一化水体指数MNDWI;
[0023]其中,TCB、TCG、TCW是光谱通过线性变换和光谱空间旋转后获取的三个分量,第一分量TCB表征土壤亮度,反映土壤光谱信息;第二分量TCG表征绿度,反映植被光谱信息;第三分量TCW表征地物的水分含量,反映了地物的湿度信息;NDVI、SAVI和FVC能够反映地表覆盖类型的变化对植被相关指数的影响;NMDI能够反映地表覆盖类型变化对土壤湿度变化的影响;MNDWI能够反映地表覆盖类型变化对水体的比例变化的影响;
[0024]进一步地,八类多光谱指数能够反映不同的地表特征,其具体的计算公式如下:
[0025]TCB=ω
TCB,1
×
ρ
B

TCB,2
×
ρ
G

TCB,3
×
ρ
R

TCB,4
×
ρ
NIR

TCB,5
×
ρ
SWIR1

TCB,6
×
ρ
SWIR2
ꢀꢀ
(1)
[0026]TCG=ω
TCG,1
×
ρ
B

TCG,2
×
ρ
G

TCG,3
×
ρ
R

TCG,4
×
ρ
NIR

TCG,5
×
ρ
SWIR1

TCG,6
×
ρ
SWIR2
ꢀꢀ
(2)
[0027]TCW=ω
TCW,1
×
ρ
B

TCW,2
×
ρ
G

TCW,3
×
ρ
R

TCW,4
×
ρ
NIR

TCW,5
×
ρ
SWIR1

TCW,6
×
ρ
SWIR2
ꢀꢀ
(3)
[0028][0029][0030][0031][0032][0033]其中,ρ
R
为红光反射率产品;ρ
G
为绿光反本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:包括以下步骤:步骤一、长时序反射率产品的获取;步骤二、诊断因子集的制备;步骤三、训练样本的选取;步骤四、机器学习算法的训练;步骤五、热融塘变化状态的识别与获取。2.根据权利要求1所述的结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:所述步骤一的具体步骤如下:根据变化动态识别的空间分辨率和时间尺度需求,下载高空间分辨率的长时间序列的遥感观测数据集,长时间序列的遥感观测数据集的要求包括:a、传感器:TM、ETM+和OLI;b、空间分辨率=30m;c、时间序列>=10年,月份选择7月和8月,这样能够避免冰和雪的干扰;d、云量小于70%,这样能够避免云和阴影的影响;根据各个波段间的相似度和差异性,通过对遥感观测数据中的蓝光反射率、绿光反射率、红光反射率、近红外反射率、以及短波红外反射率进行波段运算和回归分析,进一步获得对热融塘区域不同状态具有表征性的多光谱指数集。3.根据权利要求2所述的结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:所述蓝光反射率的中心波长介于0.45um

0.52um,绿光反射率的中心波长介于0.52um

0.60um,红光反射率的中心波长介于0.63um

0.69um,近红外反射率的中心波长介于0.77um

0.90um,短波红外反射率的中心波长介于1.55um

1.75um和2.09um

2.35um。4.根据权利要求1所述的结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:所述步骤二包括多光谱指数集R的制备和基于多光谱指数集获取对应的趋势参数集T,其中,趋势参数集T作为输入部分用于机器学习算法的训练。5.根据权利要求1所述的结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:所述多光谱指数集R的制备的具体步骤为:a、将下载的地表反射率产品进行几何纠正和重投影,裁剪成30
×
30km的子集,其相当于每个子图像包括1000
×
1000个像元;b、利用预处理后的地表反射率产品,通过相应的波段运算获取所需的八类多光谱指数,包括:穗帽亮度TCB、穗帽绿度TCG、穗帽湿度TCW、归一化植被指数NDVI、土壤调节植被指数SAVI、植被覆盖度FVC、归一化多波段干旱指数NMDI以及改进的归一化水体指数MNDWI;其中,TCB、TCG、TCW是光谱通过线性变换和光谱空间旋转后获取的三个分量,第一分量TCB表征土壤亮度,反映土壤光谱信息;第二分量TCG表征绿度,反映植被光谱信息;第三分量TCW表征地物的水分含量,反映了地物的湿度信息;NDVI、SAVI和FVC能够反映地表覆盖类型的变化对植被相关指数的影响;NMDI能够反映地表覆盖类型变化对土壤湿度变化的影响;MNDWI能够反映地表覆盖类型变化对水体的比例变化的影响。6.根据权利要求5所述的结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:所述八类多光谱指数能够反映不同的地表特征,其具体的计算公式如下:
TCB=ω
TCB,1
×
ρ
B

TCB,2
×
ρ
G

TCB,3
×
ρ
R

TCB,4
×
ρ
NIR

TCB,5
×
ρ
SWIR1

TCB,6
×
ρ
SWIR2
ꢀꢀ
(1)TCG=ω
TCG,1
×
ρ
B

TCG,2
×
ρ
G

TCG,3
×
ρ
R

TCG,4
×
ρ
NIR

TCG,5
×
ρ
SWIR1

TCG,6
×
ρ
SWIR2
ꢀꢀꢀ
(2)TCW=ω
TCW,1
×
ρ
B

TCW,2
×
ρ
G

TCW,3
×
ρ
R

TCW,4
×
ρ
NIR

TCW,5
×
ρ
SWIR1

TCW,6
×
ρ
SWIR2
ꢀꢀꢀ
(3)(3)(3)(3)(3)其中,ρ
R
为红光反射率产品;ρ
G
为绿光反射率产品;ρ
B
为蓝光反射率产品、ρ
NIR
为近红外反射率产品;ρ
SWIR1
和ρ
SWIR2
分别为两个短波红外反射率产品;TCB、TCG和TCW分别为穗帽亮度、绿度以及湿度,其中,ω
x,i
(x∈{TCB,TCG,TCW},i∈[1,6])为计算穗帽指数TCB、TCG和TCW时6个波段所对应的系数,该系数是跟传感器类型相关的常数,可通过文献资料获取或者先验知识估算;NDVI为归一化植被指数;SAVI为土壤调节植被指数;FVC为植被覆盖度;NMDI为归一化多波段干旱指数;MNDWI为改进的归一化水体指数;NDVI
max
和NDVI
min
分别是NDVI的最大值和最小值。7.根据权利要求1所述的结合长时序数据和机器学习算法的热融塘状态识别方法,其特征在于:所述趋势参数集T的获取步骤为:a、针对长时间序列的多光谱参数集R中的每个光谱指数,分别计算出5个趋势因子,包括:变化斜率k、截距h、低置信区间p、高置信区间q、置信间距d,通过长时间序列的变化趋势来反映出地表覆盖的变化动态,八个多光谱指数每个指数都拥有5个趋势参数,即每个像元对应了40种不同类别的信息;b、利用泰尔森回归算法估算趋势参数,泰尔森回归算法是基于成对斜率的计算,即计算所有时间的数据点对之间连线的斜率,获取这些斜率的中值作为每个指数在时间序列上的主斜率,其具体的计算公式如下:其中i代表第i个像元,...

【专利技术属性】
技术研发人员:常胜陈虹吴炳方闫娜娜张春燕
申请(专利权)人:中国自然资源航空物探遥感中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1