一种基于信息增益的高光谱数据光谱指数提取方法技术

技术编号:33638042 阅读:30 留言:0更新日期:2022-06-02 01:53
本发明专利技术涉及一种基于信息增益的高光谱数据光谱指数提取方法,包括步骤:(1)样本数据的获取、预处理;(2)利用波段替换构建同公式不同波段组合的多个类似光谱指数形式,计算各光谱指数形式下不同类的光谱指数;(3)计算光谱指数在其类中的信息增益:先根据光谱指数在各类中取值的连续性划分节点,计算各划分节点的信息熵,根据信息熵计算信息增益,选择信息增益最大的划分点作为最优划分点,该划分点的信息增益作为光谱指数形式a的信息增益;(4)计算各光谱指数的信息增益,取最大值所对应的光谱指数为最优分类光谱指数。该方法能够有效的扩充光谱指数的形式和组合方法,能够从大量光谱指数和波段组合中快速地筛选出最优的分类指数。数和波段组合中快速地筛选出最优的分类指数。数和波段组合中快速地筛选出最优的分类指数。

【技术实现步骤摘要】
一种基于信息增益的高光谱数据光谱指数提取方法


[0001]本专利技术涉及一种光谱指数提取方法,具体涉及一种基于信息增益的高光谱数据光谱指数提取方法,属于遥感特征提取


技术介绍

[0002]光谱指数作为遥感分类的重要参数,对遥感分类的结果精度具有重要影响。传统光谱指数一部分是通过研究大量实测数据的光谱曲线与研究目标的关系,得出相关指数。在此基础上,一部分光谱指数通过已有的光谱指数的进行进一步修正或波段替换。这些方法需要大量的数据研究,光谱指数筛选效率较低,很难快速获取合适的光谱指数。而且随着高光谱数据的应用,波段数量增加,光谱指数的波段组合形式大量增加,适用于高光谱数据的光谱指数选择成为高光谱数据分类快速处理的难点。

技术实现思路

[0003]本专利技术的目的在于克服上述不足,而提供一种基于信息增益的高光谱数据光谱指数提取方法,该方法能够有效的扩充光谱指数的形式和组合方法,能够从大量光谱指数和波段组合中快速地筛选出最优的分类指数。
[0004]本专利技术采取的技术方案为:
[0005]一种基于信息增益的高光谱数据光谱指数提取方法,包括以下步骤:
[0006](1)样本数据的准备与处理
[0007]获取高光谱实测遥感反射率数据或高光谱遥感影像遥感反射率数据,将获取的高光谱数据按所测目标物的所属类别分组,每类高光谱数据为1组,每一组高光谱数据所对应的类别标签L1……
L
n
类,共n组,每一组高光谱数据所对应的波段有N个,进行高光谱数据类别重命名,把待区分的类别标签设为1,其余都为2。
[0008](2)利用波段替换构建同公式不同波段组合的多个类似光谱指数形式,计算各光谱指数形式下不同类(或组)的光谱指数:
[0009]光谱指数根据不同计算方法得到不同的形式,计算主要有利用单波段值(式一)、波段差值(式二)、波段和值(式三)、单波段比值(式四)、单波段与波段差值的比值(式五)、波段差值与和值的比值(式六)得到的光谱指数,计算方法分别如下:
[0010]SI=b
i
式(一)
[0011]SI=b
i

b
m
式(二)
[0012]SI=b
i
+b
m
式(三)
[0013][0014][0015][0016]式中:SI是光谱指数(Spectralindex),b是波段,i、m、n是高光谱数据的第i、m、n波段,(i、m、n为自然数,i、m、n≤N);
[0017]根据高光谱数据的波段设置,利用高光谱数据中的波段进行替换,构建已有光谱指数同公式不同波段组合的多个类似光谱指数形式,用获取的高光谱数据和公式计算各光谱指数形式在不同类(或组)的光谱指数。
[0018](3)计算光谱指数在其类中的信息增益
[0019]信息增益的基本思想是:首先将连续的光谱指数值离散化,通过二分法,用一个光谱指数的划分点将数据集分成两类,然后根据权重计算每部分的信息熵,再通过总体信息熵计算出该划分点的信息增益。光谱指数的计算值可以看作是连续值的属性,因此需要通过二分法进行离散化处理,二分法基本思想为:给定样本集D与连续属性α,二分法试图找到一个划分点t将样本集D在属性α上分为≤t与>t。
[0020]为了进一步量化确定各个光谱指数的分类效果,进行如下信息增益计算:
[0021]将待算光谱指数形式a所对应的不同类的所有取值按升序排列,得样本集合D,连续属性α,所有相邻属性的均值作为候选划分点有n

1个,n为α所有的取值数目;
[0022]根据步骤(1)的重命名及待区分类别在所有类别中的占比,对于样本集合D中第k类样本所占的比例为p
k
(k=1,2),则D的信息熵定义为:
[0023][0024]Ent(D)的值越小,则D的纯度越高,属于同一类的可能性越大;
[0025][0026]用每一个划分点划分集合D后,第1分支节点包含了D中所有在光谱指数形式a上取值小于等于T
a
的样本,记为D
V
(v=1),取值大于T
a
的样本,记为D
V
(v=2);根据公式七计算出D
V
的信息熵,再考虑到不同分支结点所包含的样本数不同,给分支结点赋予权重|D
V
|/|D|,即样本数越多的分支结点的影响越大,计算光谱指数形式a对样本集D未分类时的信息熵与进行划分后各划分点的信息熵所得的差值,即为所获得的“信息增益”,选择最大信息增益的划分点作为最优划分点,该划分点的信息增益作为光谱指数形式a的信息增益;
[0027][0028]式中a为光谱指数形式名称,a
i
为D中光谱指数形式a的一个取值,t为具体某个划分阈值,其计算如T
a
,v为分类的类别(v=1,2);
[0029](4)确定最优分类光谱指数
[0030]信息增益越大,表明使用光谱指数a对数据集划分所获得的“纯度提升”越大,计算所有光谱指数的信息增益,当信息增益取最大值时,最大信息增益对应的光谱指数为最优分类光谱指数,方法如式(十):
[0031]SI
y
=max(Gain(D,S))式(十)
[0032]式中:SI
y
所表示的光谱指数为具体的最优的光谱指数分类形式,Gain(D,SI)是所有光谱指数的信息增益。
[0033]本专利技术基于高光谱数据,利用波段整合,用高光谱数据的波段进行逐一替换,构建
已有光谱指数同形式的多个类似光谱指数,计算出对应的光谱指数值,通过计算光谱指数的信息增益来实现最优分类光谱指数的选择。本专利技术能够从大量光谱指数和波段组合中快速的筛选出最优的分类指数,并且可以广泛应用于不同场景、不同类别的高光谱数据分类问题,具有较高的可移植性,提高了高光谱数据分类的效率。
附图说明
[0034]图1为本专利技术的方法流程图。
具体实施方式
[0035]为了更好地说明本专利技术涉及的基于信息增益的高光谱数据光谱指数提取方法,对本专利技术实施例中的技术方案进行具体、清楚、完整地描述。
[0036]实施例1
[0037]基于信息增益的高光谱数据光谱指数提取方法:
[0038]1.数据的准备与处理
[0039]选取部分数据对方法进行说明,获取共有3类(1、2、3)的高光谱数据(S1、S2、S3),每类高光谱数1组,共3组,每组高光谱数据有4个波段(波段1、2、3、4),如表一。
[0040]表一:原始数据
[0041]数据名称波段1(B1)波段2(B2)波段3(B3)波段4(B4)类别S1321007581S22797732022S356241138443
[0042]选择光谱指数将其中的类别2(如S2数据)与其余两类(类别1、类别3)进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于信息增益的高光谱数据光谱指数提取方法,其特征是,包括以下步骤:(1)样本数据的获取、预处理:获取高光谱实测遥感反射率数据或高光谱遥感影像遥感反射率数据,将获取的高光谱数据按类分组,每组数据划分波段,根据需要进行高光谱数据类别重命名;(2)利用波段替换构建同公式不同波段组合的多个类似光谱指数形式,计算各光谱指数形式下不同类的光谱指数;(3)计算光谱指数在其类中的信息增益:先根据光谱指数在各类中取值的连续性划分节点,计算各划分节点的信息熵,根据信息熵计算信息增益,选择信息增益最大的划分点作为最优划分点,该划分点的信息增益作为对应光谱指数形式的信息增益;(4)计算各光谱指数的信息增益,取信息增益最大值所对应的光谱指数为最优分类光谱指数。2.根据权利要求1所述的一种基于信息增益的高光谱数据光谱指数提取方法,其特征是,步骤(1)所述的高光谱数据按所测目标物的所属类别分组,每类高光谱数据为1组,每一组高光谱数据所对应的类别标签L1……
L
n
类,共n组,每一组高光谱数据所对应的波段有N个,进行高光谱数据类别重命名,把待区分的类别标签设为1,其余都为2。3.根据权利要求1所述的一种基于信息增益的高光谱数据光谱指数提取方法,其特征是,步骤(2)所述的光谱指数形式的构建是按照单波段值如式一、波段差值如式二、波段和值如式三、单波段比值如式四、单波段与波段差值的比值如式五、波段差值与和值的比值如式六得到的光谱指数,计算方法分别如下:SI=b
i
式(一)SI=b
i

b
m
式(二)SI=b
i
+b
m
式(三)式(三)式(三)式中:SI是光谱指数,b是波段,i、m、n是高光谱数据的第i、m、n波段,i、m、n为自然数,i、m、n≤N。4.根据权利要求1所述的一种基于信息增益的高光谱数据光谱指数提取方法,其特征是,步骤...

【专利技术属性】
技术研发人员:张衍福刘凯赵新杨丽
申请(专利权)人:山东省水利综合事业服务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1