当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于特征词典融合的遥感水体目标提取方法技术

技术编号:26172866 阅读:49 留言:0更新日期:2020-10-31 13:52
本发明专利技术公开了一种基于特征词典融合的遥感水体目标提取方法。首先,构建遥感水陆场景图像数据训练集,对训练集图像网格化为预设大小的特征提取单位并分别提取局部二值模式(Local Binary Patterns,LBP)特征和频谱特征;接着,对LBP特征集和频谱特征集分别进行K‑means聚类,得到基于LBP特征的聚类结果和基于频谱特征的聚类结果,构建基于LBP和频谱特征的融合词典;然后,将训练集图像采用融合词典向量化表示,构成训练特征向量集;最后,输入待识别遥感水陆场景测试图像,根据融合词典将图像分块向量化并分类,统计分类结果,得到遥感水陆场景图像水体提取结果。

【技术实现步骤摘要】
一种基于特征词典融合的遥感水体目标提取方法
本专利技术涉及一种基于特征词典融合的遥感水体目标提取方法,属于图像处理领域。
技术介绍
水资源是人类生存必不可少的重要资源,实时、准确地获取水体信息对水资源的有效管理和合理利用有着重大意义。由于水资源时空分布不均,且具有流动性,人工检测很难实时有效地获取信息。随着遥感技术的飞速发展,通过遥感影像提取地表水体信息不仅监测范围广,而且具有实时性的优势。遥感技术经过多年的发展,所采集得到的遥感影像的空间分辨率向亚米级逐步提高。高空间分辨率遥感图像的产生,使得水体信息的提取有了更便利、更详细的数据来源。目前,基于高分辨率遥感影像进行水体提取的方法有很多。公开号CN107506769A一种城市水体信息的提取方法及系统,首先,对卫星拍摄的城市的遥感图像进行数据预处理,得到预处理后的图像;然后,根据预设分割参数对预处理后的图像进行图像分割,得到具有特征组的均值图像;接着,对均值图像进行光谱特征分析,得到典型地物光谱曲线图,该曲线图包括建筑物、水体和阴影等典型地物在各波段的光谱曲线;最后,根据特征组提取出典型地物光谱曲线提取图中的水体信息。该专利技术主要在利用地物光谱特征的基础上对水体区域进行提取,达到了一定的提取精度,但存在不足:算法需要预设分割参数,对于不同场景下的含水体信息图像的参数需要重新设置,且特征组包含光谱、拓扑、形状和长宽比等特征,特征提取和标记过程复杂、耗时。公开号CN105809140A一种基于遥感模型的地表水体信息的提取方法及其装置,首先,通过设置阈值对预处理后的遥感数据进行二值化处理;然后,对处理后的二值化遥感数据进行地表水体信息提取。基于阈值的分割方法算法结构简单,对于灰度分布差异大的图像具有较好的分割效果,但对于具有单峰或宽谷直方图特点的图像的分割效果较差。综上,现有的遥感影像水体提取方法,存在的局限性主要表现在:(1)传统的遥感影像水体提取方法大都采用光谱信息进行遥感图像水体的提取。近年来,随着遥感影像空间分辨率的不断提升,地表物体的纹理等细节也被清晰地展现出来,避免了单一利用光谱特征方法经常出现的“同物异谱,同谱异物”现象。因此,除了光谱特征,利用纹理特征进行水体的提取也成为近年研究的主要方向。(2)基于阈值的分割方法算法结构简单,对于灰度分布差异大的图像具有较好的分割效果,但对于具有单峰或宽谷直方图特点的图像的分割效果较差。
技术实现思路
专利技术目的:针对现有技术中存在的问题,本专利技术公开了基于特征词典融合的遥感水体目标提取方法,根据特征融合词典对各图像块进行向量化,相比于传统的特征分类器,融合后的词典对图像的表现力更强,提高了分类精度,增加了水体提取的准确度。技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:一种基于特征词典融合的遥感水体目标提取方法,包含构建词典阶段、训练阶段和测试阶段,所述构建词典阶段包括以下步骤:(1)构建遥感水陆场景图像数据训练集Trains,训练集图像为带标签的水体和非水体图像;(2)针对构建的遥感水陆场景图像训练集,将其网格化为预设大小的特征提取单位;(3)对训练集图像网格化后的特征提取单位集合分别提取局部二值模式(LocalBinaryPatterns,LBP)特征和频谱特征;(4)对步骤(3)中提取的局部二值模式特征集和频谱特征集分别进行K-means聚类,分别得到基于局部二值模式特征的聚类结果和基于频谱特征的聚类结果;(5)基于步骤(4)中的聚类结果,将每一类的聚类中心看作构成词典的单词,基于局部二值模式特征的聚类中心集合构成LBP单词组,基于频谱特征的聚类中心集合构成频谱单词组,两个单词组的并集即为特征融合词典;所述训练阶段包括以下步骤:(6)针对训练集中的图像,以预设大小的特征提取单位网格化提取LBP和频谱特征,计算图像所有网格的特征与步骤(5)中对应单词组各单词的距离,使用距离最近的单词描述此网格,得到描述图像的单词集合;(7)根据步骤(6)中得到的单词集合中各单词出现的频次,图像可表示为一个与词典中各单词相对应的词频向量;(8)将训练集中所有图像按照步骤(6)和步骤(7)向量化,得到训练数据集;所述测试阶段包括以下步骤:(9)针对未经分割的整体遥感水陆场景测试图像,分割得到图像块后,同步骤(6)和步骤(7),根据融合词典将图像块向量化;(10)根据步骤(8)中构建的训练数据集及其类别标签,输入的图像块类别与训练数据集中距其最近的样本类别一致,将所有图像块的分类结果合并即为测试图像的水体提取结果。进一步的,步骤(1)中的,构建遥感水陆场景图像数据训练集方法如下:(1.1)构建遥感水陆场景图像数据集Image=[Image1,…,Imagei,…,Imagen],其中,n表示有n张遥感水陆场景图像,Imagei表示第i个遥感水陆场景图像;(1.2)将数据集分为训练集部分Train和测试集部分Test,针对数据集中遥感影像,从中随机抽取m张图像构建训练集,其余n-m张图像构建测试集,则有:Train=[Train1,…,Traini,…,Trainm],Test=[Test1,…,Testi,…,Testn-m],其中,Traini表示第i个遥感影像训练图像,Testi表示第i个遥感影像测试图像;(1.3)给定一幅训练图像Traini,设其大小为W×H,对其进行不重叠分块,设分为N张图像,每张图像大小均为w×h,对每张图像制作类别标签,即若该区域一半以上为水体区域,则其标签li=1;反之,则其标签li=0,构成带标签的训练图像集Trains。进一步的,步骤(2)中的,针对输入的遥感水陆场景训练集图像,将其网格化为预设大小的特征提取单位方法如下:对步骤(1.3)中构建的训练集Trains中的N张图像进行网格化不重叠分区,设每张图像分为C个区域,每块区域大小均为s×s,其为最小特征提取单位,则集合patch_train共有N×C个单位图像,设pi表示第i个单位图像区域。进一步的,步骤(3)中的,对每张训练集图像以预设大小的特征提取单位分别提取LBP特征和频谱特征的方法如下:(3.1)对步骤(2)中的patch_train,提取其中每个pi的LBP特征,得到patch_train的LBP特征集合feature_LBP,LBP是一种用来描述图像局部特征的算子,具有灰度不变性,设c为区域pi中的某一点,则该点的LBP值为:其中,i为点c邻域的第i个像素点,gi为该像素点的灰度值,gc为点c的灰度值;S(·)表示符号函数:对区域pi中的所有点按照上述方式计算LBP值,然后将它们整合为一个256维的向量,该向量即表示区域pi的LBP特征向量;(3.2)对步骤(2)中的patch_train,提取其中每个pi的频谱特征,得到patch_train的频谱特征集feature_SF,构建频谱特征方法如下:对本文档来自技高网
...

【技术保护点】
1.一种基于特征词典融合的遥感水体目标提取方法,包含构建词典阶段、训练阶段和测试阶段,其特征在于:/n所述构建词典阶段包括以下步骤:/n(1)构建遥感水陆场景图像数据训练集Trains,训练集图像为带标签的水体和非水体图像;/n(2)针对构建的遥感水陆场景图像训练集,将其网格化为预设大小的特征提取单位;/n(3)对训练集图像网格化后的特征提取单位集合分别提取局部二值模式(LocalBinary Patterns,LBP)特征和频谱特征;/n(4)对步骤(3)中提取的局部二值模式特征集和频谱特征集分别进行K-means聚类,分别得到基于局部二值模式特征的聚类结果和基于频谱特征的聚类结果;/n(5)基于步骤(4)中的聚类结果,将每一类的聚类中心看作构成词典的单词,基于局部二值模式特征的聚类中心集合构成LBP单词组,基于频谱特征的聚类中心集合构成频谱单词组,两个单词组的并集即为特征融合词典;/n所述训练阶段包括以下步骤:/n(6)针对训练集中的图像,以预设大小的特征提取单位网格化提取LBP和频谱特征,计算图像所有网格的特征与步骤(5)中对应单词组各单词的距离,使用距离最近的单词描述此网格,得到描述图像的单词集合;/n(7)根据步骤(6)中得到的单词集合中各单词出现的频次,图像可表示为一个与词典中各单词相对应的词频向量;/n(8)将训练集中所有图像按照步骤(6)和步骤(7)向量化,得到训练数据集;/n所述测试阶段包括以下步骤:/n(9)针对未经分割的整体遥感水陆场景测试图像,分割得到图像块后,同步骤(6)和步骤(7),根据融合词典将图像块向量化;/n(10)根据步骤(8)中构建的训练数据集及其类别标签,输入的图像块类别与训练数据集中距其最近的样本类别一致,将所有图像块的分类结果合并即为测试图像的水体提取结果。/n...

【技术特征摘要】
1.一种基于特征词典融合的遥感水体目标提取方法,包含构建词典阶段、训练阶段和测试阶段,其特征在于:
所述构建词典阶段包括以下步骤:
(1)构建遥感水陆场景图像数据训练集Trains,训练集图像为带标签的水体和非水体图像;
(2)针对构建的遥感水陆场景图像训练集,将其网格化为预设大小的特征提取单位;
(3)对训练集图像网格化后的特征提取单位集合分别提取局部二值模式(LocalBinaryPatterns,LBP)特征和频谱特征;
(4)对步骤(3)中提取的局部二值模式特征集和频谱特征集分别进行K-means聚类,分别得到基于局部二值模式特征的聚类结果和基于频谱特征的聚类结果;
(5)基于步骤(4)中的聚类结果,将每一类的聚类中心看作构成词典的单词,基于局部二值模式特征的聚类中心集合构成LBP单词组,基于频谱特征的聚类中心集合构成频谱单词组,两个单词组的并集即为特征融合词典;
所述训练阶段包括以下步骤:
(6)针对训练集中的图像,以预设大小的特征提取单位网格化提取LBP和频谱特征,计算图像所有网格的特征与步骤(5)中对应单词组各单词的距离,使用距离最近的单词描述此网格,得到描述图像的单词集合;
(7)根据步骤(6)中得到的单词集合中各单词出现的频次,图像可表示为一个与词典中各单词相对应的词频向量;
(8)将训练集中所有图像按照步骤(6)和步骤(7)向量化,得到训练数据集;
所述测试阶段包括以下步骤:
(9)针对未经分割的整体遥感水陆场景测试图像,分割得到图像块后,同步骤(6)和步骤(7),根据融合词典将图像块向量化;
(10)根据步骤(8)中构建的训练数据集及其类别标签,输入的图像块类别与训练数据集中距其最近的样本类别一致,将所有图像块的分类结果合并即为测试图像的水体提取结果。


2.根据权利要求1的一种基于特征词典融合的遥感水体目标提取方法,其特征在于,步骤(1)中的,构建遥感水陆场景图像数据训练集方法如下:
(1.1)构建遥感水陆场景图像数据集Image=[Image1,…,Imagei,…,Imagen],其中,n表示有n张遥感水陆场景图像,Imagei表示第i个遥感水陆场景图像;
(1.2)将数据集分为训练集部分Train和测试集部分Test,针对数据集中遥感影像,从中随机抽取m张图像构建训练集,其余n-m张图像构建测试集,则有:Train=[Train1,…,Traini,…,Trainm],Test=[Test1,…,Testi,…,Testn-m],其中,Traini表示第i个遥感影像训练图像,Testi表示第i个遥感影像测试图像;
(1.3)给定一幅训练图像Traini,设其大小为W×H,对其进行不重叠分块,设分为N张图像,每张图像大小均为w×h,对每张图像制作类别标签,即若该区域一半以上为水体区域,则其标签li=1;反之,则其标签li=0,构成带标签的训练图像集Trains。


3.根据权利要求2的一种基于特征词典融合的遥感水体目标提取方法,其特征在于,步骤(2)中的,针对输入的遥感水陆场景训练集图像,将其网格化为预设大小的特征提取单位方法如下:对步骤(1.3)中构建的训练集Trains中的N张图像进行网格化不重叠分区,设每张图像分为C个区域,每块区域大小均为s×s,其为最小特征提取单位,则集合patch_train共有N×C个单位图像,设pi表示第i个单位图像区域。


4.根据权利要求3的一种基于特征词典融合的遥感水体目标提取方法,其特征在于,步骤(3)中的,对每张训练集图像以预设大小的特征提取单位分别提取LBP特征和频谱特征的方法如下:
(3.1)对步骤(2)中的patch_train,提取其中每个pi的LBP特征,得到patch_train的LBP特征集合feature_LBP,LBP是一种用来描述图像局部特征的算子,具有灰度不变性,设c为区域pi中的某一点,则该点的LBP值为:



其中,i为点c邻域的第i个像素点,gi为该像素点的灰度值,gc为点c的灰度值;S(·)表示符号函数:



对区域pi中的所有点按照上述方式计算LBP值...

【专利技术属性】
技术研发人员:王鑫徐明君吕国芳石爱业
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1