当前位置: 首页 > 专利查询>武汉大学专利>正文

一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法技术

技术编号:20285438 阅读:47 留言:0更新日期:2019-02-10 17:55
本发明专利技术提供一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法,该方法首先对样本库中的影像提取多个特征,然后利用分级结构的图扩散模型对多个特征进行融合扩散。针对扩散结果,利用谱聚类将原有样本库自动聚合为若干个簇。最后以簇为基本标注单元,通过相似性分析确定每个簇中的关键样本,利用关键样本对簇进行标注,从而完成对整个样本库的全标记。本发明专利技术利用分级扩散模型,将互补性较强的特征分配到同一子树内,使得多特征融合效果更好,使得自动聚合与标注结果更加准确。

A Fast Marking Method for Remote Sensing Image Sample Base Assisted by Multi-feature Automatic Grading and Aggregation

The invention provides a fast labeling method for remote sensing image sample bank assisted by multi-feature automatic hierarchical aggregation. Firstly, the method extracts multiple features from the image in the sample bank, and then uses the graph diffusion model of hierarchical structure to fuse and diffuse multiple features. According to the diffusion results, the original sample library is automatically aggregated into several clusters by spectral clustering. Finally, the cluster is used as the basic labeling unit, and the key samples in each cluster are determined by similarity analysis. The key samples are used to label the cluster, thus completing the full labeling of the whole sample library. By using the hierarchical diffusion model, the feature with strong complementarity is allocated to the same subtree, so that the multi-feature fusion effect is better, and the automatic aggregation and labeling results are more accurate.

【技术实现步骤摘要】
一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法
本专利技术属于图像数据处理方法,具体涉及一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法。
技术介绍
构建有标记样本库是开展数据驱动的遥感影像分析与应用的一个关键问题。近年来,随着遥感技术和人工智能领域的快速发展,深度学习技术在遥感影像的智能化分析解译中发挥着越来越重要的作用。深度学习技术依赖大规模的有标记训练数据,而目前遥感影像样本库太小,不足以支撑完整的深度学习过程。此外,遥感影像类型丰富,对于大规模遥感影像样本库来说,仅仅通过人工劳动不可能为每种类型的遥感影像进行快速有效的标注。为了降低人工标注成本,目前的遥感影像样本库标记主要有两类方法:一种方法为利用开放街道地图(OSM)中的兴趣点和矢量数据来表示遥感图像中的地理空间对象,并通过提取以所指示的地理空间为中心的场景来完成场景标注。另一种为利用专家知识的交互式主动聚类方法。然而,基于OSM的方法仍然需要人工检查来修改开放街道地图中的误差,而主动聚类的方法仍然需要数百次的专家反馈来增强标注精度。除了上述两种方法之外,半监督学习方法对于样本库标记也有不错的效果,但是由于半监督方法中只可接受几种类型的特征描述符,不足以全面表征遥感影像。如果盲目增加特征数量,则会产生维数灾难的问题。
技术实现思路
本专利技术提出了一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法,旨在解决遥感领域大规模标记样本库方法匮乏的问题。该方法首先对样本库中的影像提取多个特征,然后利用分级结构的图扩散模型对多个特征进行融合扩散。针对扩散结果,利用谱聚类将原有样本库自动聚合为若干个簇。最后以簇为基本标注单元,通过相似性分析确定每个簇中的关键样本,利用关键样本对簇进行标注,从而完成对整个样本库的全标记。本专利技术所采用的技术方案是:一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法,包括以下步骤:步骤1,构建样本特征库:对于包含n幅遥感影像的样本库,首先利用已有的特征提取方法进行图像特征提取,得到样本库的特征库F;其中提取M种类型特征,则整个样本库的特征库可以表示为F={F1,F1,…,FM},其中表示样本库中第m个特征;对于样本库中的第i幅影像,其特征库可以表示为步骤2,分级融合扩散,包括如下子步骤,步骤2.1,构建相似性图:根据特征库F,针对特征库每个特征建立样本之间的相似性图其中相似性图包含的个数与特征数M相等;步骤2.2,子树分配:首先确定子树个数其中H表示不大于根号M的最大整数,然后计算不同特征之间的不相似性,挑选出M个互补性最强的特征分配到H个子树中,每个子树包含D个特征,其中D的个数近似等于M/H;步骤2.3,生成局部连接图:根据全连接图,即步骤2.1中的相似性图,构建局部连接图,其中局部连接图中的每个顶点仅仅与它最相近L个邻接顶点相连;步骤2.4,第一级融合扩散:利用交叉扩散模型,根据全连接图的状态矩阵和局部连接图的核矩阵,对每个子树内的D个多特征进行第一级的融合扩散,获得每个子树的混合多特征相似性矩阵;步骤2.5,第二级融合扩散:根据步骤2.4得到共H个子树的融合扩散结果,利用交叉扩散模型进行第二级融合扩散,得到最终的相似性矩阵;步骤3,样本库标记,包含以下子步骤:步骤3.1,自动聚合:结合步骤2得到的最终的相似性矩阵,利用谱聚类算法对待标记样本库进行自动聚合获得簇;步骤3.2,关键样本标记:根据3.1得到的簇,在每个簇中选取关键样本作为参考对簇进行标记最终得到每一类的有标记标志性样本。进一步的,步骤1中已有的特征提取方法包括VGG网络迁移特征,无监督k-means学习特征,LBP特征,HOG特征。进一步的,步骤2.1中相似性图的具体构建方法如下,设相似性图G=(V,E,W),相似性图的顶点V={1,2,...,n}表示样本库中的影像,边是权重,表示影像之间的相似度,W为相似性矩阵;对于第m个特征来说,影像xi与xj之间的相似度可以由下式计算:其中||·||2表示欧氏距离,和分别表示影像xi与xj的第m个特征,为控制参数。进一步的,步骤2.2中计算不同特征之间的不相似性计算方法如下,其中S为标量,表示特征之间的不相似性,n表示子树内顶点的个数,即子树内样本的个数,Ws表示子树内已经选择特征的相似性矩阵的均值,Wh表示候选特征的相似性矩阵,S值越大表示特征之间的不相似性越大,即互补性越强。进一步的,步骤3.1中利用谱聚类算法对待标记样本库进行自动聚合获得簇的具体实现方式如下,假设聚类数量为C,那么待标记样本库自动聚合为C个聚类A1,A2,...,AC,其中是Ai补集,表示由步骤2得到的最终的相似性矩阵,表示Ai与的边权重值和,vol(·)表示度矩阵。进一步的,步骤3.2中关键样本的选取方式如下,对于第α个簇,关键样本由下式计算:其中Aα∈Rn×n为第α个簇相似性矩阵,n为簇中样本的个数,表示在簇中与其他样本相似性最高的样本。与现有技术相比,本专利技术的优点和有益效果:采用自动聚合辅助下的标注方法,将原始样本库分为若干个簇,对每个簇进行标记,大大降低了标记的时间消耗;采用了多个特征对影像进行表征,使得图像表达更加准确;利用分级扩散模型,将互补性较强的特征分配到同一子树内,使得多特征融合效果更好,使得自动聚合与标注结果更加准确。附图说明图1是本专利技术的流程图;图2是分级融合扩散示例。图的顶点代表数据集中的样本,每个数字代表对应由不同特征构造的连接图。图中两个节点之间的连接反映了它们之间的相似性,而边的厚度反映了相似性的强度。需要注意的是,图中每对节点之间应该存在链接;但是,本例仅显示了一些关键链接作为示例;具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种基于高分辨率遥感影像的城市阴影检测去除方法,包括以下步骤:(1)构建样本特征库步骤对于包含n幅遥感影像的样本库,首先需要利用已有的特征提取方法进行图像特征提取,得到样本库的特征库F。其中提取M种类型特征,则整个样本库的特征库可以表示为F={F1,F1,…,FM},其中表示样本库中第m个特征。对于样本库中的第i幅影像,其特征库可以表示为(2)分级融合扩散步骤,包括以下子步骤(2.1)构建相似性图:根据特征库F,可以针对特征库每个特征建立样本之间的相似性图G=(V,E,W),其中相似性图包含的个数与特征数M相等,初始构建的相似性图为全连接图,全连接图每个顶点与其他所有顶点都有连接。相似性图的顶点V={1,2,...,n}表示样本库中的影像。边是权重,表示影像之间的相似度。W为相似性矩阵。对于第m个特征来说,影像xi与xj之间的相似度可以由下式计算:其中||·||2表示欧氏距离,为控制参数。(2.2)子树分配:首先确定子树个数其中H表示不大于根号M的最大整数。然后根据公式(2)计算不同特征之间的不相似性,将M个特征分配到H个子树中。每个子树包含D个特征,其中D的个数近似等于M/H。对于第h个子树,包含的特征子集为相应的所构建出的相似性图为对于每个子树,初始情况为随机选择一个特征相似性矩阵,之后根据公式(2)本文档来自技高网...

【技术保护点】
1.一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法,其特征在于,包括如下步骤:步骤1,构建样本特征库:对于包含n幅遥感影像的样本库,首先利用已有的特征提取方法进行图像特征提取,得到样本库的特征库F;其中提取M种类型特征,则整个样本库的特征库可以表示为F={F

【技术特征摘要】
1.一种多特征自动分级聚合辅助下的遥感影像样本库快速标记方法,其特征在于,包括如下步骤:步骤1,构建样本特征库:对于包含n幅遥感影像的样本库,首先利用已有的特征提取方法进行图像特征提取,得到样本库的特征库F;其中提取M种类型特征,则整个样本库的特征库可以表示为F={F1,F1,…,FM},其中表示样本库中第m个特征;对于样本库中的第i幅影像,其特征库可以表示为步骤2,分级融合扩散,包括如下子步骤,步骤2.1,构建相似性图:根据特征库F,针对特征库每个特征建立样本之间的相似性图其中相似性图包含的个数与特征数M相等;步骤2.2,子树分配:首先确定子树个数其中H表示不大于根号M的最大整数,然后计算不同特征之间的不相似性,挑选出M个互补性最强的特征分配到H个子树中,每个子树包含D个特征,其中D的个数近似等于M/H;步骤2.3,生成局部连接图:根据全连接图,即步骤2.1中的相似性图,构建局部连接图,其中局部连接图中的每个顶点仅仅与它最相近L个邻接顶点相连;步骤2.4,第一级融合扩散:利用交叉扩散模型,根据全连接图的状态矩阵和局部连接图的核矩阵,对每个子树内的D个多特征进行第一级的融合扩散,获得每个子树的混合多特征相似性矩阵;步骤2.5,第二级融合扩散:根据步骤2.4得到共H个子树的融合扩散结果,利用交叉扩散模型进行第二级融合扩散,得到最终的相似性矩阵;步骤3,样本库标记,包含以下子步骤:步骤3.1,自动聚合:结合步骤2得到的最终的相似性矩阵,利用谱聚类算法对待标记样本库进行自动聚合获得簇;步骤3.2,关键样本标记:根据3.1得到的簇,在每个簇中选取关键样本作为参考对簇进行标记最终得到每一类的有标记标志性样本。2.如权利要求1所述的一种多特征自动分级聚合辅助下的遥感影像样本库快速标...

【专利技术属性】
技术研发人员:李彦胜张永军叶冬杰
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1