System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法技术_技高网

一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法技术

技术编号:40784782 阅读:5 留言:0更新日期:2024-03-28 19:17
一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,属于遥感信息技术中的遥感图像数据聚类处理领域,本发明专利技术首先将非完备多视角遥感图像数据划分为完备样本集合和存在样本集合,并获取完备样本的伪标签。然后将存在样本的不同视角特征、相应的图以及流形信息输入多视角图卷积特征融合分类网络以获得伪标签。训练完成后,从学习到的统一表征中获得聚类。与其他方法相比,本发明专利技术的精确度更高,性能更加稳健。

【技术实现步骤摘要】

本专利技术属于遥感信息技术中的遥感图像数据聚类处理领域,具体涉及一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法


技术介绍

1、随着卫星遥感和航空遥感图像分辨率的不断提高,人们可以从遥感图像中获得更多有用的数据和信息。随着不同领域遥感图像的应用对遥感图像的处理提出了不同的要求,对遥感图像进行聚类分析,就显得尤为重要。对同一场景之下不同视角或不同时间或不同传感器取得的图像称为多视角遥感图像,其能够更全面对场景进行描述。然而,由于地面起伏变化以及航拍视角变化会造成图像间存在非刚性畸变以及重叠度低等问题,会导致多视角遥感图像的非完备问题。现有基于伪标签学习的多视角聚类方法仅能够处理具有完备视角的数据聚类问题,无法应用于视角信息非完备的图像,这也给非完备多视角遥感图像类别划分问题带来巨大挑战,需要有效的新颖技术方法解决非完备多视角遥感图像的聚类应用。


技术实现思路

1、为了解决上述问题,本专利技术提供了一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,所述方法包括步骤:

2、从一个非完备多视角遥感图像数据集中提取完备样本集合和存在样本集合。对完备样本的特征向量进行拼接,对拼接后的特征向量进行k均值聚类得到完备样本的伪标签。

3、构建一个由多个视角专属图卷积编码层、一个特征融合层、一个线性分类层组成的多视角图卷积特征融合分类网络,并随机初始化网络权重。

4、根据存在样本每一视角的特征向量分别构建k近邻图矩阵和高维流形分布矩阵。

5、将存在样本的不同视角特征和相应的k近邻图矩阵输入分类网络,以预测完备样本的伪标签,相应的损失函数为带掩码的交叉熵分类损失函数,同时对网络所学表示施加流形正则化约束,得到基于伪标签引导的流形正则化总体损失函数。

6、使用随机梯度下降算法最小化所述基于伪标签引导的流形正则化总体损失函数,将所述分类网络训练至收敛,然后对收敛后网络所学表示进行k均值聚类,获得最终聚类结果。

7、根据所得聚类结果,计算所述非完备多视角遥感图像数据集上的聚类准确率。

8、进一步地,将所述的非完备多视角遥感图像数据集中的完备样本集合定义为:

9、

10、

11、其中,是完备样本集合,ev(v=1,2,…,m)是每个视角的存在样本集合。m∈{0,1}n×m是缺失指示矩阵,若第i个样本的第j个视角存在,则mij=1,否则mij=0;n和m分别表示样本数和视角数;完备样本的特征向量记作存在样本的特征向量记作将完备样本全部视角的特征向量进行拼接,得到完备样本特征向量的拼接定义如下:

12、

13、对所述的特征向量拼接进行k均值聚类,得到完备样本的伪标签其中,np是完备样本数,nc是类簇数,是所有视角特征维度之和。

14、进一步地,所述每个视角专属图卷积编码层由两个图卷积模块组成:

15、

16、

17、其中,relu是非线性激活函数层,batchnorm是批量归一化层,conv是图卷积层;是存在样本特征矩阵,是第一个图卷积模块的输出,hv是第二个图卷积模块的输出,av是k近邻图矩阵。视角专属图卷积编码层的最终输出为视角专属低维表示hv。

18、所述特征融合层将所有视角专属低维表示hv,v=1,2,...,m进行加权融合,得到网络所学表示h,其定义如下:

19、

20、其中,m:,v表示缺失指示矩阵的第v列。

21、所述线性分类层的定义如下:

22、

23、其中,linear是带有权重和偏置的全连接层,softmax是多分类激活函数层;是网络预测的类簇概率分布,是网络所学表示,d是所学表示的特征维度。所述分类网络的各个子模块共同组成了完整的端到端网络。

24、进一步地,所述视角v的k近邻图矩阵的定义如下:

25、

26、其中,是k近邻图矩阵的第i行第j列的元素,i和j分别表示k近邻图上的两个结点;是结点i的k-邻域,由距离结点i最近的k个结点组成;若结点i和结点j之间存在一条边,则否则

27、进一步地,所述视角v的高维流形分布矩阵的定义如下:

28、

29、

30、其中,分别是存在样本i、j、l、k的特征向量;是样本i的高斯核宽度,由困惑度参数ppl决定。表示表示在高维空间中样本i为样本j邻居的概率;是流形分布矩阵pv第i行第j列的元素,表示样本i和样本j在高维空间中一方为另一方邻居的概率;‖·‖f表示矩阵的f范数。矩阵描述了在高维空间中样本的流形分布情况,所以称为高维流形分布矩阵。

31、进一步地,所述网络预测完备样本伪标签的损失函数定义如下:

32、

33、其中,是带掩码的交叉熵分类损失函数,是完备样本的伪标签,是网络预测的类簇概率分布;是完备样本集合,表示取出网络预测的类簇概率分布中与完备样本集合相对应的部分;np是完备样本数,nc是类簇数。

34、进一步地,所述网络的流形正则化约束项定义如下:

35、

36、其中,qv是视角v的低维流形分布矩阵,其定义如下:

37、

38、其中,分别是网络所学表示h对应视角v存在样本i、j、l、k的表示向量;是矩阵qv第i行第j列的元素,代表样本i和样本j在低维空间中一方为另一方邻居的概率。qv描述了在低维空间中样本的流形分布情况,所以称为低维流形分布矩阵。

39、进一步地,所述基于伪标签引导的流形正则化总体损失函数由带掩码的交叉熵分类损失函数和流形正则化约束项组成,其定义如下:

40、

41、其中,λ>0是权衡参数,是基于伪标签引导的流形正则化总体损失函数。

42、进一步地,所述使用随机梯度下降算法最小化所述基于伪标签引导的流形正则化总体损失函数将所述分类网络训练至收敛。网络权重的更新规则如下所示:

43、

44、其中,θ是所述分类网络的权重,α是学习率,是所述总体损失函数关于网络权重θ的偏导数。反复应用上述更新规则,直到所述总体损失函数的值收敛。然后对收敛后网络的所学表示h进行k均值聚类,获得最终聚类结果。

45、进一步地,根据所得聚类结果,计算所述非完备多视角遥感图像数据集上的聚类准确率。

46、本专利技术提供了一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,具有以下优势:

47、(1)所述方法采用了多视角聚类框架,充分利用了多视角遥感图像数据的视角一致性和视角差异性信息,能有效挖掘数据的潜在类簇结构。

48、(2)所述方法采用了伪标签技术,使用从完备样本集合中学到的伪标签来指导聚类过程,使模型能充分利用有标记数据和无标记数据,从而取得更好的聚类性能。

49、(3)所述方法采用了本文档来自技高网...

【技术保护点】

1.一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,所述方法包括步骤:

2.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,从数据集中提取完备样本集合和存在样本集合。完备样本集合和存在样本集合的定义如下:

3.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,构建一个多视角图卷积特征融合分类网络,并随机初始化网络权重。所述分类网络的组成如下:多个视角专属图卷积编码层、一个特征融合层、以及一个线性分类层。每个视角专属图卷积编码层由两个图卷积模块组成:

4.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,对存在样本的每一视角分别构建k近邻图矩阵和高维流形分布矩阵。视角v的k近邻图矩阵的定义如下:

5.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,将存在样本的不同视角特征和相应的k近邻图矩阵输入分类网络,使其预测完备样本的伪标签同时对网络所学表示H施加流形正则化约束。网络预测完备样本伪标签的损失函数定义如下:

6.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,使用随机梯度下降算法最小化所述基于伪标签引导的流形正则化总体损失函数将所述分类网络训练至收敛。网络权重的更新规则如下所示:

7.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,根据所得聚类结果,计算所述非完备多视角遥感图像数据集上的聚类准确率。

...

【技术特征摘要】

1.一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,所述方法包括步骤:

2.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,从数据集中提取完备样本集合和存在样本集合。完备样本集合和存在样本集合的定义如下:

3.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,构建一个多视角图卷积特征融合分类网络,并随机初始化网络权重。所述分类网络的组成如下:多个视角专属图卷积编码层、一个特征融合层、以及一个线性分类层。每个视角专属图卷积编码层由两个图卷积模块组成:

4.根据权利要求1所述的基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法,其特征在于,对存在样本的每一视角分别构建k近邻图矩...

【专利技术属性】
技术研发人员:李骜徐欣雅许浩越冯聪
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1