基于Siamese网络的空间数据检索方法、装置、设备及存储介质制造方法及图纸

技术编号:38871182 阅读:14 留言:0更新日期:2023-09-22 14:07
本发明专利技术提供了一种基于Siamese网络的空间数据检索方法、装置、设备及存储介质。包括获取相关空间数据,对空间数据进行预处理,以图数据结构特征存储对应数据所蕴含的空间信息;将空间数据的属性信息存储于图数据中的节点特征中以增强节点的语义特征表示;并将空间数据间的空间关系信息存储于图数据中的边特征中以增强图数据的空间关系特征,使得增强后的空间图数据结构更符合人为进行空间数据检索时的定性思考的思维模式。之后通过构建对应的Siamese网络框架,保证在训练模型时可以用到最少的样本信息以及共享权重,并结合图卷积神经网络的信息传递优势学习空间数据的空间结构。在兼顾空间数据属性特征以及空间关系特征的前提下实现空间数据的检索与查询。的前提下实现空间数据的检索与查询。的前提下实现空间数据的检索与查询。

【技术实现步骤摘要】
基于Siamese网络的空间数据检索方法、装置、设备及存储介质


[0001]本专利技术属于地理信息领域中的空间数据检索
,特别涉及一种基于Siamese网络的空间数据检索方法、装置、设备及存储介质。

技术介绍

[0002]随着地理信息技术的迅猛发展,在空间数据的获取速率呈指数级增长的今天,研究如何实现空间数据的有效利用就显得尤为重要。其中,由于空间场景可以综合表达空间数据的特征,进行空间场景相似性的研究不仅在空间数据检索中具有草图匹配的实际应用需求,对于挖掘海量数据的潜在信息也具有重大的应用价值。
[0003]基于空间场景内实体相似性的研究表明除开具体的概念信息外,空间场景内的对象及对应的空间关系对空间场景的查询精度具有重要影响。如使用基于草图绘制、样例匹配等更具体,更直观的方式进行查询可能会更加符合我们认知事物的方式,从而也更有利于进行对应的空间数据、空间场景的精确检索。因此开展空间场景相似性计算方法的研究不仅对于场景中复杂的空间关系特征如形状、大小、方位、拓扑等关系都会有更直观、更精确以及更形象的描述,并且可以增加相似空间场景的查询准确率从而更好的服务于空间数据查询与检索,最终实现空间场景的相似性查询由专业人员向普通用户的过渡。
[0004]然而,现有的解决方案不足以支持空间场景相似性的评估,并且在使用上存在较大的局限性,如何对蕴含信息各异的空间场景进行合理的相似性评估成为了当前亟待解决的问题。

技术实现思路

[0005]本专利技术的目的就是为了解决上述
技术介绍
存在的不足,本专利技术采取的技术方案是:提供了一种基于Siamese网络的空间数据检索方法、装置、设备及存储介质。
[0006]根据本专利技术的第一方面,一种基于Siamese网络的空间数据检索方法,包括以下步骤:
[0007]S1:获取待查询空间数据的样例数据或数据库样例数据,并对数据进行预处理;
[0008]S2:对预处理后的数据构建空间场景图,通过图数据结构特征存储对应空间数据所蕴含的空间信息,将空间数据的属性信息存储于图数据中的节点特征中,并将空间数据间的空间关系信息存储于图数据中的边特征中;
[0009]S3:使用Siamese网络框架搭建空间场景整体相似性度量训练模型,将空间场景图作为训练模型的输入数据样本,利用两个共享权值的子网络作为训练模型,从而根据子网络的训练得出输入数据样本是否相似或者是否具有相同的分类得分;
[0010]S4:根据训练模型中成对相似的样本特征建立相应的损失函数,通过损失函数对训练模型进行约束优化,得到训练好的模型;
[0011]S5:根据训练好的模型构建空间场景整体相似性度量预测模型,将待查询的空间
场景数据和数据库空间场景数据输入预测模型,经过训练好的预测模型输出空间场景间的相似度距离,进而查询出最相似的空间场景数据。
[0012]进一步地,上述步骤S1中具体包括以下步骤:
[0013]S1.1:获取待查询空间数据的样例数据或者数据库样例数据,并对数据进行预处理,包括:统一空间坐标系使得空间数据处于同一个参考系内,将数据格式进行统一,对数据中的冗余数据进行处理,进行拓扑关系检查;
[0014]S1.2:对查询相关区域的线实体进行增强处理,删除冗余线,同时提取相关线实体的中心线并进行数据增强,并依据处理完的线数据对相关查询区域进行空间场景划分以得到便于操作的空间场景数据;
[0015]S1.3:对上述空间场景数据进行拓扑检查操作,得到预处理后的数据。
[0016]进一步地,上述步骤S2中,构建空间场景图的过程包括:
[0017]S2.1:依据ArcGIS软件中的模型功能批量裁剪依据线实体划分的空间场景区域,分别将待查询数据的空间场景与数据库空间场景的区域分别命名保存;
[0018]S2.2:对上述空间场景区域使用Python自动编译器分别处理,提取每个场景区域中的空间实体的具体属性信息,包括空间实体的大小信息、形状信息、方向信息、密度信息,并将这些信息以向量的形式进行存储,作为图数据结构中的节点特征信息表示;
[0019]S2.3:利用Delanuay三角网法对上述空间场景区域进行图结构的绘制以表征空间实体间的空间关系分布信息,将可以表征实体间位置情况的信息作为边特征存储于图数据结构的边特征中以增强图结构的信息表示;
[0020]S2.4:对上述使用Delanuay三角网法进行构图的操作进行整合以获得每个空间场景区域的空间场景图数据结构,用以作为训练模型的输入数据并统一输入数据的数据格式。
[0021]进一步地,上述步骤S3中,使用Siamese网络框架搭建空间场景整体相似性度量训练模型,包括以下步骤:
[0022]S3.1:依据Siamese网络特性,选择孪生网络G
W
(X1)与G
W
(X2)作为网络框架的训练模型,该训练模型共享同一个训练权值W;
[0023]S3.2:根据空间场景图数据结构的特点,选择图卷积神经网络作为对应的孪生网络,实现传递空间场景图结构节点与空间关系所具有的相关信息;
[0024]S3.3:将S2中处理好的空间场景数据作为Siamese网络框架的输入样本,送入构建的训练模型中进行训练,其中训练层由两个权重共享的图卷积神经网络所组成,通过图卷积网络的训练将初始的场景图信息进行节点特征间的信息传递与聚合,以更新对应的场景图节点信息,并生成表征对应场景图的相关向量表示;
[0025]S3.4:依据相关向量表示,经过Siamese网络框架的不断训练继而获得待查询空间场景数据与目标空间场景数据之间的相似度距离并输出最终结果。
[0026]更进一步地,S3.3具体包括:
[0027]记节点特征其中v∈V指代节点集合;训练模型在第l层学习到的节点v的隐藏特征用d
i
代表输入特征的维数,d
h
代表隐藏特征的维数,表示节点特征;在图卷积神经网络中,GNN第l层(l=1...k)对每个节点v∈V同时更新在形式上可
以表现为
[0028][0029][0030]其中为节点v在第l次/层处迭代的特征向量;AGGREGATE及COMBINE表示图卷积神经网络的聚合操作,节点的邻域N(v)={u∈V|(v,u∈E)}是节点v的邻域集合;
[0031]在图卷积网络GCN中,池化层采用的是基于元素的均值池化步骤,并将AGGREGATE和COMBINE步骤集成如下:
[0032][0033]式中W指代可学习矩阵,COMBINE步骤可以是一个连接,然后是一个线性映射而在GraphSAGE的池化变体中,AGGREGATE被表述为:
[0034][0035]其中,MAX表示取最大值,ReLU代表激活函数,W表示权重;在GNN中通过READOUT函数聚合最后迭代的节点特征,从而获得整个图的相关向量表示h
G

[0036]进一步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Siamese网络的空间数据检索方法,其特征在于,包括以下步骤:S1:获取待查询空间数据的样例数据或数据库样例数据,并对数据进行预处理;S2:对预处理后的数据构建空间场景图,通过图数据结构特征存储对应空间数据所蕴含的空间信息,将空间数据的属性信息存储于图数据中的节点特征中,并将空间数据间的空间关系信息存储于图数据中的边特征中;S3:使用Siamese网络框架搭建空间场景整体相似性度量训练模型,将空间场景图作为训练模型的输入数据样本,利用两个共享权值的子网络作为训练模型,从而根据子网络的训练得出输入数据样本是否相似或者是否具有相同的分类得分;S4:根据训练模型中成对相似的样本特征建立相应的损失函数,通过损失函数对训练模型进行约束优化,得到训练好的模型;S5:根据训练好的模型构建空间场景整体相似性度量预测模型,将待查询的空间场景数据和数据库空间场景数据输入预测模型,经过训练好的预测模型输出空间场景间的相似度距离,进而查询出最相似的空间场景数据。2.根据权利要求1所述的一种基于Siamese网络的空间数据检索方法,其特征在于:上述步骤S1中具体包括以下步骤:S1.1:获取待查询空间数据的样例数据或者数据库样例数据,并对数据进行预处理,包括:统一空间坐标系使得空间数据处于同一个参考系内,将数据格式进行统一,对数据中的冗余数据进行处理,进行拓扑关系检查;S1.2:对查询相关区域的线实体进行增强处理,删除冗余线,同时提取相关线实体的中心线并进行数据增强,并依据处理完的线数据对相关查询区域进行空间场景划分以得到便于操作的空间场景数据;S1.3:对上述空间场景数据进行拓扑检查操作,得到预处理后的数据。3.根据权利要求1所述的一种基于Siamese网络的空间数据检索方法,其特征在于:上述步骤S2中,构建空间场景图的过程包括:S2.1:依据ArcGIS软件中的模型功能批量裁剪依据线实体划分的空间场景区域,分别将待查询数据的空间场景与数据库空间场景的区域分别命名保存;S2.2:对上述空间场景区域使用Python自动编译器分别处理,提取每个场景区域中的空间实体的具体属性信息,包括空间实体的大小信息、形状信息、方向信息、密度信息,并将这些信息以向量的形式进行存储,作为图数据结构中的节点特征信息表示;S2.3:利用Delanuay三角网法对上述空间场景区域进行图结构的绘制以表征空间实体间的空间关系分布信息,将可以表征实体间位置情况的信息作为边特征存储于图数据结构的边特征中以增强图结构的信息表示;S2.4:对上述使用Delanuay三角网法进行构图的操作进行整合以获得每个空间场景区域的空间场景图数据结构,用以作为训练模型的输入数据并统一输入数据的数据格式。4.根据权利要求1所述的一种基于Siamese网络的空间数据检索方法,其特征在于:上述步骤S3中,使用Siamese网络框架搭建空间场景整体相似性度量训练模型,包括以下步骤:S3.1:依据Siamese网络特性,选择孪生网络G
W
(X1)与G
W
(X2)作为网络框架的训练模型,该训练模型共享同一个训练权值W;
S3.2:根据空间场景图数据结构的特点,选择图卷积神经网络作为对应的孪生网络,实现传递空间场景图结构节点与空间关系所具有的相关信息;S3.3:将S2中处理好的空间场景数据作为Siamese网络框架的输入样本,送入构建的训练模型中进行训练,其中训练层由两个权重共享的图卷积神经网络所组成,通过图卷积网络的训练将初始的场景图信息进行节点特征间的信息传递与聚合,以更新对应的场景图节点信息,并生成表征对应场景图的相关向量表示;S3.4:依据相关向量表示,经过Siamese网络框架的不断训练继而获得待查询空间场景数据与目标空间场景数据之间的相似度距离并输出最终结果。5.根据权利要求4所...

【专利技术属性】
技术研发人员:徐永洋徐天健谢雪景谢忠
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1