System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() SubGNN注入空间特征的地理知识图谱表示学习方法技术_技高网

SubGNN注入空间特征的地理知识图谱表示学习方法技术

技术编号:40657179 阅读:11 留言:0更新日期:2024-03-13 21:34
本发明专利技术公开了一种SubGNN注入空间特征的地理知识图谱表示学习方法,包括通过地理实体的唯一标识符,链接地理实体的空间数据,将点、线和面地理实体统一表达为无向图中的子图;采用子图神经网络进行位置、邻居、结构空间信息特征编码,获得地理实体基于空间特征的向量表示;结合图谱本身结构的向量表示,改进融合地理空间特征向量的能量函数,在平移模型的框架下进行学习,最终得到融合空间特征的知识图谱向量表示。本申请设计了一种注入地理空间特征的知识表示学习模型,提升了地理空间知识向量表示的准确性,提高了地理知识链接预测任务的性能,从而更好服务于地理空间知识图谱的知识补全和知识推理等应用。

【技术实现步骤摘要】

本专利技术涉及地理空间知识图谱表示学习领域,具体涉及一种基于subgnn注入空间特征的地理知识图谱表示学习方法。


技术介绍

1、地理空间知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统,能够提供系统的、深层次的结构化地理知识,地理知识图谱能智能在语义搜索、地理知识智能问答、知识挖掘与决策分析等更好地为人认知地理世界服务。

2、知识图谱中的知识表示学习任务是指将知识图谱中符号表示转化为低维稠密的向量表示,使得语义相似的两个实体在向量空间中的距离也相近,可有效缓解数据稀疏性带来的问题,提高机器的计算效率,为知识表示学习的下游任务如地理空间知识推理,地理空间知识问答等提供重要技术支撑。

3、融合多源信息的知识表示学习模型是提升表示性能的研究方向之一,尽管地理知识空间知识图谱中地理实体蕴含丰富的地理空间信息,但知识表示学习应用于地理知识图谱时表现不佳,目前面向地理知识的表示学习模型研究存在以下主要问题:

4、(1)缺乏点线面一体化的空间特征向量生成方法。以往的空间特征向量生成多基于点位置编码生成,其过程是在进行研究时先将多种类型实体抽象为点类型要素,再设计位置编码器得到点位置的向量表示,不能实现点、线、面一体化的空间特征向量生成。

5、(2)缺乏融入地理空间特征的知识表示学习研究。地理空间数据中包含丰富的空间信息,目前的研究多集中于提取实体间的距离信息,并取得了一系列进展,但关于空间结构和拓扑关系的研究较少,并且如何将提取到的空间信息融入到知识表示学习模型中也少有涉及。因此,需要深入研究如何提取地理实体的空间特性信息,并根据得到的空间信息融入地理知识图谱表示学习模型。


技术实现思路

1、本专利技术的目的在于提出一种融合地理实体空间信息的知识表示学习方法,以实现知识表示学习性能提升,提高计算效率,从而推动大规模地理知识库在更多的领域获得广泛而有效的应用。

2、为实现上述目的,本专利技术提供subgnn注入空间特征的地理知识图谱表示学习方法,其特征在于,包括如下步骤:

3、一种subgnn注入空间特征的地理知识图谱表示学习方法,其特征在于,所述方法包括如下步骤:

4、s1:抓取地理空间知识图谱中地理实体的矢量数据,作为获得地理实体的空间特征向量表示的基础数据;

5、s2:设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式;

6、s3:提出基于子图神经网络(subgraph neural network, subgnn)的地理空间特征编码器,结合地理实体的位置、邻居与结构特征,获得地理实体基于空间特征的向量表示;

7、s4:基于平移模型(translating embeddings,transe),设计融合地理实体空间特征表示的能量函数,将基于地理实体的空间特征和基于图谱本身结构特征的两种向量表示学习到同一个连续向量空间;

8、对比本申请所提出的注入空间特征的地理知识图谱表示学习方法与已有经典表示方法,结果表明本申请所提出方法在链接预测任务上的精度更高。

9、其中,所述步骤s1中,抓取地理空间知识图谱中地理实体的矢量数据,具体是指通过地理实体唯一标识符从openstreetmap中连接实体的几何坐标信息。

10、其中,所述步骤s2中,设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式,具体是指通过将原本矢量的数据,转化为节点与边的形式,以便进一步计算,其中点实体的空间数据通过图结构化后将为单个节点组成的子图,线实体的空间数据通过图结构化后将为多个节点与边相连形成的子图,面实体通过图结构化后将为首尾相连的多个节点所包围的所有节点和边组合而成的子图。

11、其中,所述步骤s3中子图神经网络(subgnn)空间特征编码器具体是指,挖掘图结构上子图内部与子图间的位置、邻居和结构3种空间特征,通过空间特征消息传递框架,在每个空间特征通道中设置采样点,捕获的空间特性从采样点出发,并由特定的相似性函数加权,传播到子图,最终训练得到子图的向量表示,即获得地理实体基于空间特征的向量表示,每一种空间特征的传递函数与相似性函数定义如下:

12、,

13、,

14、,

15、,

16、其中下标代表的空间特征通道,包括位置通道、邻居通道和结构通道;代表子图集合,是空间特征通道的采样点,是空间特征通道采样点通过编码生成的向量,代表空间特征通道的传递函数;代表空间特征通道的传递函数,其中位置通道特性通过子图到采样点的最短路径反映,代表子图到采样点的平均的最短距离;邻居通道相似度设定为1;结构通道特性通过子图与采样点有序度序列反映,和分别代表子图和采样点的有序度序列,代表动态时间规整函数。

17、将空间特征的消息转换为顺序不变的隐藏表示和属性感知的向量表示,如下:

18、,

19、,

20、,

21、其中是聚合空间特征通道中所有采样点的空间特性消息的隐藏表示,是对消息进行操作的聚合函数,代表空间特征通道中采样点的数量,为空间特性的传递函数序号,表示关于空间特征通道的子图表示,其携带了空间特性消息的隐藏表示和前一层的表示的特性,代表网络层,是空间特征通道的逐层可学习的权重矩阵,是非线性激活函数,为属性感知的向量表示,是采样点的消息矩阵,由消息传递函数生成,

22、最终聚合不同空间特征通道和不同网络层的子图表示,转化为最终的子图表示:

23、,

24、,

25、其中代表第层的属性感知向量,表示通道聚合函数,表示网络层聚合函数,表示子图的最终表示,也即地理实体基于空间特征的向量表示。

26、其中,所述步骤s4中,平移模型(transe)中,三元组内部实体与关系向量之间具有的关系,其中的是头实体的向量表示,是关系的向量表示,是尾实体的向量表示,用统一表示实体的向量表示,在该假设下有能量函数为:

27、,

28、其中是仅基于图谱本身的结构信息的头实体和尾实体向量表示,融合地理实体基于空间特征的向量表示,设计的能量函数为:

29、,

30、其中是控制各项权值的超参数,是基于空间特征的头实体和尾实体的向量表示,部分实际上与平移模型中的能量函数一致,,和是加入了基于空间特征的实体向量影响的混合项。通过混合项的限制,将实体的两种向量映射到同一语义空间,共享相同的关系向量,最终将获得实体的向量表示,关系的向量表示。

31、其中,对比本申请所提出的注入空间特征的地理知识图谱表示学习方法与已有表示方法,对比的方法包括平移模型(translating embeddings,transe)、超平面平移模型(translating on hyper本文档来自技高网...

【技术保护点】

1.一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征:所述步骤S1中,获取地理空间知识图谱中地理实体的矢量数据,具体是指通过地理实体唯一标识符从OpenStreetMap中链接地理实体的几何坐标信息。

3.根据权利要求1所述的一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征:所述步骤S2中,设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式,具体是指通过将原本矢量的数据,转化为节点与边的图结构形式,其中点实体通过无向图结构化后将为单个节点组成的子图,线实体通过图结构化后将为多个节点与边相连形成的子图,面实体通过图结构化后将为首尾相连的多个节点所包围的所有节点和边组合而成的子图。

4.根据权利要求1所述的一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征:所述步骤S3中子图神经网络空间特征编码器具体是指,挖掘图结构上子图内部与子图间的位置、邻居和结构3种空间特征,通过空间特征消息传递框架,在每个空间特征通道中设置采样点,捕获的空间特性从采样点出发,并由特定的相似性函数加权,传播到子图,最终训练得到子图的向量表示,即获得地理实体基于空间特征的向量表示,每一种空间特征的传递函数与相似性函数定义如下:

5.根据权利要求1所述的一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征:所述步骤S4中,平移模型中,三元组内部实体与关系向量之间具有的关系,其中的是头实体的向量表示,是关系的向量表示,是尾实体的向量表示,用统一表示实体的向量表示,能量函数为:

...

【技术特征摘要】

1.一种subgnn注入空间特征的地理知识图谱表示学习方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的一种subgnn注入空间特征的地理知识图谱表示学习方法,其特征:所述步骤s1中,获取地理空间知识图谱中地理实体的矢量数据,具体是指通过地理实体唯一标识符从openstreetmap中链接地理实体的几何坐标信息。

3.根据权利要求1所述的一种subgnn注入空间特征的地理知识图谱表示学习方法,其特征:所述步骤s2中,设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式,具体是指通过将原本矢量的数据,转化为节点与边的图结构形式,其中点实体通过无向图结构化后将为单个节点组成的子图,线实体通过图结构化后将为多个节点与边相连形成的子图,面实体通过图结构化后将为首尾相...

【专利技术属性】
技术研发人员:曹敏羊勇全郭雅琪王小川孔德辉
申请(专利权)人:南京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1