System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于图对比学习的城市异构实体联合表征学习方法技术_技高网

基于图对比学习的城市异构实体联合表征学习方法技术

技术编号:41322556 阅读:5 留言:0更新日期:2024-05-13 15:01
本发明专利技术公开了基于图对比学习的城市异构实体联合表征学习方法。通过多视角单实体图的构造可以更全面真实地建模同一种实体间的联系。异构地理实体图的构建,异构地理实体图编码器表征和四种对比学习任务让的模型可以有效捕获两种地图实体之间复杂的相互关系,从而提升了两种实体表征的性能。的模型生成得到的表征在路段相关下游任务,区域相关下游任务和轨迹相关下游任务上都取得了比当前模型优秀的结果。

【技术实现步骤摘要】

本专利技术涉及城市时空数据挖掘,更具体的说是涉及基于图对比学习的城市异构实体联合表征学习方法


技术介绍

1、电子地图作为地理信息系统的关键数据,在城市管理,智慧交通等方面扮演者重要的角色。电子地图一般包含三种类型的地理实体,分别为兴趣点,路段和区域。为了尽可能挖掘电子地图中的有效信息并用于多种任务,研究者开发了多种时空表征学习方法来从电子地图中提取信息并将地理实体转换为表征向量来应用于下游任务。

2、但是,现有的时空表征学习方法都只关注于某一特定类别的地理实体,这对于现实世界中基于地图的多实体综合应用是不够的。而且这样也无法捕捉到不同类型实体之间潜在的结构信息和语义信息的关系。此外,为不同类型的实体采用不同的表征学习方法无法保证多种实体表征的一致性。

3、因此,如何同时学习多种地理实体的表征,准确捕捉异构实体间的关系是本领域技术人员亟需解决的问题。


技术实现思路

1、有鉴于此,本专利技术提供了基于图对比学习的城市异构实体联合表征学习方法。

2、为了实现上述目的,本专利技术采用如下技术方案:

3、基于图对比学习的城市异构实体联合表征学习方法,包括以下步骤:

4、根据多种视角构造每个地理实体的单实体图,所述地理实体包括区域交通实体和路段交通实体;

5、将每个地理实体的单实体图作为输入构建异构地理实体图;

6、构建所述异构地理实体图的编码器,所述编码器用于提取所述异构地理实体图的结构信息和语义信息,并将所述异构地理实体图中的节点转化为固定维数的表征向量;

7、利用自监督的图对比学习任务对所述编码器的参数进行训练;

8、利用训练好的编码器进行城市异构实体联合表征学习。

9、进一步地,根据多种视角构造每个地理实体的单实体图,具体包括:

10、分别从地理视角、功能视角和人口移动性视角三种视角构造每个地理实体的单实体图。

11、进一步地,将每个地理实体的单实体图作为输入构建异构地理实体图,具体包括,

12、以区域交通实体的单实体图和路段交通实体的单实体图作为输入;

13、整合两种交通实体内定义的三种视角的实体内关系,生成包括以两种交通实体为节点,以两种交通实体间关系和每一种交通实体内三种视角的实体内关系为边的异构地理实体图。

14、进一步地,构建所述异构地理实体图的编码器,具体包括,

15、构建路段-区域原始特征编码器,所述路段-区域原始特征编码器用于将路段和区域的原始特征编码成原始特征向量;

16、利用形状注意力机制对所述原始特征向量进行数据增强,获取所述原始特征向量增强后的路段-区域联合编码;

17、将所述路段-区域联合编码输入异构图transformer生成多种实体的表征向量。

18、进一步地,将路段和区域的原始特征编码成原始特征向量,具体包括:

19、提取区域和路段两种交通实体内的原始特征,将所述原始特征分为离散特征和连续特征;

20、针对离散特征,进行独热编码,获取离散特征的独热编码向量;

21、针对连续特征,将整个取值范围分成若干范围相同的小区域,并将连续的特征取值映射到若干范围相同的小区域,获取连续特征的独热编码向量;

22、将离散特征的独热编码向量和连续特征的独热编码向量进行拼接后通过一个多层感知机得到编码后的原始特征向量。

23、进一步地,利用形状注意力机制对所述原始特征向量进行数据增强,具体包括,

24、计算异构地理实体图中用于描述第j个路段sj和第i个区域ri之间相关性强弱的注意力分数attij,计算公式如下:

25、其中,

26、式中sj′表示第j′个路段,αij和αij′均表示中间变量,wa1,wl,wd为可训练的参数,与分别为区域ri和路段sj的原始特征向量,lij表示第j个路段sj到第i个区域ri的中心点的距离,dij表示第i个区域ri的中心点到第j条路段sj的中心点的方向角,d是表征向量的维数;

27、根据所述注意力分数对区域周围的路段进行特征聚合,得到了最终的区域特征向量。

28、进一步地,根据所述注意力分数对区域周围的路段进行特征聚合,具体包括以下聚合公式,其中代表了属于第i个区域ri的所有路段,attij代表了区域ri和路段sj的注意力分数,表示路段sj的原始特征向量,表示可学习的参数,根据聚合公式得到区域的特征向量为其中表示可学习的参数,表示区域ri的原始特征向量。

29、进一步地,将所述路段-区域联合编码输入异构图transformer生成多种实体的表征向量,具体包括:

30、将异构地理实体图中的节点类型记为φ(vi),将异构地理实体图中的边类型记为ψ(eij);

31、使用节点编码器fn(v)和边编码器fe(e)对所述异构地理实体图中的节点和边进行编码:

32、

33、

34、其中下标n表示节点编码器符号,下标e表示边编码器符号,表示可学习的参数,表示第i个节点vi的输入特征;fn(vi)表示编码后的节点;fe(eij)表示编码后的边;eij表示第i个节点和第j个节点之间的边;

35、引入点积注意力机制对节点周围的边向量进行聚合得到最终的节点表征向量。

36、进一步地,引入点积注意力机制对节点周围的边向量进行聚合,具体包括:

37、映射节点编码器的结果作为注意力计算的查询q,映射边编码器的结果作为注意力计算的键k和值v:

38、

39、

40、其中wq,wk,wv是可学习的参数,表示节点vi编码后的查询,表示边eij编码后的键,表示边eij编码后的值;

41、注意力分数计算为其中d′是节点向量和边向量的维数,ni是节点i的邻居节点;表示第i个节点和第j′个节点之间边eij′编码后的键值;

42、根据注意力分数对节点周围的边向量进行聚合得到最终的节点表征向量

43、进一步地,利用自监督的图对比学习任务对所述异构地理实体图的编码器的参数进行训练,具体包括以下步骤:

44、将路段实体中的任一路段进行基于边的数据增强以及基于节点特征的数据增强后的结果作为正样本;

45、将路段实体中除该路段之外的其他路段进行数据增强后的结果作为负样本;

46、路段的实体内对比学习损失函数为:

47、

48、其中指的是基于边的数据增强后得到的第i条路段si并投影后的表征向量,指的是基于节点特征的数据增强后得到的第i条路段si并投影后的表征向量,τ是温度系数;

49、将区域实体中的任一区域进行基于边的数据增强以及基于节点特征的数据增强后的结果作为正样本;

50、将区域实体中除该区域之外的其他区域进行任意数据增强后的结果本文档来自技高网...

【技术保护点】

1.基于图对比学习的城市异构实体联合表征学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,根据多种视角构造每个地理实体的单实体图,具体包括:

3.根据权利要求2所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,将每个地理实体的单实体图作为输入构建异构地理实体图,具体包括,

4.根据权利要求1所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,构建所述异构地理实体图的编码器,具体包括,

5.根据权利要求4所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,将路段和区域的原始特征编码成原始特征向量,具体包括:

6.根据权利要求4所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,利用形状注意力机制对所述原始特征向量进行数据增强,具体包括,

7.根据权利要求6所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,根据所述注意力分数对区域周围的路段进行特征聚合,具体包括以下聚合公式,其中代表了属于第i个区域ri的所有路段,ATTij代表了区域ri和路段sj的注意力分数,表示路段sj的原始特征向量,表示可学习的参数,根据聚合公式得到区域的特征向量为其中表示可学习的参数,表示区域ri的原始特征向量。

8.根据权利要求4所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,将所述路段-区域联合编码输入异构图Transformer生成多种实体的表征向量,具体包括:

9.根据权利要求8所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,引入点积注意力机制对节点周围的边向量进行聚合,具体包括:

10.根据权利要求7所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,利用自监督的图对比学习任务对所述异构地理实体图的编码器的参数进行训练,具体包括以下步骤:

...

【技术特征摘要】

1.基于图对比学习的城市异构实体联合表征学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,根据多种视角构造每个地理实体的单实体图,具体包括:

3.根据权利要求2所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,将每个地理实体的单实体图作为输入构建异构地理实体图,具体包括,

4.根据权利要求1所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,构建所述异构地理实体图的编码器,具体包括,

5.根据权利要求4所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,将路段和区域的原始特征编码成原始特征向量,具体包括:

6.根据权利要求4所述的基于图对比学习的城市异构实体联合表征学习方法,其特征在于,利用形状注意力机制对所述原始特征向量进行数据增强,具体包括,

7.根据权利要求6所述的基于...

【专利技术属性】
技术研发人员:王静远杨宜凡姜佳伟
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1