一种基于频繁模式挖掘的边缘缓存知识图谱划分方法技术

技术编号:35098708 阅读:10 留言:0更新日期:2022-10-01 17:03
本发明专利技术提供了一种基于频繁模式挖掘的边缘缓存知识图谱划分方法,属于数据处理技术领域。本发明专利技术利用查询图中挖掘出的频繁查询模式,对初始知识图谱进行着色,通过改进交换算法将知识图谱划分成不同颜色区域,使划分后的知识图谱在满足最小切割边的同时符合边缘缓存大小。在用户下一次访问时,可以快速响应出周围所需服务场景的信息,实现接近最优的缓存性能。本发明专利技术将知识图谱合理部署到边缘服务器中,使得周围用户可以快速获取所需信息,大大减少了从云端获取数据的回程压力,为用户提供更好的交互体验。更好的交互体验。更好的交互体验。

【技术实现步骤摘要】
一种基于频繁模式挖掘的边缘缓存知识图谱划分方法


[0001]本专利技术属于数据处理
,涉及一种基于频繁模式挖掘的边缘缓存知识图谱划分方法,在用户下一次访问时,可以快速响应出周围所需服务场景的信息,实现接近最优的缓存性能。

技术介绍

[0002]随着大数据与人工智能技术的飞速发展,知识图谱凭借其强大的语义处理和开放互联能力,打破不同场景下的数据隔离,为用户提供更好的交互体验。但是,当用户请求周边服务信息(医疗、教育、政府、商城等)时,大规模的知识图谱将给回程网络带来巨大压力,从而降低用户体验质量。并且城市场景下用户查询十分频繁,如何在临近的边缘服务器中快速响应频繁查询请求是很具有挑战性的。移动边缘缓存允许应用供应商在分布式边缘服务器上部署其应用程序和相关数据,为附近的用户提供服务。热门内容可以缓存到距离移动用户很近的网络边缘,用户无需通过回程和核心网多跳传输后从云中心获取请求内容,而是通过单跳无线传输获取请求内容,大大降低了端到端延迟。因此,通过使用移动边缘缓存在分布式边缘服务器上部署知识图谱是必不可少的。
[0003]现有的知识图谱划分算法通常使用最小切割边或点以及考虑分区是否平衡作为目标函数,不关注同一分区的内容是否相关,同时没有考虑到边缘服务器缓存容量的差异,在实际应用场景下,无法将知识图谱合理地分布式部署到边缘服务器中,同时满足跨分区边数目最小化且有效提高知识图谱查询处理性能。
[0004]基于此,本专利技术利用频繁查询模式中获取的热点信息,将初始知识图谱划分成不同区域,并且满足当前服务器缓存容量,在用户下一次访问时,可以快速响应出周围所需服务场景的信息,实现接近最优的缓存性能。

技术实现思路

[0005]为了解决如何在边缘服务器中合理地部署大规模知识图谱,本专利技术提供了一种基于频繁模式挖掘的边缘缓存知识图谱划分方法,该方法结合频繁模式挖掘模式获取的热点信息,对初始知识图谱进行着色,通过改进的交换算法将知识图谱划分成不同颜色区域,最终在满足最小切割边的同时适合边缘服务器缓存大小的前提下,将知识图谱热点内容部署在临近边缘服务器中。
[0006]本专利技术的技术方案:
[0007]一种基于频繁模式挖掘的边缘缓存知识图谱划分方法,包括以下步骤:
[0008]步骤一:边缘服务器根据历史查询生成查询图G
Q
={V
Q
,E
Q
,LE
Q
,LV
Q
},其中V
Q
代表点集;E
Q
代表边集;LE
Q
是边标签,表示频繁程度;LV
Q
是点标签,表示类别属性。
[0009]步骤二:基于查询图G
Q
进行频繁查询模式挖掘,挖掘出频繁查询模式,查询模式定义为P={V
P
,E
P
,LE
P
,LV
P
},其中V
P
代表查询模式点集;E
P
代表查询模式边集;LE
P
是查询模式边标签,其中边标签都为空;LV
P
是查询模式点标签,表示类别属性,并且查询模式中没有重
复的点标签,更加关注不同类别实体间的联系。
[0010]步骤三:基于频繁查询模式对知识图谱进行初始着色,将属于频繁查询模式上的点固定为所属边缘服务器包括的颜色,根据边缘缓存容量的阈值随机初始化其他节点的颜色,然后应用启发式局部搜索进行多路划分,并将知识图谱推向低能状态(最小切割边)。
[0011]步骤四:根据不同颜色的分区将知识图谱划分到所属的边缘服务器上,若当前服务器中的由频繁查询模式扩展出的知识图谱是非连通图,则将根据频繁查询模式中节点的连接在知识图谱中的两个节点之间建立一条有向边,并用当前服务器名称命名有向边。
[0012]所述步骤二中,频繁查询模式挖掘的具体步骤如下:
[0013]步骤2.1:初始化结果集和候选集为空,将查询图G
Q
中所有频繁边置于频繁边集中。
[0014]步骤2.2:计算所有频繁边的路径图,并将所有频繁边生成的路径图并入候选集中。
[0015]步骤2.3:频繁边e产生的查询模式为p,将查询模式p放入空栈S中,循环出栈。如果栈顶查询模式无法扩展或已经完全被扩展,则将扩展后的查询模式并入结果集,栈顶查询模式出栈。若栈顶查询模式可以继续扩展,则将查询模式p扩展后记为p

,对p

进行路径图扩展记为pg
G
(p

)。
[0016]步骤2.4:初始路径图pg
G
(p

)置空,并将查询模式p

中的所有边加入到查询模式边集中,循环将查询模式边集中的频繁边e的路径图合并到查询模式路径图pg
G
(p

)中,完成路径图扩展。
[0017]步骤2.5:若路径图pg
G
(p

)的最小独立个体支持大于规定阈值,将扩展后的查询模式p

放入栈中,继续进行扩展。栈为空时,结束循环并将频繁边e从频繁边集中移除。
[0018]步骤2.6:重复步骤2.3和2.4,直到频繁边集为空,最终输出结果集中满足频繁阈值的频繁查询模式。
[0019]所述步骤三中,多路知识图谱划分的具体步骤如下:
[0020]步骤3.1:从节点u的邻居集(不包含频繁查询模式节点)中找出最优交换节点partner,若邻居集中无法找出最优交换节点,则在样本集中寻找最优交换节点;
[0021]步骤3.2:寻找最优交换节点方式如下:
[0022]对于邻居集或者样本集中的节点u进行循环计算,节点u与节点v交换后的能量是否大于交换前,即
[0023]d
u

v
)
α
+d
v

u
)
α
>d
u

u
)
α
+d
v

v
)
α
[0024]其中,π
v
表示节点v的颜色,d
u

v
)表示节点u的邻居中与节点v颜色相同的节点数量;α是能量函数的参数,通过调节α的值,可以使图谱在实际划分中得到最佳结果。
[0025]步骤3.3:为了避免陷入局部最优,使用模拟退火技术。引入温度T参数,其中温度参数随时间增加而降低。
[0026]若新能量new=d
u

v
)
α
+d
v

u
)
α
与温度T
r
的乘积大于原能量old=d
u本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于频繁模式挖掘的边缘缓存知识图谱划分方法,其特征在于,该方法包括以下步骤:步骤一:边缘服务器根据历史查询生成查询图G
Q
={V
Q
,E
Q
,LE
Q
,LV
Q
},其中V
Q
代表点集;E
Q
代表边集;LE
Q
是边标签,表示频繁程度;LV
Q
是点标签,表示类别属性;步骤二:基于查询图G
Q
进行频繁查询模式挖掘,挖掘出频繁查询模式,查询模式定义为P={V
P
,E
P
,LE
P
,LV
P
},其中V
P
代表查询模式点集;E
P
代表查询模式边集;LE
P
是查询模式边标签,其中边标签都为空;LV
P
是查询模式点标签,表示类别属性,并且查询模式中没有重复的点标签,更加关注不同类别实体间的联系;步骤三:基于频繁查询模式对知识图谱进行初始着色,将属于频繁查询模式上的点固定为所属边缘服务器包括的颜色,根据边缘缓存容量的阈值随机初始化其他节点的颜色,然后应用启发式局部搜索进行多路划分,并将知识图谱推向低能状态;步骤四:根据不同颜色的分区将知识图谱划分到所属的边缘服务器上,若当前服务器中的由频繁查询模式扩展出的知识图谱是非连通图,则将根据频繁查询模式中节点的连接在知识图谱中的两个节点之间建立一条有向边,并用当前服务器名称命名有向边。2.根据权利要求1所述的一种基于频繁模式挖掘的边缘缓存知识图谱划分方法,其特征在于,所述步骤二中,频繁查询模式挖掘的具体步骤如下:步骤2.1:初始化结果集和候选集为空,将查询图G
Q
中所有频繁边置于频繁边集中;步骤2.2:计算所有频繁边的路径图,并将所有频繁边生成的路径图并入候选集中;步骤2.3:频繁边e产生的查询模式为p,将查询模式p放入空栈S中,循环出栈;如果栈顶查询模式无法扩展或已经完全被扩展,则将扩展后的查询模式并入结果集,栈顶查询模式出栈;若栈顶查询模式可以继续扩展,则将查询模式p扩展后记为p

,对p

进行路径图扩展记为pg
G
(p

);步骤2.4:初始路径图pg
G
(p

)置空,并将查询模式p

中的所有边加入到查询模式边集中,循环将查询模式边集...

【专利技术属性】
技术研发人员:王鹏飞李诗琪张强
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1