一种基于频繁模式挖掘的边缘缓存知识图谱划分方法技术

技术编号：35098708 阅读：10 留言：0更新日期：2022-10-01 17:03

本发明专利技术提供了一种基于频繁模式挖掘的边缘缓存知识图谱划分方法，属于数据处理技术领域。本发明专利技术利用查询图中挖掘出的频繁查询模式，对初始知识图谱进行着色，通过改进交换算法将知识图谱划分成不同颜色区域，使划分后的知识图谱在满足最小切割边的同时符合边缘缓存大小。在用户下一次访问时，可以快速响应出周围所需服务场景的信息，实现接近最优的缓存性能。本发明专利技术将知识图谱合理部署到边缘服务器中，使得周围用户可以快速获取所需信息，大大减少了从云端获取数据的回程压力，为用户提供更好的交互体验。更好的交互体验。更好的交互体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于频繁模式挖掘的边缘缓存知识图谱划分方法

[0001]本专利技术属于数据处理
，涉及一种基于频繁模式挖掘的边缘缓存知识图谱划分方法，在用户下一次访问时，可以快速响应出周围所需服务场景的信息，实现接近最优的缓存性能。

技术介绍

[0002]随着大数据与人工智能技术的飞速发展，知识图谱凭借其强大的语义处理和开放互联能力，打破不同场景下的数据隔离，为用户提供更好的交互体验。但是，当用户请求周边服务信息(医疗、教育、政府、商城等)时，大规模的知识图谱将给回程网络带来巨大压力，从而降低用户体验质量。并且城市场景下用户查询十分频繁，如何在临近的边缘服务器中快速响应频繁查询请求是很具有挑战性的。移动边缘缓存允许应用供应商在分布式边缘服务器上部署其应用程序和相关数据，为附近的用户提供服务。热门内容可以缓存到距离移动用户很近的网络边缘，用户无需通过回程和核心网多跳传输后从云中心获取请求内容，而是通过单跳无线传输获取请求内容，大大降低了端到端延迟。因此，通过使用移动边缘缓存在分布式边缘服务器上部署知识图谱是必不可少的。
[0003]现有的知识图谱划分算法通常使用最小切割边或点以及考虑分区是否平衡作为目标函数，不关注同一分区的内容是否相关，同时没有考虑到边缘服务器缓存容量的差异，在实际应用场景下，无法将知识图谱合理地分布式部署到边缘服务器中，同时满足跨分区边数目最小化且有效提高知识图谱查询处理性能。
[0004]基于此，本专利技术利用频繁查询模式中获取的热点信息，将初始知识图谱划分成不同区域，并且满足当前服务器...

【技术保护点】

【技术特征摘要】
1.一种基于频繁模式挖掘的边缘缓存知识图谱划分方法，其特征在于，该方法包括以下步骤：步骤一：边缘服务器根据历史查询生成查询图G
Q
＝{V
Q
，E
Q
，LE
Q
，LV
Q
}，其中V
Q
代表点集；E
Q
代表边集；LE
Q
是边标签，表示频繁程度；LV
Q
是点标签，表示类别属性；步骤二：基于查询图G
Q
进行频繁查询模式挖掘，挖掘出频繁查询模式，查询模式定义为P＝{V
P
，E
P
，LE
P
，LV
P
}，其中V
P
代表查询模式点集；E
P
代表查询模式边集；LE
P
是查询模式边标签，其中边标签都为空；LV
P
是查询模式点标签，表示类别属性，并且查询模式中没有重复的点标签，更加关注不同类别实体间的联系；步骤三：基于频繁查询模式对知识图谱进行初始着色，将属于频繁查询模式上的点固定为所属边缘服务器包括的颜色，根据边缘缓存容量的阈值随机初始化其他节点的颜色，然后应用启发式局部搜索进行多路划分，并将知识图谱推向低能状态；步骤四：根据不同颜色的分区将知识图谱划分到所属的边缘服务器上，若当前服务器中的由频繁查询模式扩展出的知识图谱是非连通图，则将根据频繁查询模式中节点的连接在知识图谱中的两个节点之间建立一条有向边，并用当前服务器名称命名有向边。2.根据权利要求1所述的一种基于频繁模式挖掘的边缘缓存知识图谱划分方法，其特征在于，所述步骤二中，频繁查询模式挖掘的具体步骤如下：步骤2.1：初始化结果集和候选集为空，将查询图G
Q
中所有频繁边置于频繁边集中；步骤2.2：计算所有频繁边的路径图，并将所有频繁边生成的路径图并入候选集中；步骤2.3：频繁边e产生的查询模式为p，将查询模式p放入空栈S中，循环出栈；如果栈顶查询模式无法扩展或已经完全被扩展，则将扩展后的查询模式并入结果集，栈顶查询模式出栈；若栈顶查询模式可以继续扩展，则将查询模式p扩展后记为p
′
，对p
′
进行路径图扩展记为pg
G
(p
′
)；步骤2.4：初始路径图pg
G
(p
′
)置空，并将查询模式p
′
中的所有边加入到查询模式边集中，循环将查询模式边集...

【专利技术属性】
技术研发人员：王鹏飞，李诗琪，张强，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人