一种基于BFS森林的社交网络中的知识图谱数据布局方法技术

技术编号:20221750 阅读:47 留言:0更新日期:2019-01-28 20:15
本发明专利技术公开了一种基于BFS森林的社交网络中的知识图谱数据布局方法,包括:对社交网络中的知识图谱进行一次全图的全局BFS遍历,得到全局BFS序列;将当前限长BFS子树的起始点初始化为全局BFS序列的起始序号;从起始点出发,使用限长BFS遍历社交网络中的知识图谱,直至图中所有节点都被遍历,最终得到BFS森林序列;利用所述BFS森林序列对社交网络中的知识图谱的节点进行更新,知识图谱数据布局结束。本发明专利技术使用BFS森林去遍历全图,限长BFS子树的局部性已经符合限长图遍历算法需求;以全局BFS序列作为“BFS森林”起始点选择依据,使BFS子树起始点的选择更加符合限长图遍历的需求,使多个BFS子树组成的序列满足整体顺序性,提高了算法执行效率。

【技术实现步骤摘要】
一种基于BFS森林的社交网络中的知识图谱数据布局方法
本专利技术属于知识图谱推理领域,更具体地,涉及一种基于BFS森林的社交网络中的知识图谱数据布局方法。
技术介绍
基于路径的知识推理方法的特征提取阶段PCWR是其效率瓶颈,传统的在内存模式下对特征提取阶段的优化难以满足社交网络知识图谱的数据量逐渐增大。现有技术提出使用限长图遍历算法代替PCWR进行特征提取,其整个过程为:数据布局策略对知识图谱数据进行处理,获得预处理后的知识图谱数据。然后再利用外存模式图处理系统对预处理后的知识图谱数据进行分区。最后基于路径的知识推理在外存模式图处理系统上执行限长图遍历算法,对分区后的知识图谱进行特征提取、推理和预测。针对限长图遍历算法的数据布局策略是一种通过对知识图谱节点进行偏序排列,并依此进行序号重排,在不影响具有选择调度机制的外存模式图处理系统的任何模块设计的情况下,通过提高外存模式图处理系统数据分区的顺序性与局部性,进而减少算法执行过程中的分区数据读取次数,来提高外存模式下基于路径的知识推理算法中“特征提取”阶段效率的预处理手段。现有的外存模式下基于路径的知识推理的数据布局策略包括:Graph本文档来自技高网...

【技术保护点】
1.一种基于BFS森林的社交网络中的知识图谱数据布局方法,所述BFS森林由多个限长BFS子树组合,其特征在于,该方法具体包括以下步骤:S1.对社交网络中的知识图谱进行一次全图的全局BFS遍历,得到全局BFS序列;S2.将当前限长BFS子树的起始点初始化为全局BFS序列的起始序号;S3.从当前限长BFS子树的起始点出发,使用限长BFS遍历社交网络中的知识图谱,直至图中所有节点都被遍历,最终得到BFS森林序列;S4.利用所述BFS森林序列对社交网络中的知识图谱的节点进行更新,社交网络中的知识图谱数据布局结束。

【技术特征摘要】
1.一种基于BFS森林的社交网络中的知识图谱数据布局方法,所述BFS森林由多个限长BFS子树组合,其特征在于,该方法具体包括以下步骤:S1.对社交网络中的知识图谱进行一次全图的全局BFS遍历,得到全局BFS序列;S2.将当前限长BFS子树的起始点初始化为全局BFS序列的起始序号;S3.从当前限长BFS子树的起始点出发,使用限长BFS遍历社交网络中的知识图谱,直至图中所有节点都被遍历,最终得到BFS森林序列;S4.利用所述BFS森林序列对社交网络中的知识图谱的节点进行更新,社交网络中的知识图谱数据布局结束。2.如权利要求1所述的知识图谱数据布局方法,其特征在于,步骤S3具体如下:S31.从当前限长BFS子树的起始点出发,限长BFS以限制步长n遍历社交网络中的知识图谱,得到一个限长BFS序列,并记录当前BF...

【专利技术属性】
技术研发人员:施展冯丹曹孟媛戴凯航王子毅刘上杨蕾杨文鑫陈硕陈静
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1