【技术实现步骤摘要】
图数据库的数据处理方法、设备和存储介质
[0001]本公开涉及计算机
,具体涉及知识图谱
等人工智能
,尤其涉及图数据库的数据处理方法、设备和存储介质。
技术介绍
[0002]知识图谱是一种基于图模型的关联网络知识表达。知识图谱将实体抽象为顶点,将实体之间的关系抽象为边,通过结构化的形式对知识进行建模和描述,并将知识可视化。知识图谱是图数据库关联最为紧密、场景最广泛的应用方向。知识图谱以图数据库作为存储引擎,对海量信息进行智能化处理,形成大规模的知识库并进而支撑业务应用。。
技术实现思路
[0003]本公开提供了一种用于图数据库的数据处理方法、设备和存储介质。
[0004]根据本公开的一方面,提供了一种图数据库的数据处理方法,所述方法包括:获取所述图数据库中待处理的实体节点集合;对所述实体节点集合进行划分,以得到多个实体节点子集合;针对每个所述实体节点子集合,确定所述实体节点子集合中每个实体节点所属于的存储节点,其中,所述实体节点所属于的存储节点包括所述实体节点与对应的下一跳实体节点;根据所述实体节点子集合中每个实体节点对应的下一跳实体节点,确定所述实体节点子集合对应的下一跳实体节点集合;根据每个所述实体节点子集合对应的下一跳实体节点集合,确定所述实体节点集合对应的下一跳实体节点集合。
[0005]根据本公开的另一方面,提供了一种图数据库的数据处理装置,所述装置包括:第一获取模块,用于获取所述图数据库中待处理的实体节点集合;划分模块,用于对所述实体节点集合进行划分,以 ...
【技术保护点】
【技术特征摘要】
1.一种图数据库的数据处理方法,所述方法包括:获取所述图数据库中待处理的实体节点集合;对所述实体节点集合进行划分,以得到多个实体节点子集合;针对每个所述实体节点子集合,确定所述实体节点子集合中每个实体节点所属于的存储节点,其中,所述实体节点所属于的存储节点包括所述实体节点与对应的下一跳实体节点;根据所述实体节点子集合中每个实体节点对应的下一跳实体节点,确定所述实体节点子集合对应的下一跳实体节点集合;根据每个所述实体节点子集合对应的下一跳实体节点集合,确定所述实体节点集合对应的下一跳实体节点集合。2.根据权利要求1所述的方法,其中,所述根据每个所述实体节点子集合对应的下一跳实体节点集合,确定实体节点集合对应的下一跳实体节点集合,包括:分别对每个所述实体节点子集合对应的下一跳实体节点集合进行去重,以得到每个所述实体节点子集合各自对应的去重结果;对所有所述实体节点子集合各自对应的去重结果进行合并,以得到所述实体节点集合对应的候选的下一跳实体节点集合;对所述候选的下一跳实体节点集合再次进行去重,以得到所述实体节点集合对应的下一跳实体节点集合。3.根据权利要求1所述的方法,其中,所述根据每个所述实体节点子集合对应的下一跳实体节点集合,确定实体节点集合对应的下一跳实体节点集合,包括:对所有的所述节点子集合对应的下一跳实体节点集合进行合并处理,以得到合并的下一跳实体节点集合;对所述合并的下一跳实体节点集合进行去重处理,以得到所述实体节点集合对应的下一跳实体节点集合。4.根据权利要求1
‑
3任一项所述的方法,其中,所述根据所述实体节点子集合中每个实体节点对应的下一跳实体节点,确定所述实体节点子集合对应的下一跳实体节点集合,包括:根据所述实体节点子集合中每个实体节点所属于的存储节点,将属于同一个存储节点的实体节点划分为一组,以得到多组实体节点;针对每组实体节点,接收与当前实体节点组对应的存储节点针对所述当前实体节点组返回的去重后的下一跳实体节点结果;根据每组实体节点的下一跳实体节点结果,确定所述实体节点子集合对应的下一跳实体节点集合。5.根据权利要求2所述的方法,其中,所述分别对每个所述实体节点子集合对应的下一跳实体节点集合进行去重,以得到每个所述实体节点子集合各自对应的去重结果,包括:针对每个所述实体节点子集合,对所述实体节点子集合对应的下一跳实体节点集合进行节点遍历;对于遍历到的目标实体节点,确定所述目标实体节点的节点标识所属于的区间,其中,所述区间是对所述节点标识的取值范围进行分段而得到的;
根据所述区间对应的去重方式,确定已遍历的节点中已出现过所述目标实体节点;删除所述下一跳实体节点集合中的所述目标实体节点。6.根据权利要求5所述的方法,其中,所述根据所述区间对应的去重方式,确定已遍历的节点中已出现过所述目标实体节点,包括:获取所述区间所对应的多个位集;对所述节点标识的比特位进行分段,以得到所述节点标识对应的多个比特段;针对每个比特段,从所述多个位集中获取与所述比特段对应的目标位集,其中,所述目标位集的比特长度大于或者等于所述比特段的比特长度;从所述目标位集中获取与所述比特段的取值对应的比特位;在所述多个比特段对应的比特位上的取值均为第一取值的情况,确定已遍历的节点中已出现过所述目标实体节点,其中,第一取值表示对应比特段的取值已出现过。7.根据权利要求5所述的方法,其中,所述根据所述区间对应的去重方式,确定已遍历的节点中已出现过所述目标实体节点,包括:获取所述区间对应的哈希表;获取所述节点标识的高N个比特位以及低M个比特位,其中,所述N为大于1,且小于所述K的整数,所述K表示所述节点标识的比特长度,所述M为所述K与所述N之间的差值;从所述哈希表中获取与所述高N个比特位的取值所对应的位集;从所述位集中获取与所述低M个比特位的取值对应的目标比特位;在所述目标比特位上的取值为第一取值的情况下,确定已遍历的节点中已出现过所述目标实体节点,其中,所述第一取值用于表示所述低M个比特位的取值已出现过。8.根据权利要求5所述的方法,其中,所述根据所述区间对应的去重方式,确定已遍历的节点中已出现过所述目标实体节点,包括:获取所述区间对应的位集;从所述位集中获取与所述节点标识对应的目标比特位;在所述目标比特位上的取值为第一取值的情况下,确定已遍历的节点中已出现过所述目标实体节点。9.一种图数据库的数据处理装置,所述装置包括:第一获取模块,用于获取所述图数据库中待处理的实体节点集合;划分模块,用于对所述实体节点集合进行划分,以得到多个实体节点子集合;第一确定...
【专利技术属性】
技术研发人员:王益飞,汪洋,王宇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。