【技术实现步骤摘要】
图数据的更新方法、装置、计算机设备及存储介质
本专利技术实施例涉及图数据更新技术,尤其涉及一种图数据的更新方法、装置、计算机设备及存储介质。
技术介绍
在互联网大数据发展背景下,很多数据之间存在关联,这些关联数据一般以图结构的形式进行存储,在图结构中,将实体作为点数据,将实体之间的关系作为边数据。随着新增业务数据的生成,已存的图数据可能会发生变化,因此需要对已存的图数据进行更新。对于社交网络、知识图谱、关联关系等复杂场景,图数据规模较大,更新起来比较复杂。目前图数据的更新方案如下:(1)基于点/边结构的更新机制,在图结构中对待更新的点或边进行检索,若检索到,则进行更新。该方案更新效率低,尤其对于关系边的更新,若两点之间存在多条边,则存在多次检索开销,因此该方案不适用于大规模数据的更新,例如不适合GB以上规模的数据。(2)基于LRU(LeastRecentlyUsed,最近最少使用)的数据淘汰更新,即按照固定的淘汰时间定期删除最近最少使用的数据。该方案针对全量数据进行更新,并且,对于稳定数据(如身份证与户籍信息这种长时间不变的数据),在确保资源未淘汰前也要定期对全量数据进行更新,更新开销较大。
技术实现思路
本专利技术实施例提供一种图数据的更新方法、装置、计算机设备及存储介质,以减少检索开销,提高更新效率。第一方面,本专利技术实施例提供了一种图数据的更新方法,包括:接收待更新数据;根据分类信息确定所述待更新数据的优先级类别;按照所述优先级类别对 ...
【技术保护点】
1.一种图数据的更新方法,其特征在于,包括:/n接收待更新数据;/n根据分类信息确定所述待更新数据的优先级类别;/n按照所述优先级类别对应的更新方式,对所述待更新数据进行处理,以实现图数据的更新。/n
【技术特征摘要】
1.一种图数据的更新方法,其特征在于,包括:
接收待更新数据;
根据分类信息确定所述待更新数据的优先级类别;
按照所述优先级类别对应的更新方式,对所述待更新数据进行处理,以实现图数据的更新。
2.根据权利要求1所述的方法,其特征在于,在接收待更新数据之前,还包括:
按照数据的更新频率和数据的规模对所述图数据进行分类,以确定各个图数据的优先级类别;
存储各个图数据及其优先级类别的对应关系,作为所述分类信息。
3.根据权利要求2所述的方法,其特征在于,按照数据的更新频率和数据的规模对所述图数据进行分类,包括:
若当前图数据的更新频率低于第一预设阈值且规模小于第二预设阈值,确定所述当前图数据属于第一优先级类别;
若当前图数据的更新频率低于所述第一预设阈值且规模大于所述第二预设阈值,确定所述当前图数据属于第二优先级类别;
若当前图数据的更新频率高于所述第一预设阈值且规模大于所述第二预设阈值,确定所述当前图数据属于第三优先级类别。
4.根据权利要求1所述的方法,其特征在于,根据分类信息确定所述待更新数据的优先级类别,包括:
在所述分类信息中查找与所述待更新数据匹配的数据;
若查找到与所述待更新数据匹配的数据,则将所述匹配的数据的优先级类别确定为所述待更新数据的优先级类别;
若未查找到与所述待更新数据匹配的数据,则将所述待更新数据添加到图中,按照预设规则确定所述待更新数据的优先级类别,并将所述待更新数据及其优先级类别的对应关系存储到所述分类信息中。
5.根据权利要求1所述的方法,其特征在于,若所述待更新数据的优先级类别为第一优先级类别,按照所述优先级类别对应的更新方式,对所述待更新数据进行处理,包括:
若所述待更新数据是点数据,从预存索引信息中获取所述点数据的索引地址,按照所述点数据的索引地址在图中查找相应的点,并根据所述点数据更新该点的属性信息;
若所述待更新数据是边数据,从所述预存索引信息中获取所述边数据的出度点的索引地址和入度点的索引地址,确定所述出度点和所述入度点之间存在唯一的边,按照所述出度点的索引地址和所述入度点的索引地址在图中查找所述出度点与所述入度点之间的边,并根据所述边数据更新该边的属性信息。
6.根据权利要求5所述的方法,其特征在于,
从预存索引信息中获取所述点数据的索引地址,包括:
若从所述预存索引信息中获取不到所述点数据的索引地址,则输出第一异常消息;
从所述预存索引信息中获取所述边数据的出度点的索引地址和入度点的索引地址,包括:
若从所述预存索引信息中获取不到所述出度点的索引地址或所述入度点的索引地址,则输出第二异常消息;
按照所述出度点的索引地址和所述入度点的索引地址在图中查找所述出度点与所述入度点之间的边,包括:
若图中查找不到所述出度点与所述入度点之间的边,则根据所述边数据在图中插入该边。
7.根据权利要求1所述的方法,其特征在于,若所述待更新数据的优先级类别为第二优先级类别,按照所述优先级类别对应的更新方式,对所述待更新数据进行处理,包括:
确定所述待更新数据命中缓存中缓存的更新数据;
根据所述待更新数据更新所述缓存中的相应数据;
通过轮询将所述缓存中满足写入条件的更新数据写入到图中,覆盖所述图中相应的原数据。
8.根据权...
【专利技术属性】
技术研发人员:张阳,谢奕,刘畅,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。