一种数据管理方法、血缘关系显示方法和相关装置制造方法及图纸

技术编号:24091306 阅读:35 留言:0更新日期:2020-05-09 08:11
本申请实施例公开一种数据管理方法,获取来自第一数据源和第二数据源的数据信息,数据信息体现了数据之间的依赖关系。基于第一数据源中数据信息得到的数据之间依赖关系确定数据之间的第一血缘关系,以及基于第二数据源中数据信息得到的数据之间依赖关系确定数据之间的第二血缘关系。由于不同数据源中的数据具有不同特点,不同数据源中所缺失的数据间的依赖关系完全相同几率较小,故将第一血缘关系与第二血缘关系进行拼接得到的目标血缘关系可以弥补基于单个数据源确定血缘关系的不足,从而确定出较为完整的血缘关系。利用目标血缘关系在图形数据库中构建血缘关系图,得到的血缘关系图能够完整的体现数据之间的依赖关系,以便对数据进行全面管理。

A data management method, blood relationship display method and related devices

【技术实现步骤摘要】
一种数据管理方法、血缘关系显示方法和相关装置
本申请涉及数据处理领域,特别是涉及一种数据管理方法、血缘关系显示方法和相关装置。
技术介绍
大数据时代,数据爆发性增长,海量的、各种类型的数据在快速产生。这些庞大复杂的数据信息,通过联姻融合、转换变换、流转流通,又生成新的数据,汇聚成数据的海洋。数据的产生、加工融合、流转流通,到最终消亡,数据之间自然会形成一种关系,这种关系被称为数据的血缘关系。根据数据血缘关系,可以很清楚地了解数据的迁徙流转,为数据价值的评估、数据销毁、数据定位等数据管理提供依据。然而,目前的相关技术中通常会出现血缘关系覆盖不全面,进而导致针对某个数据查看血缘关系时,无法得到该数据完整的血缘关系。
技术实现思路
为了解决上述技术问题,本申请提供了一种数据管理方法、血缘关系显示方法和相关装置,可以弥补基于单个数据源确定血缘关系的不足,从而能够确定出较为完整的血缘关系。同时,由于图像数据库的特性,针对单个数据查看血缘关系时,可以实现一次性展开该数据的完整的血缘关系图。本申请实施例公开了如下技术方案:本文档来自技高网...

【技术保护点】
1.一种数据管理方法,其特征在于,所述方法包括:/n获取来自第一数据源和第二数据源的数据信息;所述数据信息体现了数据之间的依赖关系;/n基于所述第一数据源中数据信息得到的数据之间的依赖关系确定数据之间的第一血缘关系,以及基于所述第二数据源中数据信息得到的数据之间的依赖关系确定数据之间的第二血缘关系;/n将所述第一血缘关系和所述第二血缘关系进行拼接得到目标血缘关系;/n利用所述目标血缘关系在图形数据库中构建血缘关系图。/n

【技术特征摘要】
1.一种数据管理方法,其特征在于,所述方法包括:
获取来自第一数据源和第二数据源的数据信息;所述数据信息体现了数据之间的依赖关系;
基于所述第一数据源中数据信息得到的数据之间的依赖关系确定数据之间的第一血缘关系,以及基于所述第二数据源中数据信息得到的数据之间的依赖关系确定数据之间的第二血缘关系;
将所述第一血缘关系和所述第二血缘关系进行拼接得到目标血缘关系;
利用所述目标血缘关系在图形数据库中构建血缘关系图。


2.根据权利要求1所述的方法,其特征在于,所述将所述第一血缘关系和所述第二血缘关系进行拼接得到目标血缘关系,包括:
确定所述第一血缘关系和所述第二血缘关系之间具有的相同子血缘关系和不同子血缘关系;
将所述相同子血缘关系和所述不同子血缘关系进行拼接得到所述目标血缘关系。


3.根据权利要求1所述的方法,其特征在于,所述血缘关系图中还包括数据节点的热度信息,所述热度信息反映了所述血缘关系图中数据节点所表征数据的数据活跃程度。


4.根据权利要求3所述的方法,其特征在于,目标数据节点为所述血缘关系图中任一数据节点,若所述目标数据节点为血缘关系图中的父数据节点,所述目标数据节点的热度信息确定方式为:
根据所述目标数据节点所表征数据的属性信息计算初始热度;
根据所述初始热度、所述目标数据节点的子数据节点的热度信息以及所述目标数据节点与所述子数据节点之间的关系传递比例计算所述目标数据节点的热度信息。


5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述数据节点的热度信息和所述数据节点所表征数据的大小,确定待删除数据节点集合。


6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述血缘关系图中数据节点所表征数据的类型,对属于同一类型的数据节点进行聚合得到数据节点集合;
根据聚合前数据节点之间的目标血缘关系确定聚合后的数据节点集合之间的血缘关系图。


7.一种数据管理装置,其特征在于,所述装置包括获取单元、第一确定单元、拼接单元和构建单元:
所述获取单元,用于获取来自第一数据源和第二数据源的数据信息;所述数据信息体现了数据之间的依赖关系;
所述第一确定单元,用于基于所述第一数据源中数据信息得到的数据之间的依赖关系确定数据之间的第一血缘关系,以及基于所述第二数据源中数据信息得到的数据之间的依赖关系确定数据之间的第二血缘关系;<...

【专利技术属性】
技术研发人员:贺智超张金铭潘诗颖肖兮姚孟君虹
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1