【技术实现步骤摘要】
一种数据管理方法、血缘关系显示方法和相关装置
本申请涉及数据处理领域,特别是涉及一种数据管理方法、血缘关系显示方法和相关装置。
技术介绍
大数据时代,数据爆发性增长,海量的、各种类型的数据在快速产生。这些庞大复杂的数据信息,通过联姻融合、转换变换、流转流通,又生成新的数据,汇聚成数据的海洋。数据的产生、加工融合、流转流通,到最终消亡,数据之间自然会形成一种关系,这种关系被称为数据的血缘关系。根据数据血缘关系,可以很清楚地了解数据的迁徙流转,为数据价值的评估、数据销毁、数据定位等数据管理提供依据。然而,目前的相关技术中通常会出现血缘关系覆盖不全面,进而导致针对某个数据查看血缘关系时,无法得到该数据完整的血缘关系。
技术实现思路
为了解决上述技术问题,本申请提供了一种数据管理方法、血缘关系显示方法和相关装置,可以弥补基于单个数据源确定血缘关系的不足,从而能够确定出较为完整的血缘关系。同时,由于图像数据库的特性,针对单个数据查看血缘关系时,可以实现一次性展开该数据的完整的血缘关系图。本申请实施例 ...
【技术保护点】
1.一种数据管理方法,其特征在于,所述方法包括:/n获取来自第一数据源和第二数据源的数据信息;所述数据信息体现了数据之间的依赖关系;/n基于所述第一数据源中数据信息得到的数据之间的依赖关系确定数据之间的第一血缘关系,以及基于所述第二数据源中数据信息得到的数据之间的依赖关系确定数据之间的第二血缘关系;/n将所述第一血缘关系和所述第二血缘关系进行拼接得到目标血缘关系;/n利用所述目标血缘关系在图形数据库中构建血缘关系图。/n
【技术特征摘要】
1.一种数据管理方法,其特征在于,所述方法包括:
获取来自第一数据源和第二数据源的数据信息;所述数据信息体现了数据之间的依赖关系;
基于所述第一数据源中数据信息得到的数据之间的依赖关系确定数据之间的第一血缘关系,以及基于所述第二数据源中数据信息得到的数据之间的依赖关系确定数据之间的第二血缘关系;
将所述第一血缘关系和所述第二血缘关系进行拼接得到目标血缘关系;
利用所述目标血缘关系在图形数据库中构建血缘关系图。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一血缘关系和所述第二血缘关系进行拼接得到目标血缘关系,包括:
确定所述第一血缘关系和所述第二血缘关系之间具有的相同子血缘关系和不同子血缘关系;
将所述相同子血缘关系和所述不同子血缘关系进行拼接得到所述目标血缘关系。
3.根据权利要求1所述的方法,其特征在于,所述血缘关系图中还包括数据节点的热度信息,所述热度信息反映了所述血缘关系图中数据节点所表征数据的数据活跃程度。
4.根据权利要求3所述的方法,其特征在于,目标数据节点为所述血缘关系图中任一数据节点,若所述目标数据节点为血缘关系图中的父数据节点,所述目标数据节点的热度信息确定方式为:
根据所述目标数据节点所表征数据的属性信息计算初始热度;
根据所述初始热度、所述目标数据节点的子数据节点的热度信息以及所述目标数据节点与所述子数据节点之间的关系传递比例计算所述目标数据节点的热度信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述数据节点的热度信息和所述数据节点所表征数据的大小,确定待删除数据节点集合。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述血缘关系图中数据节点所表征数据的类型,对属于同一类型的数据节点进行聚合得到数据节点集合;
根据聚合前数据节点之间的目标血缘关系确定聚合后的数据节点集合之间的血缘关系图。
7.一种数据管理装置,其特征在于,所述装置包括获取单元、第一确定单元、拼接单元和构建单元:
所述获取单元,用于获取来自第一数据源和第二数据源的数据信息;所述数据信息体现了数据之间的依赖关系;
所述第一确定单元,用于基于所述第一数据源中数据信息得到的数据之间的依赖关系确定数据之间的第一血缘关系,以及基于所述第二数据源中数据信息得到的数据之间的依赖关系确定数据之间的第二血缘关系;<...
【专利技术属性】
技术研发人员:贺智超,张金铭,潘诗颖,肖兮,姚孟君虹,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。