本发明专利技术公开了一种基于最短路径树技术实现数据血缘的批量检索和路径展示的方法及装置,其中方法包括:获取数据血缘更新信息,分析血缘变动情况后获取变动节点;获取所有与变动节点相关联的关联节点;基于最短路径树算法,分别计算从根节点到关联节点的最短路径;获取关联节点的子节点,处理并更新最短路径信息表中关联节点的子节点对应的最短路径;批量获取目标字段,在数据库中查询字段信息表,若目标字段存在,则基于目标字段进行检索,从最短路径信息表中输出对应的最短路径;将最短路径进行汇总,合并共同节点后形成数据,在最短路径树中高亮展示目标字段的位置和最短路径。本发明专利技术能降低数据更新后,血缘路径更新时重复无效的计算,以提高整体效率。以提高整体效率。以提高整体效率。
【技术实现步骤摘要】
一种基于最短路径树技术实现数据血缘的批量检索和路径展示的方法及装置
[0001]本专利技术涉及数据仓库中数据血缘的检索和展示的
,具体涉及一种基于最短路径树技术实现数据血缘的批量检索和路径展示的方法及装置。
技术介绍
[0002]从数据的产生、加工融合、流转流通,到提供应用,数据之间自然而然地会形成一种关系,本领域技术人员借鉴人类社会中类似的一种关系来表达数据之间的这种关系,称之为数据的血缘关系,即为数据血缘。数据仓库的构建过程通常包括如下几个步骤:数据集成或者接入、数据建模、数据加工转换、数据应用发布。
[0003]在数据仓库中,基于数据血缘进行检索和展示,是一种快速检索获得数据并直观地获知数据血缘关系的方法。现有技术中,数据仓库一般通过广度搜索的方法计算数据节点之间的血缘路径,当数据仓库中的数据出现修改,使得数据仓库内的数据节点出现新增或删除时,数据仓库的节点之间血缘路径需要基于每个节点进行重新计算,以分别获取根节点与各节点之间的最短路径。
[0004]专利技术人认为在现有技术中,数据仓库中的数据节点在每次发生增删后,都需要重新计算所有节点的血缘路径,其中包括大量重复且无意义的血缘路径的计算,增大数据仓库在更新数据时的工作载荷,造成资源浪费。同时,在更新数据后的路径全面更新计算的过程中,数据仓库的数据检索和路径展示的效率会显著降低,影响用户的使用体验。
技术实现思路
[0005]为了克服上述现有技术中包含大量重复且无意义路径计算的技术缺陷,本专利技术提供一种基于最短路径树技术实现数据血缘的批量检索和路径展示的方法及装置。
[0006]为了解决上述问题,本专利技术按以下技术方案予以实现的:
[0007]第一方面,本专利技术公开一种基于最短路径树技术实现数据血缘的批量检索和路径展示的方法,包括以下步骤:
[0008]获取数据血缘更新信息,分析血缘变动情况后获取变动节点;
[0009]获取所有与变动节点相关联的关联节点;
[0010]基于最短路径树算法,分别计算从根节点到关联节点的最短路径;
[0011]获取关联节点的子节点,处理并更新最短路径信息表中关联节点的子节点对应的最短路径;
[0012]批量获取目标字段,在数据库中查询字段信息表,若目标字段存在,则基于目标字段进行检索,从最短路径信息表中输出对应的最短路径;
[0013]将最短路径进行汇总,合并共同节点后形成数据,在最短路径树中高亮展示目标字段的位置和最短路径。
[0014]在一种实施例中,所述基于最短路径树算法,分别计算从根节点到关联节点的最
短路径,具体包括:
[0015]将所有关联节点依次置入到任务队列中;
[0016]判断任务队列是否为空;
[0017]若不为空,则依次弹出关联节点,进行最短路径计算;
[0018]若为空,则终止最短路径计算。
[0019]在一种实施例中,所述依次弹出关联节点,进行最短路径计算,具体包括:
[0020]获取任务队列中弹出的关联节点,基于最短路径树算法进行最短路径计算;
[0021]获得根节点到关联节点的最短路径;
[0022]基于关联节点查询最短路径信息表,获取关联节点存储在最短路径信息表中的历史路径;
[0023]将最短路径替换历史路径,以更新最短路径信息表。
[0024]在一种实施例中,所述将最短路径替换历史路径,以更新最短路径信息表后,还包括:
[0025]分别提取最短路径和历史路径所经过的途径节点,分别截取根节点到途径节点之间的最短路径和历史路径;
[0026]获取分别对途径节点的历史路径和最短路径进行比对;
[0027]基于比对结果,获取其中最短路径优于历史路径的途径节点;
[0028]相应地将最短路径更新至最短路径信息表中。
[0029]在一种实施例中,所述获取关联节点的子节点,处理并更新最短路径信息表中关联节点的子节点对应的最短路径,具体包括:
[0030]遍历所有关联节点,判断关联节点是否存在子节点;
[0031]若存在,则将关联节点的子节点依次置入任务列表中;
[0032]若不存在,则跳过该关联节点;
[0033]任务列表依次弹出子节点;
[0034]通过最短路径树算法,计算根节点到子节点的最短路径;
[0035]子节点的最短路径与最短路径信息表中的历史路径进行比对;
[0036]若子节点的最短路径优于历史路径,则将子节点的最短路径更新至最短路径信息表中;
[0037]循环执行最短路径的计算和比对,直至任务队列清空。
[0038]第二方面,本专利技术还公开一种基于最短路径树技术实现数据血缘的批量检索和路径展示的装置,包括:
[0039]血缘更新模块,用于获取数据血缘更新信息,分析血缘变动情况后获取变动节点;
[0040]关联获取模块,用于获取所有与变动节点相关联的关联节点;
[0041]路径计算模块,用于基于最短路径树算法,分别计算从根节点到关联节点的最短路径;
[0042]路径处理模块,用于获取关联节点的子节点,处理并更新最短路径信息表中关联节点的子节点对应的最短路径;
[0043]批量检索模块,用于批量获取目标字段,在数据库中查询字段信息表,若目标字段存在,则基于目标字段进行检索,从最短路径信息表中输出对应的最短路径;
[0044]路径展示模块,用于将最短路径进行汇总,合并共同节点后形成数据,在最短路径树中高亮展示目标字段的位置和最短路径。
[0045]在一种实施例中,所述路径计算模块在运行时,具体执行:
[0046]将所有关联节点依次置入到任务队列中;
[0047]判断任务队列是否为空;
[0048]若不为空,则依次弹出关联节点,进行最短路径计算;
[0049]若为空,则终止最短路径计算。
[0050]在一种实施例中,所述依次弹出关联节点,进行最短路径计算,具体包括:
[0051]获取任务队列中弹出的关联节点,基于最短路径树算法进行最短路径计算;
[0052]获得根节点到关联节点的最短路径;
[0053]基于关联节点查询最短路径信息表,获取关联节点存储在最短路径信息表中的历史路径;
[0054]将最短路径替换历史路径,以更新最短路径信息表。
[0055]在一种实施例中,所述路径处理模块在运行时,还执行:
[0056]分别提取最短路径和历史路径所经过的途径节点,分别截取根节点到途径节点之间的最短路径和历史路径;
[0057]获取分别对途径节点的历史路径和最短路径进行比对;
[0058]基于比对结果,获取其中最短路径优于历史路径的途径节点;
[0059]相应地将最短路径更新至最短路径信息表中。
[0060]在一种实施例中,所述路径处理模块在运行时,具体执行:
[0061]本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于最短路径树技术实现数据血缘的批量检索和路径展示的方法,其特征在于,包括以下步骤:获取数据血缘更新信息,分析血缘变动情况后获取变动节点;获取所有与变动节点相关联的关联节点;基于最短路径树算法,分别计算从根节点到关联节点的最短路径;获取关联节点的子节点,处理并更新最短路径信息表中关联节点的子节点对应的最短路径;批量获取目标字段,在数据库中查询字段信息表,若目标字段存在,则基于目标字段进行检索,从最短路径信息表中输出对应的最短路径;将最短路径进行汇总,合并共同节点后形成数据,在最短路径树中高亮展示目标字段的位置和最短路径。2.根据权利要求1所述的基于最短路径树技术实现数据血缘的批量检索和路径展示的方法,其特征在于,所述基于最短路径树算法,分别计算从根节点到关联节点的最短路径,具体包括:将所有关联节点依次置入到任务队列中;判断任务队列是否为空;若不为空,则依次弹出关联节点,进行最短路径计算;若为空,则终止最短路径计算。3.根据权利要求2所述的基于最短路径树技术实现数据血缘的批量检索和路径展示的方法,其特征在于,所述依次弹出关联节点,进行最短路径计算,具体包括:获取任务队列中弹出的关联节点,基于最短路径树算法进行最短路径计算;获得根节点到关联节点的最短路径;基于关联节点查询最短路径信息表,获取关联节点存储在最短路径信息表中的历史路径;将最短路径替换历史路径,以更新最短路径信息表。4.根据权利要求3所述的基于最短路径树技术实现数据血缘的批量检索和路径展示的方法,其特征在于,所述将最短路径替换历史路径,以更新最短路径信息表后,还包括:分别提取最短路径和历史路径所经过的途径节点,分别截取根节点到途径节点之间的最短路径和历史路径;获取分别对途径节点的历史路径和最短路径进行比对;基于比对结果,获取其中最短路径优于历史路径的途径节点;相应地将最短路径更新至最短路径信息表中。5.根据权利要求4所述的基于最短路径树技术实现数据血缘的批量检索和路径展示的方法,其特征在于,所述获取关联节点的子节点,处理并更新最短路径信息表中关联节点的子节点对应的最短路径,具体包括:遍历所有关联节点,判断关联节点是否存在子节点;若存在,则将关联节点的子节点依次置入任务列表中;若不存在,则跳过该关联节点;任务列表依次弹出子节点;
通过最短路径树算法,计算根节点到子节点的最短路径;子节点的最短路径与最短路径信息表中的历史路径进行比对;若子节点的最短路径优于历史路径,则将子节点的最短路径更新至最短路径信息表中;循环执行最短路径的计算和比对,直至任务队列清空...
【专利技术属性】
技术研发人员:陈家亮,魏纪乐,
申请(专利权)人:广州宸祺出行科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。