一种构建数据仓库表血缘关系图的方法和装置制造方法及图纸

技术编号:10181501 阅读:454 留言:0更新日期:2014-07-03 11:19
本发明专利技术公开了一种构建数据仓库表血缘关系图的方法和装置,属于计算机领域。该方法包括:解析访问数据仓库的每个数据仓库操作语句,得到每个数据仓库操作语句访问的数据仓库目的表的表名;将每个数据仓库操作语句的语句标识与访问的数据仓库目的表的表名的对应关系存储在对应关系表中;根据对应关系表,获取对应关系表中的每个数据仓库目的表对应的数据仓库来源表的表名;根据每个数据仓库目的表的表名和每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图。该装置包括:解析模块、第一存储模块、第一获取模块和构建模块。本发明专利技术中服务器能够自动构建数据仓库血缘关系图。

【技术实现步骤摘要】
一种构建数据仓库表血缘关系图的方法和装置
本专利技术涉及计算机领域,特别涉及一种构建数据仓库表血缘关系图的方法和装置。
技术介绍
数据仓库中存储有各种各样的业务数据,不同的业务数据存储在不同的业务表中。因此,数据仓库中存储有多个业务表,如何将数据仓库中存储的多个业务表构建成数据仓库表血缘关系图是迫切需要解决的问题。目前,都是数据仓库管理人员解析数据仓库操作语句并构建数据仓库表血缘关系图。而数据仓库管理人员构建数据仓库表血缘关系图时,容易出错;并且,数据仓库中的业务数据量很大,造成数据仓库管理人员的工作量大。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种构建数据仓库表血缘关系图的方法和装置。所述技术方案如下:一方面,提供了一种构建数据仓库表血缘关系图的方法,所述方法包括:解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名;将所述每个数据仓库操作语句的语句标识与访问的数据仓库目的表的表名的对应关系存储在对应关系表中;根据所述对应关系表,获取所述对应关系表中的每个数据仓库目的表对应的数据仓库来源表的表名;根据每个数据仓库目的表的表名和所述每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图。进一步地,所述解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名,包括:解析所述访问数据仓库的每个数据仓库操作语句,得到所述访问数据仓库的每个数据仓库操作语句对应的访问方式;获取访问方式为写方式的数据仓库操作语句;解析所述访问方式为写方式的数据仓库操作语句,得到所述访问方式为写方式的访问的所有数据仓库目的表的表名。进一步地,所述解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名之后,所述方法还包括:获取任务类型为导入类型的数据仓库操作语句和与之对应的导入路径;根据所述导入路径获取任务类型为分析类型且具有所述导入路径的数据仓库操作语句;绑定所述任务类型为导入类型的数据仓库操作语句和所述任务类型为分析类型且具有所述导入路径的数据仓库操作语句。进一步地,所述根据所述对应关系表,获取所述对应关系表中的每个数据仓库目的表对应的数据仓库来源表的表名,包括:对于所述对应关系表中的每条记录,获取所述记录中存储的数据仓库操作语句的语句标识和数据仓库目的表的表名;根据所述获取的语句标识获取数据仓库操作语句;解析所述获取的数据仓库操作语句,得到所述每个数据仓库目的表对应的数据仓库来源表的表名。进一步地,所述根据每个数据仓库目的表的表名和所述每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图,包括:在数据仓库表血缘关系图中,构建所述数据仓库目的表的表名对应的节点,并构建所述数据仓库目的表对应的数据仓库来源表的表名对应的节点;将所述数据仓库目的表的表名对应的节点作为所述数据仓库目的表对应的数据仓库来源表的表名对应的节点的子节点。进一步地,所述构建所述数据仓库目的表的表名对应的节点之后,所述方法还包括:将访问所述数据仓库目的表的数据仓库操作语句存储在所述数据仓库目的表的表名对应的节点中;将所述数据仓库表血缘关系图发送给终端,由所述终端显示给用户。另一方面,本专利技术提供了一种构建数据仓库表血缘关系图的装置,所述装置包括:解析模块,用于解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名;第一存储模块,用于将所述每个数据仓库操作语句的语句标识与访问的数据仓库目的表的表名的对应关系存储在对应关系表中;第一获取模块,用于根据所述对应关系表,获取所述对应关系表中的每个数据仓库目的表对应的数据仓库来源表的表名;构建模块,用于根据每个数据仓库目的表的表名和所述每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图。进一步地,所述解析模块,包括:第一解析单元,用于解析所述访问数据仓库的每个数据仓库操作语句,得到所述访问数据仓库的每个数据仓库操作语句对应的访问方式;获取单元,用于获取访问方式为写方式的数据仓库操作语句;第二解析单元,用于解析所述访问方式为写方式的数据仓库操作语句,得到所述访问方式为写方式的访问的所有数据仓库目的表的表名。进一步地,所述装置还包括:第二获取模块,用于获取任务类型为导入类型的数据仓库操作语句和与之对应的导入路径;第三获取模块,用于根据所述导入路径获取任务类型为分析类型且具有所述导入路径的数据仓库操作语句;绑定模块,用于绑定所述任务类型为导入类型的数据仓库操作语句和所述任务类型为分析类型且具有所述导入路径的数据仓库操作语句。进一步地,所述第一获取模块,包括:第一获取单元,用于对于所述对应关系表中的每条记录,获取所述记录中存储的数据仓库操作语句的语句标识和数据仓库目的表的表名;第二获取单元,用于根据所述获取的语句标识获取数据仓库操作语句;第三解析单元,用于解析所述获取的数据仓库操作语句,得到所述每个数据仓库目的表对应的数据仓库来源表的表名。进一步地,所述构建模块,包括:构建单元,用于在数据仓库表血缘关系图中,构建所述数据仓库目的表的表名对应的节点,并构建所述数据仓库目的表对应的数据仓库来源表的表名对应的节点;作为单元,用于将所述数据仓库目的表的表名对应的节点作为所述数据仓库目的表对应的数据仓库来源表的表名对应的节点的子节点。进一步地,所述装置还包括:第二存储模块,用于将访问所述数据仓库目的表的数据仓库操作语句存储在所述数据仓库目的表的表名对应的节点中;发送模块,用于将所述数据仓库表血缘关系图发送给终端,由所述终端显示给用户。在本专利技术实施例中,服务器解析访问数据仓库的每个数据仓库操作语句,得到每个数据仓库操作语句访问的数据仓库目的表的表名和每个数据仓库目的表对应的源数据仓库库表的表名,并根据每个数据仓库目的表的表名和每个数据仓库目的表对应的数据仓库来源表的表名,自动构建数据仓库表血缘关系图,减少了人工工作量,并且,提高了构建数据仓库表血缘关系的速度以及准确度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例1提供的一种构建数据仓库表血缘关系图的方法流程图;图2是本专利技术实施例2提供的一种构建数据仓库表血缘关系图的方法流程图;图3是本专利技术实施例3提供的一种构建数据仓库表血缘关系图的装置结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。实施例1本专利技术实施例提供了一种构建数据仓库表血缘关系图的方法。参见图1,其中,该方法包括:步骤101:解析访问数据仓库的每个数据仓库操作语句,得到每个数据仓库操作语句访问的数据仓库目的表的表名;步骤102:将每个数据仓库操作语句的语句标识与访问的数据仓库目的表的表名的对应关系存储在对应关系表中;步骤103:根据对应关系表,获取对应关系表中的每个数据仓库目的表对应的数据仓库来源表的表名;步骤104:根据每个数本文档来自技高网...
一种构建数据仓库表血缘关系图的方法和装置

【技术保护点】
一种构建数据仓库表血缘关系图的方法,其特征在于,所述方法包括:解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名;将所述每个数据仓库操作语句的语句标识与访问的数据仓库目的表的表名的对应关系存储在对应关系表中;根据所述对应关系表,获取所述对应关系表中的每个数据仓库目的表对应的数据仓库来源表的表名;根据每个数据仓库目的表的表名和所述每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图。

【技术特征摘要】
1.一种构建数据仓库表血缘关系图的方法,其特征在于,所述方法包括:解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名;获取任务类型为导入类型的数据仓库操作语句和与之对应的导入路径;根据所述导入路径获取任务类型为分析类型且具有所述导入路径的数据仓库操作语句;绑定所述任务类型为导入类型的数据仓库操作语句和所述任务类型为分析类型且具有所述导入路径的数据仓库操作语句;将所述任务类型为导入类型的数据仓库操作语句的语句标识和所述任务类型为分析类型且具有所述导入路径的数据仓库操作语句的语句标识与访问的数据仓库目的表的表名的对应关系存储在对应关系表中;对于所述对应关系表中的每条记录,获取所述记录中存储的数据仓库操作语句的语句标识和数据仓库目的表的表名;根据所述获取的语句标识获取数据仓库操作语句;解析所述获取的数据仓库操作语句,得到所述每个数据仓库目的表对应的数据仓库来源表的表名;根据每个数据仓库目的表的表名和所述每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图。2.如权利要求1所述的方法,其特征在于,所述解析访问数据仓库的每个数据仓库操作语句,得到所述每个数据仓库操作语句访问的数据仓库目的表的表名,包括:解析所述访问数据仓库的每个数据仓库操作语句,得到所述访问数据仓库的每个数据仓库操作语句对应的访问方式;获取访问方式为写方式的数据仓库操作语句;解析所述访问方式为写方式的数据仓库操作语句,得到所述访问方式为写方式的数据仓库操作语句访问的所有数据仓库目的表的表名。3.如权利要求1所述的方法,其特征在于,所述根据每个数据仓库目的表的表名和所述每个数据仓库目的表对应的数据仓库来源表的表名,构建数据仓库表血缘关系图,包括:在数据仓库表血缘关系图中,构建所述数据仓库目的表的表名对应的节点,并构建所述数据仓库目的表对应的数据仓库来源表的表名对应的节点;将所述数据仓库目的表的表名对应的节点作为所述数据仓库目的表对应的数据仓库来源表的表名对应的节点的子节点。4.如权利要求3所述的方法,其特征在于,所述构建所述数据仓库目的表的表名对应的节点之后,所述方法还包括:将访问所述数据仓库目的表的数据仓库操作语句存储在所述数据仓库目的表的表名对应的节点中;将所述数据仓库表血缘关系图发送给终端,由所述终端显示给用户。5.一种构建数据仓库表血缘关系图的装置,其特征在于,所述装置包括:解析模块,用于...

【专利技术属性】
技术研发人员:陈武刘超洪
申请(专利权)人:珠海多玩信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1