当前位置: 首页 > 专利查询>中山大学专利>正文

一种数据表关联分析方法技术

技术编号:8022373 阅读:149 留言:0更新日期:2012-11-29 04:36
本发明专利技术公开了一种数据表关联分析方法,该方法包括:首先通过外键关联构建关系图,其次通过访问历史数据记录精简关系图,最后目标关系图进行比对得出最后的迁移图。在分析表之间的外键关联的基础之上,采用深度控制和访问历史数据分析出数据表之间的关联性,得出最优的迁移方案。所迁移的数据是必要的而又最少的。通过该方法能够简化数据分析过程,节约资源。

【技术实现步骤摘要】

本专利技术涉及数据处理
,尤其涉及。
技术介绍
一个系统平台因为安全或者升级改造,都可能涉及到数据的迁移。在数据迁移之前,往往需要考虑哪些表格是需要迁移的,这主要是因为数据之间的依赖关系导致的,这时候就需要用到数据表之间关联性分析的方法。在过去,主要还是借助人工的方式来进行数据表的选取,这样的缺点就是人为指定的表格不仅容易出错,而且可能导致指定不全,导致所迁移的数据不能够使用,或者可以不迁移的数据而又重复迁移,浪费资源。现行的对数据表之间的关联性分析主要还是依靠经验,人工的或者借助数据库外键关联的方式简单的选取依赖表格。现有技术的缺点是指定所依赖的表格容易指定错误, 或者制定不全,导致所迁移的数据不能正常使用;或者采用外键关联的方式,往往会导致数据关联面太大导致需要迁移的数据又过多,严重的造成数据的浪费。
技术实现思路
本专利技术的目的是为了克服现有技术的缺陷,提供,通过该方法能够简化数据分析过程,节约资源。在分析表之间的外键关联的基础之上,采用深度控制和历史访问数据分析出数据表之间的关联性,得出最优的迁移方案。所迁移的数据是必要的而又最少的。,该方法包括首先通过输入迁移表格,根据其外键关联找表和深度控制构建关系图,其次通过访问历史数据记录精简关系图,最后和目标关系图进行比对得出最后的迁移图。优选地,通过外键关联找表和深度控制构建关系图的具体步骤如下Stepll :输入表格A和深度控制变量n ;St印12 :将表格A生成图的第一个顶点,记为V,转St印13 ;Stepl3 :将顶点V加入到队列中,转Stepl4 ;Stepl4 :判断深度n是否大于0,如果是则转Stepl5,否则程序结束;St印15 :深度n减一,取出队列中的第一个元素,并记为V,转St印16 ;Stepl6 :将V依赖的表都生成图的节点,并加入到队列中,转Stepl4。优选地,将表格变成有向图,当读取到一个表格的时候,把表格当成一个节点。优选地,表节点的生成步骤为Step21 :获取表结构,生成一个根节点代表这个表,即一个顶点;St印22 :判断是否还有没有处理的列信息,如果有则转St印23,否则转结束程序;St印23 :读取下一列信息,根据列的关键字、类型,采用元数据描述;转St印24 ;Step24 :将列的元数据作为子节点挂载到这个表的节点上,转Step22。优选地,通过访问历史数据记录精简关系图的流程为Step31 :输入中心表格为A,输入关系图中的其他表格的访问数据;转Step32 ;Step32 :根据时间关联性对表格进行排序,看用户访问表格A时候同时会访问其他的哪些表格,时间的相近性越大,则表明这两个表之间的关联性越高,应该给予考虑;Step33 :将拓扑关联和时间关联性加权,拓扑关联指的是在关系图中的关系,如果两个顶点直接相连,则是强拓扑关联的,否则就是弱拓扑关联的;将二者进行加权,平衡二者的因素;转St印34 ;Step34:精简那些权值低并且不是联通点的节点,所谓的联通点就是删除该点会导致图的连通分量会增加,所以不能删除 ’转Step35 ;St印35 :精简结束输出精简后的关系图。优选地,与目标的关系图进行比对匹配的流程为 Step41 :输入目标图T和源图S,它们分别代表了目标数据库和源数据库中以要迁移表格为中心的一个关系图;转Step42 ;St印42 :选定图T和图S中的初始节点作为t0,sO,也就是要迁移的表格和需要迁移到的表格;转St印43;Step43 比对t0,sO的属性相似性,并生成属性转换规则,就是根据两个顶点的属性值,及用元数据表示的列类型等信息,进行比对,生成相应的转换规则 ’转Step44 ;Step44 :判断是否还有顶点未处理,如果是转Step45,否则结束程序;St印45 :以图的广度优先的方式遍历T,同时用S和它进行匹配;转St印46 ;St印46 :判断目标图T中没有源图S中的该节点,若是转St印47,否则转St印48 ;Step47 :制定需要在目标数据库上需要新建相应表格的规则;Step48 :判断属性不同。就是判断两个顶点的属性的相似性;如果有不同则转Step49,否则转 Step410 ;Step49 :制定属性级别的转换规则;Step410 :标记该顶点对应的表格为直接迁移,无需转换,转Step44。本专利技术技术方案带来的有益效果I、采用以有向图的形式表示表之间的关联性,能够简化数据分析过程;并且表现形式形象;而且可以再我们的抽象基础之上进行更多更为高级的分析;2、同时考虑两个表之间的拓扑关联性和时间访问的关联性更能反映两个表之间的关联强弱,使得所选取出的表格更具价值。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图I是本专利技术的方法流程图;图2是本专利技术中关系图的生成流程图;图3是本专利技术中表节点的生成流程图;图4是本专利技术中关系图的精简流程图5是本专利技术中与目标关系图的比对匹配流程图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供的,在分析表之间的外键关联的基础之上,采用深度控制和历史访问 数据分析出数据表之间的关联性,得出最优的迁移方案。所迁移的数据是必要的而又最少的。本专利技术的方法流程为通过外键关联构建关系图,通过访问历史数据记录精简关系图,和目标关系图进行比对得出最后的迁移图。如图I所示,具体如下Stepl :通过输入迁移表格,根据其外键生成表格之间的关系图。关系图是有向图,表格I指向表格2表不表格I依赖于表格2 ;在数据库中表现为表I中的一个外键是表2的主键。St印2 :通过对用户访问数据的分析,精简关系图。Step3 :与目标数据库的关系图进行比对,得出迁移方案。主要包含顶点属性的比对和边比对。上述图I说到根据外键生成表之间的关系图,接下来我们详细说明该步骤。这里主要包含了通过外键找表和深度控制。这里采用图的广度遍历算法进行处理,如图2所示,具体步骤如下Stepl :输入表格A和深度控制变量n ;St印2 :将表格A生成图的第一个顶点,记为V,转St印3 ;Step3 :将顶点V加入到队列中,转Step4 ;St印4 :判断深度n是否大于0,如果是则转Step5,否则程序结束;St印5 :深度n减一,取出队列中的第一个元素,并记为V,转St印6 ;Step6 :将V依赖的表都生成图的节点,并加入到队列中,转Step4.上述过程提到将表格变成有向图,当读取到一个表格的时候,把表当成一个节点。而其内部的属性,例如列的声明等就提取成该顶点的属性,后续的比对等就是通过这二者进行的。具体如图3所示,具体如下Stepl :获取表结构,生成一个根节点代表这个表,即一个顶点。St印2 :判断是否还有没有处理的列信息,如果有则转本文档来自技高网...

【技术保护点】
一种数据表关联分析方法,其特征在于,该方法包括:首先通过输入迁移表格,根据其外键关联找表和深度控制构建关系图,其次通过访问历史数据记录精简关系图,最后和目标关系图进行比对得出最后的迁移图。

【技术特征摘要】

【专利技术属性】
技术研发人员:罗笑南曾金龙韩冠亚林格
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1