生成描述信息的方法及装置制造方法及图纸

技术编号:16327177 阅读:23 留言:0更新日期:2017-09-29 19:03
本发明专利技术公开了一种生成描述信息的方法及装置。其中,该方法包括:获取多张数据表中每张数据表所包含的字段信息;根据字段信息确定多张数据表相互间的关联关系;利用多张数据表相互间的关联关系生成描述信息,其中,描述信息用于记录多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。本发明专利技术解决了相关技术中无法在给定若干张数据表且可获知数据表之间的关系的情况下,通过采用自动生成合法的表连接SQL语句的实现方式来完成数据分析的技术问题。

【技术实现步骤摘要】
生成描述信息的方法及装置
本专利技术涉及计算机领域,具体而言,涉及一种生成描述信息的方法及装置。
技术介绍
目前,随着大数据技术的迅猛发展,如何便于业务人员快速分析数据,是大数据应用需要解决的关键问题。业务人员经常需要基于基础数据进行各种统计分析,该过程通常需要编写SQL语句在数据库中运行。例如:对于基于多张数据表的统计分析,需要采用人工方式通过数据表的元信息来获取数据表之间的连接关系。假设第一张数据表包含有3个字段,其分别为:设备标识(ID)、日期以及设备状态;第二张数据表包含有2个字段,其分别为:设备ID和公司ID;第三张数据表包含有2个字段,其分别为:公司ID和公司名称,那么通过数据表的元信息可以获知,第一张数据表和第二张数据表可以通过“设备ID”加以连接,第二张数据表和第三张数据表可以通过“公司ID”加以连接,通过连接这三张数据表,可以分析出每个公司在预设时间段内(例如:最近1个月)发生的特定事件(例如:设备故障率)。对于casebycase的统计分析,表连接语句可以根据特定案例来编写,即业务人员需要为每个案例分别定制不同的SQL语句。然而,正是由于casebycase的统计分析方式需要针对每个案例分别编写SQL语句,由此易造成此种操作方式不仅工作效率较低,而且发生错误的概率较高。因此,相关技术中并没有提供在给定若干张数据表且可获知数据表之间的关系的情况下,如何通过采用自动生成合法的表连接SQL语句的实现方式来完成数据分析。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种生成描述信息的方法及装置,以至少解决相关技术中无法在给定若干张数据表且可获知数据表之间的关系的情况下,通过采用自动生成合法的表连接SQL语句的实现方式来完成数据分析的技术问题。根据本专利技术实施例的一个方面,提供了一种生成描述信息的方法,包括:获取多张数据表中每张数据表所包含的字段信息;根据字段信息确定多张数据表相互间的关联关系;利用多张数据表相互间的关联关系生成描述信息,其中,描述信息用于记录多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。可选地,根据字段信息确定多张数据表相互间的关联关系包括:选取步骤:从多张数据表中选取任意一张待遍历的数据表;查找步骤:查找与选取的数据表所包含的字段信息中具有一个或多个相同字段的数据表,并将查找到的数据表设置为选取的数据表的待连接数据表;在选取的数据表与待连接数据表之间建立关联关系;返回选取步骤,直至多张数据表被全部遍历。可选地,利用多张数据表相互间的关联关系生成描述信息包括:按照多张数据表相互间的关联关系从初始遍历的数据表开始依次获取下一个遍历的数据表的标识信息,与下一个遍历的数据表相邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件,其中,邻接的数据表为已经遍历过的数据表;采用获取到的下一个遍历的数据表的标识信息,邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件生成描述信息。可选地,采用获取到的下一个遍历的数据表的标识信息,邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件生成描述信息包括:先根据下一个遍历的数据表的标识信息和邻接的数据表的标识信息建立下一个遍历的数据表与邻接的数据表之间的关联关系后,再记录下一个遍历的数据表与邻接的数据表之间的连接条件,分别生成与已经遍历的数据表对应的分段连接信息;联合全部分段连接信息,生成描述信息。可选地,如果下一个遍历的数据表同时与多个数据表相邻接和/或下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段时,则记录的下一个遍历的数据表与邻接的数据表之间的连接条件是由下一个遍历的数据表与多个数据表相邻接所产生的连接条件和/或由下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段所产生的连接条件的并集。根据本专利技术实施例的另一方面,还提供了一种生成描述信息的装置,包括:获取模块,用于获取多张数据表中每张数据表所包含的字段信息;确定模块,用于根据字段信息确定多张数据表相互间的关联关系;生成模块,用于利用多张数据表相互间的关联关系生成描述信息,其中,描述信息用于记录多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。可选地,确定模块包括:选取单元,用于从多张数据表中选取任意一张待遍历的数据表;查找单元,用于查找与选取的数据表所包含的字段信息中具有一个或多个相同字段的数据表,并将查找到的数据表设置为选取的数据表的待连接数据表;建立单元,用于在选取的数据表与待连接数据表之间建立关联关系;返回选取单元,直至多张数据表被全部遍历。可选地,生成模块包括:获取单元,用于按照多张数据表相互间的关联关系从初始遍历的数据表开始依次获取下一个遍历的数据表的标识信息,与下一个遍历的数据表相邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件,其中,邻接的数据表为已经遍历过的数据表;生成单元,用于采用获取到的下一个遍历的数据表的标识信息,邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件生成描述信息。可选地,生成单元包括:第一生成子单元,用于先根据下一个遍历的数据表的标识信息和邻接的数据表的标识信息建立下一个遍历的数据表与邻接的数据表之间的关联关系后,再记录下一个遍历的数据表与邻接的数据表之间的连接条件,分别生成与已经遍历的数据表对应的分段连接信息;第二生成子单元,用于联合全部分段连接信息,生成描述信息。可选地,第一生成子单元,用于在下一个遍历的数据表同时与多个数据表相邻接和/或下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段时,则记录的下一个遍历的数据表与邻接的数据表之间的连接条件是由下一个遍历的数据表与多个数据表相邻接所产生的连接条件和/或由下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段所产生的连接条件的并集。在本专利技术实施例中,采用通过获取多张数据表中每张数据表所包含的字段信息并根据字段信息确定多张数据表相互间的关联关系的方式,利用多张数据表相互间的关联关系生成用于记录多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件的描述信息,达到了不需要人工参与便可以自动生成上述描述信息(例如:合法的表连接SQL语句)来完成数据分析的目的,从而实现了通过自动生成数据表之间相互关系的描述信息不仅提高了数据分析效率而且还提升了数据分析结果准确性的技术效果,进而解决了相关技术中无法在给定若干张数据表且可获知数据表之间的关系的情况下,通过采用自动生成合法的表连接SQL语句的实现方式来完成数据分析的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的一种生成描述信息的方法的计算机终端的硬件结构框图;图2是根据本专利技术实施例的生成描述信息的方法的流程图;图3是根据本专利技术优选实施例的在多张数据表的相互间建立完整的拓扑结构的示意图;图4是根据本专利技术优选实施例的生成描述信息的方法的示意图;图5是根据本专利技术实施例的生成描述信息的装置的结构框图;图6是根据本专利技术优选实施例的生成描本文档来自技高网...
生成描述信息的方法及装置

【技术保护点】
一种生成描述信息的方法,其特征在于,包括:获取多张数据表中每张数据表所包含的字段信息;根据所述字段信息确定所述多张数据表相互间的关联关系;利用所述多张数据表相互间的关联关系生成描述信息,其中,所述描述信息用于记录所述多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。

【技术特征摘要】
1.一种生成描述信息的方法,其特征在于,包括:获取多张数据表中每张数据表所包含的字段信息;根据所述字段信息确定所述多张数据表相互间的关联关系;利用所述多张数据表相互间的关联关系生成描述信息,其中,所述描述信息用于记录所述多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。2.根据权利要求1所述的方法,其特征在于,根据所述字段信息确定所述多张数据表相互间的关联关系包括:选取步骤:从所述多张数据表中选取任意一张待遍历的数据表;查找步骤:查找与选取的数据表所包含的字段信息中具有一个或多个相同字段的数据表,并将查找到的数据表设置为所述选取的数据表的待连接数据表;在所述选取的数据表与所述待连接数据表之间建立关联关系;返回所述选取步骤,直至所述多张数据表被全部遍历。3.根据权利要求2所述的方法,其特征在于,利用所述多张数据表相互间的关联关系生成所述描述信息包括:按照所述多张数据表相互间的关联关系从初始遍历的数据表开始依次获取下一个遍历的数据表的标识信息,与所述下一个遍历的数据表相邻接的数据表的标识信息以及所述下一个遍历的数据表与邻接的数据表之间的连接条件,其中,所述邻接的数据表为已经遍历过的数据表;采用获取到的所述下一个遍历的数据表的标识信息,所述邻接的数据表的标识信息以及所述下一个遍历的数据表与所述邻接的数据表之间的连接条件生成所述描述信息。4.根据权利要求3所述的方法,其特征在于,采用获取到的所述下一个遍历的数据表的标识信息,所述邻接的数据表的标识信息以及所述下一个遍历的数据表与所述邻接的数据表之间的连接条件生成所述描述信息包括:先根据所述下一个遍历的数据表的标识信息和所述邻接的数据表的标识信息建立所述下一个遍历的数据表与所述邻接的数据表之间的关联关系后,再记录所述下一个遍历的数据表与所述邻接的数据表之间的连接条件,分别生成与已经遍历的数据表对应的分段连接信息;联合全部分段连接信息,生成所述描述信息。5.根据权利要求4所述的方法,其特征在于,如果所述下一个遍历的数据表同时与多个数据表相邻接和/或所述下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段时,则记录的所述下一个遍历的数据表与所述邻接的数据表之间的连接条件是由所述下一个遍历的数据表与多个数据表相邻接所产生的连接条件和/或由所述下一个遍历的数据表与部分相邻接的数据表存在多个相...

【专利技术属性】
技术研发人员:殷琳君林沛坤罗净朱洪波
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1