字段顺序一致性检测方法和装置制造方法及图纸

技术编号:15329548 阅读:58 留言:0更新日期:2017-05-16 13:12
本申请实施例公开了一种字段顺序一致性检测方法和装置。所述方法包括:获取目标数据表中第一顺序的字段属性;获取预设数据中第二顺序的字段属性;基于所述第一顺序的字段属性和所述第二顺序的字段属性,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。本申请实施例的方法和装置可以提高检测的效率。

Method and device for detecting sequence consistency of field

The embodiment of the present application discloses a method and a device for detecting sequence consistency of a field. The method includes: acquiring target field attribute data table first order; obtain a predetermined sequence in the second data field properties; field attribute field attribute of the first order and the second order based on the judgment of the target data table fields in a sequence and a preset number according to the order of the fields are the same. The method and the device of the application can improve the efficiency of the detection.

【技术实现步骤摘要】
字段顺序一致性检测方法和装置
本申请涉及计算机
,特别涉及一种字段顺序一致性检测方法和装置。
技术介绍
在目前的大数据时代,一般采用数据表对海量的数据进行存储和管理。在一些情况下,需要将预设数据保存至目标数据表中。所述预设数据可以包括从原数据表获取并按照预设规则处理后的数据。例如,从原数据表中获取数据,并按照预设规则处理所述数据,然后将处理后的数据保存至目标数据表中。在保存的过程中,可能出现预设数据中的字段顺序与目标数据表中的字段顺序不一致的问题,从而使目标数据表的数据产生混乱。因此,需要检测预设数据中的字段顺序与目标数据表的字段顺序,以使二者保持一致。现有技术中,通常采用人工的方式检测预设数据中的字段顺序与目标数据表中的字段顺序是否一致。即,采用人工的方式获取目标数据表的字段顺序,以及从预设数据对应的计算机语句中获取预设数据的字段顺序,然后检测预设数据中的字段顺序与目标数据表中的字段顺序是否一致。但是,人工检测通常成本较高并且效率较低,并且很容易出现遗漏或错误。
技术实现思路
本申请实施例的目的是提供一种字段顺序一致性检测方法和装置,以提高检测的效率和准确性。为解决上述技术问题,本申请实施例提供一种字段顺序一致性检测方法和装置是这样实现的:一种字段顺序一致性检测方法。所述方法包括:获取目标数据表中第一顺序的字段属性;获取预设数据中第二顺序的字段属性;基于所述第一顺序的字段属性和所述第二顺序的字段属性,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。一种字段顺序一致性检测装置。所述装置包括:第一获取模块,用于获取目标数据表中第一顺序的字段属性;第二获取模块,用于获取预设数据中第二顺序的字段属性;判断模块,用于基于所述第一顺序的字段属性和所述第二顺序的字段属性,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。由以上本申请实施例提供的技术方案可见,与现有技术相比,本申请实施例可以通过计算机直接获取预设数据中按序排列的字段属性,以及目标数据表中按序排列的字段属性。通过将预设数据中按序排列的字段属性与目标数据表中按序排列的字段属性进行对比,可以快速检测目标数据表中字段的顺序与预设数据中字段的顺序是否一致,从而提高了检测的效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例一种字段顺序一致性检测方法的流程图;图2为本申请实施例第二SQL语句中查询语句的语法树示意图;图3为本申请实施例对于预设数据中与目标数据表中不相同的字段,从目标数据表中获取与其最相似的字段的方法的流程图;图4为本申请实施例一种字段顺序一致性检测装置的功能结构示意图。具体实施方式本申请实施例提供一种字段顺序一致性检测方法和装置。在本申请的说明书中:字段一般指数据表中的列。在数据表中,每一列一般称为一个字段。为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。上述字段顺序不一致的问题通常出现在对数据表进行ETL(Extract/Transform/Load,抽取/转换/装载)的过程中。ETL通常是通过预设规则,将分布的、异构数据源中的数据,如关系数据和平面数据等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。在对数据表进行ETL操作的过程中,由于工程师的失误,或者工程师对字段的名称理解有误,有可能使ETL处理后的数据中的字段顺序与目标数据表真实的字段顺序不一致。这样,当将处理后的数据保存至目标数据表后,目标数据表的数据会产生混乱。例如,对于如下的第一SQL(StructuredQueryLanguage,结构化查询语言)语句:其语义为从数据表a的col2、col3、cat_level2、cat_level1和initiative_id字段中获取数据,然后将获取的数据以col2、col3、cat_level2、cat_level1和initiative_id的字段顺序保存至目标数据表result_table中。但是,目标数据表result_table的真实字段顺序可能为col2、col3、cat_level1、cat_level2和initiative_id。这样,上述第一SQL语句对应的预设数据中的字段顺序与目标数据表result_table中的字段顺序不一致。那么,在执行上述第一SQL语句后,可以将数据表a的cat_level2字段中的数据保存至目标数据表result_table的cat_level1字段中,同时将数据表a的cat_level1字段中的数据保存至目标数据表result_table的cat_level2字段中,从而使目标数据表中的数据产生混乱。本申请实施例提供一种字段顺序一致性检测方法和装置,可以目标数据表中字段的顺序与预设数据中字段的顺序是否一致。下面介绍所述方法的一个实施例。如图1所示,该实施例可以包括:S101:获取目标数据表中第一顺序的字段属性。本实施方式中,一些情况下,可能需要将获取的数据保存至数据表中。那么,所述目标数据表可以包括保存获取的数据的数据表。例如,可以从原数据表中获取数据,然后将获取的数据保存至目标数据表中,或者,对从原数据表中获取的数据进行处理,将处理后的数据保存至目标数据表中。本实施方式中,步骤S101所述的字段属性可以包括字段名称和数据类型。目标数据表一般可以包括1个或多个字段,其中,每个字段可以具有名称和数据类型。本实施方式中,目标数据表中每个字段的数据类型通常为目标数据表所具有的字段数据类型种类中的一种。一般地,数据表所具有的字段数据类型种类一般与数据表所属的数据管理系统相对应。相同的数据管理系统,数据表所具有的字段数据类型种类一般是相同的。不同的数据管理系统,数据表所具有的字段数据类型种类可以相同,也可以不同。例如,当数据管理系统为MicrosoftAccess时,数据表所具有的字段数据类型种类可以包括整型(Integer)、长整型(Long)、单精度浮点型(Single)、双精度浮点型(Double)和货币类型(Currency)等。那么,该数据表中每个字段的数据类型可以包括以上字段数据类型种类中的一种。本实施方式中,目标数据表中每个字段的名称可以包括第一名称。所述第一名称可以包括从第一元数据信息(meta信息)中获取的字段名称。其中,所述第一元数据信息为目标数据表的元数据信息。数据表的元数据信息一般在建立数据表时,由数据表所属的数据管理系统生成,用于管理数据表的属性信息。在另一个实施方式中,目标数据表中部分或全部字段的名称还可以包括第三名称。具体地,为了使用方便,用户可以对目标数据表本文档来自技高网
...
字段顺序一致性检测方法和装置

【技术保护点】
一种字段顺序一致性检测方法,其特征在于,包括:获取目标数据表中第一顺序的字段属性;获取预设数据中第二顺序的字段属性;基于所述第一顺序的字段属性和所述第二顺序的字段属性,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。

【技术特征摘要】
1.一种字段顺序一致性检测方法,其特征在于,包括:获取目标数据表中第一顺序的字段属性;获取预设数据中第二顺序的字段属性;基于所述第一顺序的字段属性和所述第二顺序的字段属性,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。2.如权利要求1所述的方法,其特征在于,所述第一顺序的字段属性和所述第二顺序的字段属性包括字段名称,相应地,所述基于所述第一顺序的字段属性和所述第二顺序的字段属性,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致,具体包括:基于所述第一顺序的字段名称和所述第二顺序的字段名称,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。3.如权利要求2所述的方法,其特征在于,所述基于所述第一顺序的字段名称和所述第二顺序的字段名称,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致,具体包括:根据所述第一顺序的字段名称,确定用于判断的目标候选名称;根据所述第二顺序的字段名称,确定用于判断的预设候选名称;根据所述目标候选名称与所述预设候选名称,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。4.如权利要求3所述的方法,其特征在于,所述第一顺序的字段名称包括,根据第一元数据信息获取的第一名称,所述第一元数据信息包括目标数据表的元数据信息,相应地,所述目标候选名称采用所述第一名称。5.如权利要求4所述的方法,其特征在于,所述第一顺序的字段名称还包括,根据所述第一名称获取的第三名称,相应地,所述目标候选名称采用所述第一名称和所述第三名称。6.如权利要求3所述的方法,其特征在于,所述预设数据包括从原数据表获取的并按照预设规则处理后的数据,所述第二顺序的字段名称包括,预设规则中处理从原数据表获取的数据时使用的名称,相应地,所述预设候选名称采用所述第二名称。7.如权利要求6所述的方法,其特征在于,所述第二顺序的字段名称还包括,根据所述第二名称获取的第四名称,相应地,所述预设候选名称采用所述第二名称和所述第四名称。8.如权利要求2所述的方法,其特征在于,所述基于所述第一顺序的字段名称和所述第二顺序的字段名称,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致,具体包括:在所述第一顺序的字段名称与所述第二顺序的字段名称不相同时,判断目标数据表中字段的顺序与预设数据中字段的顺序不一致。9.如权利要求2所述的方法,其特征在于,所述基于所述第一顺序的字段名称和所述第二顺序的字段名称,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致,具体包括:在所述第一顺序的字段名称与所述第二顺序的字段名称相同时,判断目标数据表中字段的顺序与预设数据中字段的顺序一致。10.如权利要求2所述的方法,其特征在于,所述基于所述第一顺序的字段名称和所述第二顺序的字段名称,判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致,具体包括:计算第一顺序的字段名称与第二顺序中相对应的字段名称的相似度值;根据所述相似度值判断目标数据表中字段的顺序与预设数据中字段的顺序是否一致。11.如权利要求10所述的方法,其特征在于,所述根据所述相似度值判断目标...

【专利技术属性】
技术研发人员:蔡聪林力
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1