数据查询方法和装置制造方法及图纸

技术编号:15791987 阅读:256 留言:0更新日期:2017-07-09 22:53
本申请公开了一种数据查询方法和装置。其中,该方法包括:接收数据查询请求,其中,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;在目标数据表集合中包含雪花模型的数据表时,连接雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询待查询数据。本申请解决了现有的查询系统无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。

【技术实现步骤摘要】
数据查询方法和装置
本申请涉及数据分析领域,具体而言,涉及一种数据查询方法和装置。
技术介绍
在分析数据领域,数据模型通常包括星型模型和雪花模型,其中,星形模型的数据组织模式是:一张数据事实表,其它的表都是维度表,如时间维度,地理维度表等,维度表成辐射状分布在事实表的四周;雪花模型的数据组织模式是:一张事实表与维度表关联时需要经过中间事实表或中间维度表,这样构成了多层关联的关系,类似于雪花一样的形状,如通过产品名称去剖析会话相关数据时,得通过中间数据订单表来进行关联。即先需要通过产品查找出其对应的所有订单,再通过订单关联到其所有相关的会话,最终得到想要的结果。由于星型模型的主要数据都集中在事实表中,所以只要扫描事实表就可以进行数据查询,查询效率高,但会造成大量的数据冗余;而雪花模型能够在一定程度上减少存储空间,规范化的数据结构更容易更新和维度,然而,雪花模型由于比较复杂,用户不易理解,浏览内容相对困难,额外的连接将使查询性能下降。专利技术人发现,基于两种数据模型的优缺点,数据仓库可以采用星型模型和雪花模型结合的方式来组织数据,从而利用不同数据模型的优点,并降低其缺点带来的影响。然而,现有的很多数据查询系统例如Impala,还无法实现对星型模型和雪花模型结合的数据组织方式的数据仓库的查询,也就无法对该数据仓库中的数据进行多维度的剖析。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种数据查询方法和装置,以至少解决现有的查询系统无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。根据本申请实施例的一个方面,提供了一种数据查询方法,包括:接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;检测所述目标数据表集合中是否包含雪花模型的数据表;在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询所述待查询数据。进一步地,利用所述数据仓库中预先配置的元数据确定出目标数据表集合包括:在所述元数据中查询所述待查询数据的维度和指标;根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。进一步地,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表包括:通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。进一步地,根据连接的数据表查询所述待查询数据包括:根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;执行所述查询语句,查询得到所述待查询数据。进一步地,在接收数据查询请求之前,所述方法还包括:配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。根据本申请实施例的另一方面,还提供了一种数据查询装置,包括:接收单元,接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;确定单元,用于利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;检测单元,用于检测所述目标数据表集合中是否包含雪花模型的数据表;第一连接单元,用于在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;第二连接单元,用于通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及查询单元,用于根据连接的数据表查询所述待查询数据。进一步地,所述确定单元包括:查询模块,用于在所述元数据中查询所述待查询数据的维度和指标;确定模块,用于根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。进一步地,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,所述第二连接单元包括:连接模块,用于通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。进一步地,所述查询单元包括:生成模块,用于根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;执行模块,用于执行所述查询语句,查询得到所述待查询数据。进一步地,所述装置还包括:配置单元,用于在接收数据查询请求之前,配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。根据本申请实施例,接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表根据连接的数据表查询待查询数据。通过利用元数据配置数据表之间的关联关系,在进行数据查询时,可以利用元数据来连接雪花模型和星型模型的数据表,实现数据查询,解决了现有的查询系统无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的数据查询方法的流程图;图2是根据本申请实施例的数据查询装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本申请实施本文档来自技高网
...
数据查询方法和装置

【技术保护点】
一种数据查询方法,其特征在于,包括:接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;检测所述目标数据表集合中是否包含雪花模型的数据表;在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询所述待查询数据。

【技术特征摘要】
1.一种数据查询方法,其特征在于,包括:接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;检测所述目标数据表集合中是否包含雪花模型的数据表;在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询所述待查询数据。2.根据权利要求1所述的方法,其特征在于,利用所述数据仓库中预先配置的元数据确定出目标数据表集合包括:在所述元数据中查询所述待查询数据的维度和指标;根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。3.根据权利要求1所述的方法,其特征在于,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表包括:通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。4.根据权利要求1所述的方法,其特征在于,根据连接的数据表查询所述待查询数据包括:根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;执行所述查询语句,查询得到所述待查询数据。5.根据权利要求1所述的方法,其特征在于,在接收数据查询请求之前,所述方法还包括:配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。6.一种数据查询装置,其特征在于...

【专利技术属性】
技术研发人员:洪超
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1