The invention discloses a data query method and device. Among them, the method includes: obtaining the large dimension in the metadata, in which the large dimension is the dimension that the unique value is greater than the default threshold, the metadata includes the unique value of the dimension and dimension, the metadata records the correspondence between the dimension and the unique value, and finds the same target dimension as the large dimension in the query record, and will be the same as the large dimension. The target dimension of the same dimension is the corresponding index of the large dimension, in which the relationship between the target dimension and the target is recorded in the query record, and the data generation aggregation table is selected from the fact table according to the large dimension and its corresponding index, and the query is related to the large dimension and the index in the aggregation table. Data. The invention solves the technical problem of low efficiency of data query by aggregating tables generated directly by aggregating tables based on large dimensions.
【技术实现步骤摘要】
数据的查询方法及装置
本专利技术涉及数据处理领域,具体而言,涉及一种数据的查询方法及装置。
技术介绍
在联机分析处理领域里,我们经常碰到一些大维度,例如channel(渠道),url(网页)等,很多时候我们需要对这些大维度做分组剖析,然后去看对应指标的前N个,也就是看前N个此维度的值以及指标,例如看维度url,通过页面浏览量指标来看,看前10个浏览量最多的url页面是哪些,用于指导网站运营或是业务优化。联机分析处理面临的一个问题是大维度做分组剖析时的性能开销,常见的传统方式是通过聚合表的联机分析处理的思路来解决,但是预聚合后,由于url等大维度的唯一值太多,导致其查询性能缓慢。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据的查询方法及装置,以至少解决根据大维度直接生成聚合表导致的通过聚合表进行数据查询效率低的技术问题。根据本专利技术实施例的一个方面,提供了一种数据查询方法,包括:获取元数据中的大维度,其中,所述大维度为唯一值大于等于预设阈值的维度,所述元数据包括维度和维度的唯一值,所述元数据记录了所述维度与所述唯一值的对应关系;在查询记录中查找与所述大维度相同的目标维度,并将与所述大维度相同的所述目标维度对应的指标作为所述大维度对应的指标,其中,所述查询记录中记录了所述目标维度与所述指标的对应关系;根据所述大维度及其对应的指标从事实数据表中选取预设数量的数据生成聚合表;在所述聚合表中查询与所述大维度和所述指标相关的数据。进一步地,根据所述大维度及其对应的指标从事实数据表中选取预设数量的数据生成聚合表包括:按照所述大维 ...
【技术保护点】
1.一种数据的查询方法,其特征在于,包括:获取元数据中的大维度,其中,所述大维度为唯一值大于等于预设阈值的维度,所述元数据包括维度和维度的唯一值,所述元数据记录了所述维度与所述唯一值的对应关系;在查询记录中查找与所述大维度相同的目标维度,并将与所述大维度相同的所述目标维度对应的指标作为所述大维度对应的指标,其中,所述查询记录中记录了所述目标维度与所述指标的对应关系;根据所述大维度及其对应的指标从事实数据表中选取预设数量的数据生成聚合表;在所述聚合表中查询与所述大维度和所述指标相关的数据。
【技术特征摘要】
1.一种数据的查询方法,其特征在于,包括:获取元数据中的大维度,其中,所述大维度为唯一值大于等于预设阈值的维度,所述元数据包括维度和维度的唯一值,所述元数据记录了所述维度与所述唯一值的对应关系;在查询记录中查找与所述大维度相同的目标维度,并将与所述大维度相同的所述目标维度对应的指标作为所述大维度对应的指标,其中,所述查询记录中记录了所述目标维度与所述指标的对应关系;根据所述大维度及其对应的指标从事实数据表中选取预设数量的数据生成聚合表;在所述聚合表中查询与所述大维度和所述指标相关的数据。2.根据权利要求1所述的方法,其特征在于,根据所述大维度及其对应的指标从事实数据表中选取预设数量的数据生成聚合表包括:按照所述大维度对所述事实数据表进行分组;按照所述指标对所述事实数据表中的数据进行排序,得到分组排序后的数据;从分组排序后的数据中选取出排序靠前的预设数量的数据;根据选取出的所述预设数量的数据生成聚合表。3.根据权利要求1所述的方法,其特征在于,获取元数据中的大维度包括:获取所述元数据,其中,所述元数据包括维度和维度的唯一值,所述维度与所述唯一值相对应;查找所述元数据中所述唯一值大于等于预设阈值的维度;将所述元数据中所述唯一值大于等于预设阈值的维度作为所述大维度。4.根据权利要求1-3任一项所述的方法,其特征在于,在所述聚合表中查询与所述大维度和所述指标相关的数据包括:获取查询条件,所述查询条件包括查询维度和查询指标;判断所述聚合表中是否包括与所述查询维度一致的大维度;如果判断出包括与所述查询维度一致的大维度,则判断所述查询指标与生成所述聚合表时的指标是否一致,并且判断所述查询指标的排列次序与生成所述聚合表时的指标的排列次序是否一致;如果判断出所述查询指标与生成所述聚合表时的指标一致,并且判断出所述查询指标的排列次序与生成所述聚合表时的指标的排列次序一致,则按照所述查询维度和所述查询指标在所述聚合表中查询数据。5.根据权利要求4所述的方法,其特征在于,在判断所述聚合表中是否包括与所述查询维度一致的大维度之后,所述方法还包括:如果判断出所述聚合表中不包括与所述查询维度一致的大维度,则按照所述查询维度和所述查询指标从所述事实数据表中查询数据;或者如果判断出所述查询指标与生成所述聚合表时的指标不一致,或者判断出所述查询指标的排列次序与生成所述聚合表时的指标的排列次序不一致,则按照所述查询维度和所述查询指标从所述事实数据表中查询数据。6.一种数据的查询装置,其特征在于,包括:获...
【专利技术属性】
技术研发人员:洪超,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。