一种基于ClickHouse的数据聚合方法以及装置制造方法及图纸

技术编号:33287830 阅读:31 留言:0更新日期:2022-04-30 23:58
本发明专利技术提供了一种基于ClickHouse的数据聚合方法以及装置,该方法包括:获取到数据立方体的维度结构,其中,维度结构包括至少两个维度,每个维度包括至少一个层级,每个层级包括至少一个成员;基于将维度结构中的每个维度的每个层级映射到ClickHouse明细数据底表中的相应字段,根据映射关系创建ClickHouse明细数据底表;向ClickHouse明细数据底表插入数据,并且设置ClickHouse明细数据底表中每个成员的权重;将ClickHouse明细数据底表进行聚合计算,得到聚合结果。解决了现有多层级成员维度的聚合计算方案不支持设置权重以及聚合计算效率低的技术问题。算效率低的技术问题。算效率低的技术问题。

【技术实现步骤摘要】
一种基于ClickHouse的数据聚合方法以及装置


[0001]本专利技术涉及数据处理领域,尤其是涉及一种基于ClickHouse的数据聚合方法以及装置。

技术介绍

[0002]近年,数字化驱动的业务转型是目前大多数企业的普遍需求。使用OLAP数据分析技术,可以帮助管理人员快速、准确地了解财务和运营结果是否达到预计目标,分析识别关键趋势,以此帮助企业快速调整,正确决策,获得更好的经营表现。
[0003]多层级成员维度上的聚合计算是OLAP数据分析产品的必备功能之一。现有的OLAP分析引擎产品有三大类:第一类是以Mondrian为代表的开源的基于关系型数据库的ROLAP产品,该类产品将OLAP数据模型中的多维立方体,维度,成员层级,成员等概念映射到关系型数据库中的星型模型的数据表上,计算时将OLAP分析场景转换成SQL在数据库上执行;第二类是以Kylin为代表的开源的基于Hadoop生态大数据平台的OLAP引擎,Kylin使用了预计算的机制,获取聚合数据前需要触发预计算;第三类是以IBM PA为代表的MOLAP产品,该产品是商业闭源产品。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于ClickHouse的数据聚合方法,其特征在于,所述方法包括:获取到数据立方体的维度结构,其中,所述维度结构包括至少两个维度,每个维度包括至少一个层级,每个层级包括至少一个成员;基于将所述维度结构中的每个维度的每个层级映射到ClickHouse明细数据底表中的相应字段,根据映射关系创建ClickHouse明细数据底表;向所述ClickHouse明细数据底表插入数据,并且设置所述ClickHouse明细数据底表中每个成员的权重;将所述ClickHouse明细数据底表进行聚合计算,得到聚合结果。2.根据权利要求1所述的方法,其特征在于,根据映射关系创建ClickHouse明细数据底表包括:基于映射关系按照预设顺序向二维表中添加与所述数据立方体中的每个维度的每个层级对应的字段以及度量值字段,其中,所述每个层级对应一个计算权重字段。3.根据权利要求1所述的方法,其特征在于,将所述ClickHouse明细数据底表进行聚合计算包括:基于所述ClickHouse明细数据底表中第一类型的维度的成员计算得到所述ClickHouse明细数据底表中的基础聚合数据;基于所述基础聚合数据计算得到所述ClickHouse明细数据底表中第二类型的维度中第一层级成员的第一加权聚合值,并且将所述第一加权聚合值存入预先创建的ClickHouse聚合结果表中;基于第N加权聚合值计算得到所述ClickHouse明细数据底表中第二类型的维度中第N+1层级成员的第N+1加权聚合值,并将第N+1加权聚合值存入所述ClickHouse聚合结果表中,其中,N∈[1,M

1],M为所述ClickHouse明细数据底表中第二类型维度的层级数,N、M均为正整数。4.根据权利要求3所述的方法,其特征在于,创建所述ClickHouse聚合结果表包括:按照预设顺序向二维表中添加所述第二类型的维度的各个层级对应的字段;向所述二维表中添加度量值字段,所述度量值字段用于存储各个聚合层级的加权聚合值。5.根据权利要求3所述的方法,其特征在于,所述第一类型的维度至少包括如下一项或者多项:年维度、月维度、日维度、物料细分维度、物料大类维度以及科目维度;所述第二类型的维度为组织维度。6.一种基于ClickHouse的数据聚合装置,其特征在于,所述装置包括:获取单元,用于获取到数据立方体的维度结构,其中,所述维度结构包括至少两个维度,每个维度包括至少一个层级,每...

【专利技术属性】
技术研发人员:屈恩
申请(专利权)人:北京元年科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1