基于数据仓库构建主题模型的方法、装置以及存储介质制造方法及图纸

技术编号:31455245 阅读:38 留言:0更新日期:2021-12-18 11:21
本申请公开了一种基于数据仓库构建主题模型的方法、装置以及存储介质。其中,该方法包括:接收用于创建主题模型的主题模型参数信息,其中主题模型用于通过面向主题的方式对数据仓库中与预定业务相关的数据进行分析;根据主题模型参数信息,确定用于创建主题模型的指标模型,其中指标模型为用于对预定业务进行分析的指标所对应的逻辑模型;根据指标模型创建主题模型;创建与主题模型绑定的物理模型以及在物理数据库中创建与物理模型绑定的数据表结构,其中数据表结构用于构建数据仓库;以及执行与数据表结构相关的ETL任务,生成与主题模型相关的数据。模型相关的数据。模型相关的数据。

【技术实现步骤摘要】
基于数据仓库构建主题模型的方法、装置以及存储介质


[0001]本申请涉及数据仓库
,特别是涉及一种基于数据仓库构建主题模型的方法、装置以及存储 介质。

技术介绍

[0002]数据仓库中的主题是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象 概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所 涉及的分析对象。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。
[0003]现有的主题构建方式是由技术人员根据业务需求分析相关数据而建立的相关表结构及数据,主题只 包含技术元素也就是主题的表结构与表关系,缺少业务元素,在这个基础上进行数据分析,需要相关专 业技术人员才能进行。并且主题的开发周期也比较长,由分析业务需求、到数据结构设计、再到ETL任 务开发、再到测试数据、最终部署上线经过了长时间的周期开发,而且因为主题没有与业务关联,缺少 业务元素,所以技术人员与业务人员比较难达成一致性。
[0004]针对现有的主题构建方式所存在的缺少业务元素,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数据仓库构建主题模型的方法,其特征在于,包括:接收用于创建主题模型的主题模型参数信息,其中所述主题模型用于通过面向主题的方式对数据仓库中与预定业务相关的数据进行分析;根据所述主题模型参数信息,确定用于创建所述主题模型的指标模型,其中所述指标模型为用于对所述预定业务进行分析的指标所对应的逻辑模型;根据所述指标模型创建所述主题模型;创建与所述主题模型绑定的物理模型以及在物理数据库中创建与所述物理模型绑定的数据表结构,其中所述数据表结构用于构建所述数据仓库;以及执行与所述数据表结构相关的ETL任务,生成与所述主题模型相关的数据。2.根据权利要求1所述的的方法,其特征在于,还包括:根据所述主题模型参数信息,确定与所述主题模型相关联的汇总粒度,其中所述汇总粒度用于对根据所述主题模型所确定的数据进行汇总;以及根据所述主题模型参数信息,确定与所述主题模型相关联的数据范围,其中所述数据范围用于对根据所述主题模型所确定的数据进行筛选,并且其中根据所述指标模型创建所述主题模型的操作,包括:根据所述指标模型、所述汇总粒度以及所述数据范围,创建所述主题模型。3.根据权利要求2所述的方法,其特征在于,在所述指标模型为单个指标模型的情况下,确定与所述主题模型相关联的汇总粒度的操作,包括:确定所述指标模型的维度,其中所述指标模型的维度用于确定所述指标模型的统计粒度;以及根据所述主题模型参数信息,从所述指标模型的维度中选取至少一部分维度确定所述汇总粒度。4.根据权利要求2所述的方法,其特征在于,在所述指标模型为多个指标模型的情况下,确定与所述主题模型相关联的汇总粒度的操作,包括:确定所述多个指标模型的维度,其中多个指标模型的维度用于确定所述多个指标模型的统计粒度;根据所述多个指标模型的维度,确定所述多个指标模型的公共维度,其中所述公共维度为所述多个指标模型所公有的维度;以及根据所述主题模型参数信息,从所述公共维度中选取至少一部分维度确定所述汇总粒度。5.根据权利要求2所述的方法,其特征在于,确定与所述主题模型相关联的数据范围的操作,包括:接收用于确定所述数据范围的SQL条件;以及根据SQL条件,对所述指标模型相关联的数据进行筛选,确定与所述主题模型相关联的数据范围。6.根据权利要求2所述...

【专利技术属性】
技术研发人员:宁任声
申请(专利权)人:北京滴普科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1