The invention relates to a OLAP pre calculation model, automatic modeling and automatic modeling system, the model includes: dimension module, polymerization module, measurement module; the method comprises: statistical data on all data sources, statistic data; according to the user to set the data model and the query preview of the target query for example, to determine the business model; query preview, collection and query statistics; physical modeling, and the definition of pre computed model dimensions, measurement, polymerization group; get the business modeling results; forecasting model; the system includes: data statistics module, service module, query statistics module, modeling module. By adding the derived dimensions, polymerization group, the pre calculated dimensions are combined effectively, reduce the redundant computing and data storage, has higher computational efficiency and smaller storage, so as to achieve better results in the application of analysis in multidimensional data.
【技术实现步骤摘要】
一种OLAP预计算模型、自动建模方法及自动建模系统
本专利技术涉及OLAP多维数据分析的
,尤其涉及一种OLAP预计算模型、自动建模方法及自动建模系统。
技术介绍
在信息化和数据化的时代,如何对数据进行多维分析以进行决策支持,是商务智能和数据挖掘领域的重要课题,OLAP(尤其是MOLAP)就是为了解决这一问题而产生的。一般情况下,数据仓库的数据量较大,直接在大量数据上进行多维聚合运算需要耗费大量的计算资源,以及过长的查询耗时。OLAP提供了一种基于预计算提高多维分析效率的解决方案,即通过实现一个“数据立方体”对数据仓库中的数据按不同的维度组合进行预聚合,并把结果保存下来;当分析师进行实际业务查询时,无需重新对数据执行聚合运算,而是直接读取预计算结果,这使得对百万甚至上亿数据规模的分析变得可能。OLAPCube(数据立方体)是数据仓库中对于多维分析数据模型的抽象,包含了多维分析中不同的维度组合,例如,下图6所示中包含了4个维度,分别是time、item、location、supplier,这4个维度间不同的组合构成OLAPCube中的不同节点,每个节点代表在这些维度组合下的度量聚合结果。当用户进行多维分析时,所选定的维度组合对应Cube中的一个点,考量的数值就是节点背后的度量聚合结果。在常见的OLAP解决方案中,为了更加快速地对选定维度进行分析,会对OLAPCube进行物化,即提前通过预计算将OLAPCube上每个节点的度量进行聚合,并把结果保存起来。当业务分析人员执行查询时,系统可以直接对预计算结果进行返回。把O(N)级别的聚合运算转化成O(1)的结 ...
【技术保护点】
一种OLAP预计算模型,其特征在于,该预计算模型包括:维度模块、聚合组模块、度量模块;所述的维度模块包括普通维度单元和衍生维度单元;所述普通维度单元,用于对事实表上的字段进行预计算;所述衍生维度单元,用于对维表上的主键进行预计算,并记录维表上的列和主键的映射关系;所述衍生维度单元中的衍生维度的维表主键和所述普通维度单元中的普通维度作为预计算维度,符合特定排列顺序;所述聚合组模块,用于将在维度模块中预计算维度划分成多个聚合组;所述度量模块,用于按照维度模块中所有预计算维度的组合聚合生成预计算结果。
【技术特征摘要】
1.一种OLAP预计算模型,其特征在于,该预计算模型包括:维度模块、聚合组模块、度量模块;所述的维度模块包括普通维度单元和衍生维度单元;所述普通维度单元,用于对事实表上的字段进行预计算;所述衍生维度单元,用于对维表上的主键进行预计算,并记录维表上的列和主键的映射关系;所述衍生维度单元中的衍生维度的维表主键和所述普通维度单元中的普通维度作为预计算维度,符合特定排列顺序;所述聚合组模块,用于将在维度模块中预计算维度划分成多个聚合组;所述度量模块,用于按照维度模块中所有预计算维度的组合聚合生成预计算结果。2.根据权利要求1所述的一种OLAP预计算模型,其特征在于,所述的聚合组模块包括:必须维度单元、组合维度单元、层级维度单元、维数范围单元;所述的必须维度单元,用于记录包含某一特定维度A的所有维度组合;所述的组合维度单元,用于记录包含某一特定组合维度AB的所有维度组合;所述的层级维度单元,用于记录包含具有层级关系的某一特定组合维度ABC的所有维度组合;所述维数范围单元,用于记录包含维度数量在一定范围的所有维度组合;所述的聚合组模块在将维度模块中的所有预计算维度划分成多个聚合组,同时保存维度模块中的所有预计算维度,用于对不同聚合组之间的的多维查询。3.一种基于权利要求1-2所述的一种OLAP预计算模型的自动建模方法,其特征在于,该方法包括如下步骤:S1,根据用户给定的数据模型和数据源进行数据统计,得到数据统计结果;S2,根据用户所给定的数据模型以及目标查询进行查询预演,确定业务模型;S3,对样例进行查询预演,并收集查询统计;S4,基于S2中的业务模型以及S1中数据统计结果,进行物理建模,并定义预计算模型的维度、度量、聚合组;S5,基于S3中的查询统计对S4中进行物理建模后的模型进行调整,得到业务建模结果;S6,对S5中的业务建模进行优化调整,得到预计算模型。4.根据权利要求3所述的一种基于OLAP预计算模型的自动建模方法,其特征在于,所述S4中的物理建模包括:维度设置、度量设置、聚合组设置。5.根据权利要求4所述的一种基于OLAP预计算模型的自动建模方法,其特征在于,所述的维度设置包括:普通维度设置和衍生维度设置,计算每一个维度的F(i)值,如果F(i)小于指定阀值,则设置为第i个维度为衍生维度,否则设置为普通维度;其中,定义函数F(i)=CD(col_i)/CD(PK),其中CD(col_i)是第i个维度的基数,CD(PK)是主键基数。衍生维度主键和普通维度作为预计算维度,根据基数按从大到小顺序排列。6.根据权利要求4所述的一种基于OLAP预计算模型的自动建模方法,其特征在于,所述...
【专利技术属性】
技术研发人员:李栋,
申请(专利权)人:上海跬智信息技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。