The invention discloses a data processing method and device based on MOLAP. Including the data processing method: according to the fact and dimension tables to create data cube; record the data in a data cube based on dimension of all possible combinations of the data are pre calculated; the pre calculated results to the preservation of open source database, in order to query according to a pre calculated based on the results of the query results. Using the method mentioned above, the existing data query scheme can be optimized so that non technical personnel can also implement queries based on mass data.
【技术实现步骤摘要】
基于MOLAP的数据处理方法及装置
本专利技术实施例涉及数据处理
,尤其涉及基于MOLAP的数据处理方法及装置。
技术介绍
联机分析处理(OnlineAnalyticalProcessing,OLAP)系统是数据仓库系统最主要的应用,专门用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持。OLAP可以根据分析人员的要求进行大数据量的复杂查询处理,并且以一种直观的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。OLAP系统按照其存储器的数据存储格式可以分为关系OLAP(RelationalOLAP,ROLAP)、多维OLAP(MultidimensionalOLAP,MOLAP)和混合型OLAP(HybridOLAP,HOLAP)三种类型。其中,MOLAP将OLAP分析所用到的多维数据物理上存储为多维数组的形式,形成“立方体”的结构。传统的MOLAP引擎受到软硬件资源的限制,仅能处理千兆或<10太字节级别的数据,并且,在计算多维立方体的数据时,对服务器配置要求较高。同时,基于MOLAP针对海量数据实时查询时,常采用基于分布式系统基础架构的结构化查询语言(SQLonHadoop)方案,一方面,其时延高达数秒、数十秒乃至数十分钟,另一方面,针对一些列式数据库,通常只能根据行健进行快速查询,而列级别的查询则仅能在特定查询场景中使用。此外,在查询时,需要涉及SQL语句的编写,使得非技术人员无法进行查询。
技术实现思路
有鉴于此,本专利技术实施例提供一种基于MOLAP的数据处理方法及装置,以优化 ...
【技术保护点】
一种基于MOLAP的数据处理方法,其特征在于,包括:根据事实表和维度表创建数据立方体;基于所述数据立方体中记录的数据,对维度的全部可能组合进行数据预计算;将预计算结果保存至开源数据库中,以便在查询时根据预计算结果确定查询结果。
【技术特征摘要】
1.一种基于MOLAP的数据处理方法,其特征在于,包括:根据事实表和维度表创建数据立方体;基于所述数据立方体中记录的数据,对维度的全部可能组合进行数据预计算;将预计算结果保存至开源数据库中,以便在查询时根据预计算结果确定查询结果。2.根据权利要求1所述的数据处理方法,其特征在于,根据事实表和维度表创建数据立方体包括:根据预设的数据分析模型中对事实表和维度表的表项需求,创建对应的事实表和维度表;按照所述事实表和维度表的表项需求,将外部数据库中的数据导入至事实表和维度表中;根据所述数据分析模型中的元数据,利用所述事实表和所述维度表创建数据立方体,其中,所述元数据用于指示所述数据立方体的属性参数和创建规则。3.根据权利要求1所述的数据处理方法,其特征在于,基于所述数据立方体中记录的数据,对维度的全部可能组合进行数据预计算,包括:根据数据分析模型中的元数据,启动预计算编程模型任务,并读取与所述数据立方体对应的全部维度表和事实表的数据;将所述全部维度表的维度进行排列组合,得到包括空集在内的全部可能组合;按照设定的聚合规则,对包含全部维度的组合进行聚合运算,得到聚合值;将包含全部维度的组合作为预计算编程模型的关键值输入,将所述聚合值作为预计算编程模型的关键字输入;利用所述预计算编程模型得到新的维度组合以及与新的维度组合对应的聚合值;依次将新的维度组合作为预计算编程模型的关键值输入,新的维度组合对应的聚合值作为预计算编程模型的关键字输入,并利用所述预计算编程模型得到新的维度组合以及与新的维度组合对应的聚合值,直到得到全部可能组合以及全部可能组合的聚合值为止。4.根据权利要求1所述的数据处理方法,其特征在于,将预计算结果保存至开源数据库中包括:创建用于存储预计算结果的开源数据库表;启动存储编程模型任务,将预计算结果作为所述存储编程模型任务的输入;利用所述存储编程模型生成对应的二进制格式文件;利用开源数据库的BulkLoad,将二进制格式文件导入至所述开源数据库表中,以实现在开源数据库中存储所述预计算结果;保存所述预计算结果与所述开源数据库表的对应关系至所述数据分析模型的元数据中。5.根...
【专利技术属性】
技术研发人员:李寅威,
申请(专利权)人:广州视源电子科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。