一种基于动态交叉表的多维数据实时分析方法技术

技术编号:19140495 阅读:29 留言:0更新日期:2018-10-13 08:43
本发明专利技术公开了一种基于动态交叉表的多维数据实时分析方法,属于数据分析技术领域,在前端采用分析向导的形式,自主选择指标和维度;在后台采用SSAS方式,动态地创建CUBE;该方法实现步骤如下:S1:数据整理,包括体系事实表和维度表;S2:通过指标工具将指标、维度和量度包含到指标体系内;S3:通过语义对象设计器对所有维度加以描述,将维度进行分组和分级;S4:通过分析向导自助完成体系与指标、维度和量度的包含关系;S5:选择所要分析的指标和维度,形成实时分析表。本发明专利技术大大提高数据处理和分析的性能,弥补关系型交叉表多维分析性能上的不足,使分析更加灵活高效,满足不同的业务场景。

A real time analysis method for multidimensional data based on dynamic intersection table

The invention discloses a multi-dimensional data real-time analysis method based on dynamic crosstab, which belongs to the technical field of data analysis. In the front end, an analysis wizard is adopted to select the index and dimension independently; in the background, a CUBE is created dynamically by adopting SSAS mode; the method realizes the following steps: S1: data processing, including system affairs. Solid tables and dimension tables; S2: Include metrics, dimensions and metrics into the metrics system through the metrics tool; S3: Describe all dimensions through the semantic object designer, group and grade the dimensions; S4: Analyze the inclusion relationship between the self-completion system and metrics, dimensions and metrics through the analysis wizard; S5: Select the desired score. Analysis of indicators and dimensions, form a real-time analysis table. The method greatly improves the performance of data processing and analysis, compensates for the deficiency of multi-dimensional analysis performance of relational crosstab, makes analysis more flexible and efficient, and satisfies different business scenarios.

【技术实现步骤摘要】
一种基于动态交叉表的多维数据实时分析方法
本专利技术涉及数据分析
,具体地说是一种基于动态交叉表的多维数据实时分析方法。
技术介绍
随着时代的发展,大数据的逐步广泛应用,企业数据量的增加,传统关系型的BI(BusinessIntelligence,商业智能)分析弊端开始显现。现有的关系型分析模型比较固化,是面向单个主题的,而主题确定了分析指标、维度的范围,关系型数据分析是基于SELECT语句查询后的临时表,在大数据量时,存在诸多性能问题,进而造成用户体验不佳,因而不能满足业务需求。
技术实现思路
本专利技术的技术任务是针对以上不足之处,提供一种基于动态交叉表的多维数据实时分析方法,通过动态交叉表的创建和分析,大大提高数据处理和分析的性能,弥补关系型交叉表多维分析性能上的不足。本专利技术解决其技术问题所采用的技术方案是:一种基于动态交叉表的多维数据实时分析方法,在前端采用分析向导的形式,自主选择指标和维度;在后台采用SSAS方式,动态地创建CUBE,动态交叉表的运算过程最大程度的放在服务器端运行,在服务端直接动态执行SSAS,减轻客户端的压力;该方法实现步骤如下:S1:数据整理,包括体系事实表和维度表,体系事实表包含所要分析的指标字段、量度字段和维度编号字段内容,通过维度编号字段与各个维度表相关联,维度表包含各种纬度字段内容,记录各个维度信息;(如员工维度表,有工号、姓名、性别、生日、联系电话、学历、所在部门等等维度)S2:通过指标工具将指标、维度和量度包含到指标体系内;S3:通过语义对象设计器对所有维度加以描述,将维度进行分组和分级;S4:通过分析向导自助完成体系与指标、维度和量度的包含关系;S5:选择所要分析的指标和维度,形成实时分析表。优选的,所述指标工具完成指标体系定义、指标定义、维度定义和量度定义,再通过指标体系的包含关系,依次将指标、纬度和量度包含其中。进一步的,指标体系为事实表,其体系编号与对应的数据库中的表名保持一致,指标编号和量度编号对应表中字段名,且保持一致。进一步的,指标体系中存储纬度编号外键,用于与维度表作关联。优选的,借助语义对象设计器,把维度表中的字段重新描述,在当今大数据中分析维度已变得十分庞大,语义对象设计器按维度属性划分,将维度分为基本维度、统计依据和其他维度属性。优选的,通过分析向导,用户自主选择所要分析的指标,由已选指标关联出所用的维度,进而对已选指标和维度进行条件筛选。使交叉表分析业务变得更精准、更简洁,如“区域等于山东并且贷款金额大于等于1000000”的公司运营状况分析,其中,区域是维度,贷款金额是指标。进一步的,将所选的指标和维度及筛选条件传到后台程序处理,通过程序控制SSAS操作,从所用的事实表和维度表提取出符合条件的数据,并“告诉”SSAS哪些字段是指标、哪些字段是维度,从而动态创建出CUBE多维分析。动态交叉表的运算过程通过程序创建的SSAS层完成,SSAS是当前非常成熟、高效的多维交叉表分析模式,由微软开发并持续维护。进一步的,指标和量度作sum预处理,CUBE数据反馈到前端,由用户拖拽到行或列,形成动态的实时交叉表。优选的,生成的CUBE支持的数据分析模型包括多个指标+多个一般维度+多个退化维度、多个指标+多个退化维度、多个指标+多个复杂维度(对应一个语义对象的维度)、空指标+多个一般维度+多个退化维度和空指标+多个退化维度。交叉表是报表中常见的类型,属于基本的分析报表,将所有的分析字段按照数据类型分为指标、维度和量度,指标字段和量度字段为数值型,维度字段为字符型。具体应用到交叉表时,维度在行或列中体现,指标和量度在值区域中体现,参与具体的聚合计算。通常聚合计算函数有求和、计数、平均值、方差、标准差等。一个多维指标体系对应一个主题,多维指标体系下包含指标、维度、量度等要素,对应事实表维度模型中的指标、维度、指标量度等信息。指标、维度、量度可独立于多维指标体系定义,与多维指标是多对多关系。一个多维指标体系对应一个指标分类,采用多维指标体系描述指标维度对应关系;多维指标体系提供生成事实表功能,即一个多维指标体系对应一个事实表,减少数据量和ETL处理的复杂性。本专利技术的一种基于动态交叉表的多维数据实时分析方法和现有技术相比,具有以下有益效果:动态交叉表的运算过程最大限度地放在服务器端运行,在服务端直接动态执行SSAS,减轻了客户端的压力,比传统的纯前端动态交叉表响应更迅速,性能更卓越,从而达到实时分析的目的;引入了自助分析向导功能,使指标及维度的选择完全由用户自主完成,使分析更加灵活高效,满足不同的业务场景。该动态交叉表的多维分析方法处理性能高,在处理过程中将处理分析计算过程最大程度地放在服务器端,采用更成熟高效的算法,大大提高了性能问题,拓宽了维分析的应用领域;OLAP系统能处理与应用有关的任何逻辑分析和统计分析,用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户理想的方式给出报告;系统提供对数据分析的维视图和分析,包括对层次维和多重层次维。颗粒度更加明确,展现级次也更为清晰。附图说明图1是本专利技术实施例中分析流程图。具体实施方式一种基于动态交叉表的多维数据实时分析方法,在前端采用分析向导的形式,自主选择指标和维度;在后台采用SSAS方式,动态地创建CUBE,动态交叉表的运算过程最大程度的放在服务器端运行,在服务端直接动态执行SSAS,减轻客户端的压力。该方法实现步骤如下:S1:数据整理,包括体系事实表和维度表。一个多维指标体系对应一个主题,多维指标体系下包含指标、维度、量度等要素,对应事实表维度模型中的指标、维度、指标量度等信息。指标、维度、量度可独立于多维指标体系定义,与多维指标是多对多关系。一个多维指标体系对应一个指标分类,采用多维指标体系描述指标维度对应关系;多维指标体系提供生成事实表功能,即一个多维指标体系对应一个事实表,减少数据量和ETL处理的复杂性。每个体系对应一个事实表,体系事实表包含所要分析的指标字段、量度字段和维度编号字段内容,通过维度编号字段与各个维度表相关联。体系编号与对应的数据库中的表名保持一致,指标编号和量度编号对应表中字段名,且保持一致,指标体系中存储纬度编号外键,用于与维度表作关联。维度表包含各种纬度字段内容,记录各个维度信息,如员工维度表,有工号、姓名、性别、生日、联系电话、学历、所在部门等等维度。交叉表是报表中常见的类型,属于基本的分析报表,将所有的分析字段按照数据类型分为指标、维度和量度,指标字段和量度字段为数值型,维度字段为字符型。具体应用到交叉表时,维度在行或列中体现,指标和量度在值区域中体现,参与具体的聚合计算。通常聚合计算函数有求和、计数、平均值、方差、标准差等。S2:指标工具完成指标体系定义、指标定义、维度定义和量度定义,再通过指标体系的包含关系,依次将指标、纬度和量度包含其中,可以通过指标工具将指标、维度和量度包含到指标体系内。S3:通过语义对象设计器对所有维度加以描述,将维度进行分组和分级;借助语义对象设计器,把维度表中的字段重新描述,在当今大数据中分析维度已变得十分庞大,语义对象设计器按维度属性划分,将维度分为基本维度、统计依据和其他维度属性。S4:通过分析向导自助完成体系与指标、维本文档来自技高网...

【技术保护点】
1.一种基于动态交叉表的多维数据实时分析方法,其特征在于在前端采用分析向导的形式,自主选择指标和维度;在后台采用SSAS方式,动态地创建CUBE;该方法实现步骤如下:S1:数据整理,包括体系事实表和维度表,体系事实表包含所要分析的指标字段、量度字段和维度编号字段内容,维度表包含各种纬度字段内容,体系事实表通过维度编号字段与各个维度表相关联;S2:通过指标工具将指标、维度和量度包含到指标体系内;S3:通过语义对象设计器对所有维度加以描述,将维度进行分组和分级;S4:通过分析向导自助完成体系与指标、维度和量度的包含关系;S5:选择所要分析的指标和维度,形成实时分析表。

【技术特征摘要】
1.一种基于动态交叉表的多维数据实时分析方法,其特征在于在前端采用分析向导的形式,自主选择指标和维度;在后台采用SSAS方式,动态地创建CUBE;该方法实现步骤如下:S1:数据整理,包括体系事实表和维度表,体系事实表包含所要分析的指标字段、量度字段和维度编号字段内容,维度表包含各种纬度字段内容,体系事实表通过维度编号字段与各个维度表相关联;S2:通过指标工具将指标、维度和量度包含到指标体系内;S3:通过语义对象设计器对所有维度加以描述,将维度进行分组和分级;S4:通过分析向导自助完成体系与指标、维度和量度的包含关系;S5:选择所要分析的指标和维度,形成实时分析表。2.根据权利要求1所述的一种基于动态交叉表的多维数据实时分析方法,其特征在于所述指标工具完成指标体系定义、指标定义、维度定义和量度定义,再通过指标体系的包含关系,依次将指标、纬度和量度包含其中。3.根据权利要求2所述的一种基于动态交叉表的多维数据实时分析方法,其特征在于指标体系为事实表,其体系编号与对应的数据库中的表名保持一致,指标编号和量度编号对应表中字段名,且保持一致。4.根据权利要求2或3所述的一种基于动态交叉表的多维数据实时分析方法,其特征在于指标体系中存储纬度编号外键,用于与维度表作关联。5.根据权利要求1所述的一种基于动态交叉表的多...

【专利技术属性】
技术研发人员:冯洋洋
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1