一种数据处理方法、装置及电子设备制造方法及图纸

技术编号:19023427 阅读:24 留言:0更新日期:2018-09-26 19:04
本文公开了一种数据处理方法、装置及电子设备。所述数据处理方法,包括:获取多维数据集;根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。本文的技术方案能够为商业智能系统提供一种影响因素辅助分析的功能,提高用户的决策效率。

【技术实现步骤摘要】
一种数据处理方法、装置及电子设备
本专利技术涉及计算机技术,尤指一种数据处理方法、装置及电子设备。
技术介绍
商业智能(BusinessIntelligence,简称BI)是指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。随着商业智能(BusinessIntelligence,简称BI)工具的广泛使用,决策者将更容易对数据进行查询和分析。一个多维数据集中通常包含大量的字段,其中有些字段属于维度(观察数据的角度),有些字段属于度量(具体考察的数量值),用户在面对多维数据集时,由于度量和维度的数量很多,一个度量一个维度地去逐个查找隐藏在数据背后的影响因素,效率非常低。
技术实现思路
本申请提供了一种数据处理方法、装置及电子设备,能够为商业智能系统提供一种影响因素辅助分析的功能,提高用户的决策效率。本申请采用如下技术方案。本申请实施例提供一种数据处理方法,包括:获取多维数据集;根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。可选地,所述用户输入的查询条件,包括以下任意一种:一个或多个目标度量,以及全部目标维度;一个或多个目标维度,以及全部目标度量;一个或多个目标度量,以及一个或多个目标维度。可选地,所述构建维度对度量贡献度的查询集合,包括:确定所述多维数据集中所有的维度和度量的组合;对任意一对维度和度量的组合,计算所述维度下的每一个维度成员对所述度量的贡献度;构建查询集合,所述查询集合中包括每一对度量和维度的组合对应的贡献度数据。可选地,所述根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,包括:对任意一对目标度量和目标维度的组合,将对所述目标度量的贡献率大于或等于阈值的目标维度成员确定为影响所述目标度量的主要因素,将对所述目标度量的贡献率小于阈值的目标维度成员确定为影响所述目标度量的非主要因素;和/或对任意一对目标度量和目标维度的组合,将对所述目标度量的贡献率排名排在前N名以内的目标维度成员确定为影响所述目标度量的主要因素,将对所述目标度量的贡献率排名排在前N名以外的目标维度成员确定为影响所述目标度量的非主要因素。可选地,对所述影响因素进行展示,包括:根据所述目标维度的成员对所述目标度量的贡献度绘制饼图,通过所述饼图展示所述目标维度影响所述目标度量的影响因素;和/或将对所述目标度量的贡献率最大的目标维度成员确定为影响所述目标度量的最主要因素,生成影响所述目标度量的最主要因素分析见解并展示。本申请实施例提供一种数据处理装置,包括:数据源获取模块,用于获取多维数据集;查询集合构建模块,用于根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;影响因素分析模块,用于在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。可选地,所述用户输入的查询条件,包括以下任意一种:一个或多个目标度量,以及全部目标维度;一个或多个目标维度,以及全部目标度量;一个或多个目标度量,以及一个或多个目标维度。可选地,查询集合构建模块,用于采用以下方式构建维度对度量贡献度的查询集合:确定所述多维数据集中所有的维度和度量的组合;对任意一对维度和度量的组合,计算所述维度下的每一个维度成员对所述度量的贡献度;构建查询集合,所述查询集合中包括每一对度量和维度的组合对应的贡献度数据。可选地,影响因素分析模块,用于采用以下方式根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素:对任意一对目标度量和目标维度的组合,将对所述目标度量的贡献率大于或等于阈值的目标维度成员确定为影响所述目标度量的主要因素,将对所述目标度量的贡献率小于阈值的目标维度成员确定为影响所述目标度量的非主要因素;和/或对任意一对目标度量和目标维度的组合,将对所述目标度量的贡献率排名排在前N名以内的目标维度成员确定为影响所述目标度量的主要因素,将对所述目标度量的贡献率排名排在前N名以外的目标维度成员确定为影响所述目标度量的非主要因素。本申请提供一种用于数据处理的电子设备,包括:存储器和处理器;所述存储器用于保存用于数据处理的程序,所述用于数据处理的程序在被所述处理器读取执行时,执行以下操作:获取多维数据集;根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。本申请包括以下优点:本申请至少一个实施例,根据获取到的多维数据集确定维度和度量,构建维度对度量贡献度的查询集合,在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。上述实施例的技术方案能够为商业智能系统提供一种影响因素辅助分析的功能,提高用户的决策效率。当然,实施本申请的任一产品不一定需要同时达到以上所述的所有优点。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例一的一种数据处理方法的流程图;图2为本专利技术应用示例1的一种数据处理方法的流程图;图3-a为本专利技术应用示例1的饼图以及最主要因素的分析见解的示意图;图3-b为用户选择焦点落在图3-a中的饼图中某个扇区时提示信息的示意图;图4为本专利技术实施例二的一种数据处理装置示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。实施例一如图1所示,一种数据处理方法,包括:S110,获取多维数据集;S120,根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;S130,在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。在本实施例中,根据所述多维数据集确定维度和度量,包括:根据所述多维数据集中的字段的数据类型区分维度和度量;其中,可以将数值型字段判定为度量,将除数值型字段外的其他类型的字段判定为维度;其中,系统可以根据用户自定义的设置确定维度和度量;或者在系统自动筛选出维度和度量后,在接收到用户的确认或修改后确定出最终的维度、度量;在一种实施方式中,所述用户输入的查询条件,包括以下任意一种:一个或多个目标度量,以及全部目标维度;一个或多个目标维度,以及全本文档来自技高网...

【技术保护点】
1.一种数据处理方法,包括:获取多维数据集;根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。

【技术特征摘要】
1.一种数据处理方法,包括:获取多维数据集;根据所述多维数据集确定维度和度量,构建维度对度量贡献度的查询集合;在获取到用户输入的查询条件后,根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,对所述影响因素进行展示。2.根据权利要求1所述的方法,其特征在于:所述用户输入的查询条件,包括以下任意一种:一个或多个目标度量,以及全部目标维度;一个或多个目标维度,以及全部目标度量;一个或多个目标度量,以及一个或多个目标维度。3.根据权利要求1或2所述的方法,其特征在于:所述构建维度对度量贡献度的查询集合,包括:确定所述多维数据集中所有的维度和度量的组合;对任意一对维度和度量的组合,计算所述维度下的每一个维度成员对所述度量的贡献度;构建查询集合,所述查询集合中包括每一对度量和维度的组合对应的贡献度数据。4.根据权利要求3所述的方法,其特征在于:所述根据所述查询条件中的每一对目标度量和目标维度的组合查询所述查询集合获得目标维度影响目标度量的影响因素,包括:对任意一对目标度量和目标维度的组合,将对所述目标度量的贡献率大于或等于阈值的目标维度成员确定为影响所述目标度量的主要因素,将对所述目标度量的贡献率小于阈值的目标维度成员确定为影响所述目标度量的非主要因素;和/或对任意一对目标度量和目标维度的组合,将对所述目标度量的贡献率排名排在前N名以内的目标维度成员确定为影响所述目标度量的主要因素,将对所述目标度量的贡献率排名排在前N名以外的目标维度成员确定为影响所述目标度量的非主要因素。5.根据权利要求1所述的方法,其特征在于:对所述影响因素进行展示,包括:根据所述目标维度的成员对所述目标度量的贡献度绘制饼图,通过所述饼图展示所述目标维度影响所述目标度量的影响因素;和/或将对所述目标度量的贡献率最大的目标维度成员确定为影响所述目标度量的最主要因素,生成影响所述目标度量的最主要因素分析见解并展示。6.一种数据处理装置,包括:数据源获取模块,用于获取多维数据集;查询集合构建模块,用于根据所述多维数据集确定维度和...

【专利技术属性】
技术研发人员:张勇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1