一种多维度数据分析方法、装置、设备及计算机程序产品制造方法及图纸

技术编号:35445071 阅读:32 留言:0更新日期:2022-11-03 11:57
本申请公开了一种多维度数据分析方法、装置、设备及计算机程序产品,方法包括:获取预置时间范围内的多维度数据的指标值并构建成初始数据集;将初始数据集中不同维度类别的指标值按照时间顺序进行分类整理,得到待分析立方体数据集,待分析立方体数据集包括组合维度名称和对应的维度指标值;基于组合维度名称进行排列组合操作,得到维度名称组合,每个维度名称组合包括维度值和对应的维度指标值;基于下钻分析原理,对维度名称组合的维度值和对应的维度指标值进行离散度分析,得到离散分析结果。本申请能够解决现有技术对指标数据的处理分析缺乏针对性,导致根因分析时延较长的技术问题。问题。问题。

【技术实现步骤摘要】
一种多维度数据分析方法、装置、设备及计算机程序产品


[0001]本申请涉及数据处理
,尤其涉及一种多维度数据分析方法、装置、设备及计算机程序产品。

技术介绍

[0002]公司互联网产品运营从粗犷式逐渐转为精细化运营,同时公司的产品系列越来越丰富。产品各类型指标日益增多且已累积形成海量的数据,指标的分析逐渐复杂深入。针对产品运营指标数据分析场景,由于其具有多维度、大数据量特性。
[0003]目前主要是在需要分析时通过临时筛选维度查询对应的指标数据进行分析,没有提前将大量多维指标数据进行处理分析,存在根因分析延时较长的技术问题。

技术实现思路

[0004]本申请提供了一种多维度数据分析方法、装置、设备及计算机程序产品,用于解决现有技术对指标数据的处理分析缺乏针对性,导致根因分析时延较长的技术问题。
[0005]有鉴于此,本申请第一方面提供了一种多维度数据分析方法,包括:
[0006]获取预置时间范围内的多维度数据的指标值并构建成初始数据集;
[0007]将所述初始数据集中不同维度类别的所述指标值按照时间顺序进行分类整理,得到待分析立方体数据集,所述待分析立方体数据集包括组合维度名称和对应的维度指标值;
[0008]基于所述组合维度名称进行排列组合操作,得到维度名称组合,每个所述维度名称组合包括维度值和对应的所述维度指标值;
[0009]基于下钻分析原理,对所述维度名称组合的所述维度值和对应的所述维度指标值进行离散度分析,得到离散分析结果。
[0010]优选地,所述获取预置时间范围内的多维度数据的指标值并构建成初始数据集,之前还包括:
[0011]将获取到的产品运营指标数据按照类别存储在预置存储介质中,形成多维度数据,所述预置存储介质包括Hbase、Hive、Mysql。
[0012]优选地,所述将获取到的产品运营指标数据按照类别存储在预置存储介质中,形成多维度数据,之后还包括:
[0013]为所述多维度数据配置维度名称后,将所述维度名称与存储的指标值建立关联关系。
[0014]优选地,所述基于下钻分析原理,对所述维度名称组合的所述维度值和对应的所述维度指标值进行离散度分析,得到离散分析结果,之后还包括:
[0015]在所述离散分析结果满足预置预警条件的情况下执行预警操作。
[0016]本申请第二方面提供了一种多维度数据分析装置,包括:
[0017]数据获取模块,用于获取预置时间范围内的多维度数据的指标值并构建成初始数
据集;
[0018]分类整理模块,用于将所述初始数据集中不同维度类别的所述指标值按照时间顺序进行分类整理,得到待分析立方体数据集,所述待分析立方体数据集包括组合维度名称和对应的维度指标值;
[0019]排列组合模块,用于基于所述组合维度名称进行排列组合操作,得到维度名称组合,每个所述维度名称组合包括维度值和对应的所述维度指标值;
[0020]离散分析模块,用于基于下钻分析原理,对所述维度名称组合的所述维度值和对应的所述维度指标值进行离散度分析,得到离散分析结果。
[0021]优选地,还包括:
[0022]数据存储模块,用于将获取到的产品运营指标数据按照类别存储在预置存储介质中,形成多维度数据,所述预置存储介质包括Hbase、Hive、Mysql。
[0023]优选地,还包括:
[0024]参数配置模块,用于为所述多维度数据配置维度名称后,将所述维度名称与存储的指标值建立关联关系。
[0025]优选地,还包括:
[0026]异常预警模块,用于在所述离散分析结果满足预置预警条件的情况下执行预警操作。
[0027]本申请第三方面提供了一种多维度数据分析设备,所述设备包括处理器以及存储器;
[0028]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0029]所述处理器用于根据所述程序代码中的指令执行第一方面所述的多维度数据分析方法。
[0030]本申请第四方面提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行第一方面所述的多维度数据分析方法。
[0031]从以上技术方案可以看出,本申请实施例具有以下优点:
[0032]本申请中,提供了一种多维度数据分析方法,包括:获取预置时间范围内的多维度数据的指标值并构建成初始数据集;将初始数据集中不同维度类别的指标值按照时间顺序进行分类整理,得到待分析立方体数据集,待分析立方体数据集包括组合维度名称和对应的维度指标值;基于组合维度名称进行排列组合操作,得到维度名称组合,每个维度名称组合包括维度值和对应的维度指标值;基于下钻分析原理,对维度名称组合的维度值和对应的维度指标值进行离散度分析,得到离散分析结果。
[0033]本申请提供的多维度数据分析方法,在进行数据分析之前,先将多维度数据进行不同的整理操作,待分析立方体数据集中的组合维度名称和对应的维度指标值是经过整理后的有序的多维度数据;而维度名称经过随机组合后使得多维度数据可以表达多种不同维度组合情况下的指标值分布;此时再进行多维度数据的离散分析就能更加全面的掌握数据的分布特性,分析过程更有条理,也更具有针对性。因此,本申请能够解决现有技术对指标数据的处理分析缺乏针对性,导致根因分析时延较长的技术问题。
附图说明
[0034]图1为本申请实施例提供的一种多维度数据分析方法的流程示意图;
[0035]图2为本申请实施例提供的一种多维度数据分析装置的结构示意图;
[0036]图3为本申请实施例提供的多维度数据列表示意图;
[0037]图4为本申请实施例提供的初始数据集生成列表示意图;
[0038]图5为本申请实施例提供的待分析立方体数据集生成列表示意图;
[0039]图6为本申请实施例提供的维度名称组合示意图;
[0040]图7为本申请实施例提供的不同维度名称组合的指标值数组示意图。
具体实施方式
[0041]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0042]为了便于理解,请参阅图1,本申请提供的一种多维度数据分析方法的实施例,包括:
[0043]步骤101、获取预置时间范围内的多维度数据的指标值并构建成初始数据集。
[0044]为了解决企业产品具备大数据量多维度特性的运营指标根因分析问题,本实施例在对多维度数据进行根因分析之前先进行数据整理,进一步提升后续的数据分析效率,减少数据分析时延。
[0045]可以理解的是,本实施例中的多维度数据均具有时间特性,所以均可以基于时间维度进行划本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多维度数据分析方法,其特征在于,包括:获取预置时间范围内的多维度数据的指标值并构建成初始数据集;将所述初始数据集中不同维度类别的所述指标值按照时间顺序进行分类整理,得到待分析立方体数据集,所述待分析立方体数据集包括组合维度名称和对应的维度指标值;基于所述组合维度名称进行排列组合操作,得到维度名称组合,每个所述维度名称组合包括维度值和对应的所述维度指标值;基于下钻分析原理,对所述维度名称组合的所述维度值和对应的所述维度指标值进行离散度分析,得到离散分析结果。2.根据权利要求1所述的多维度数据分析方法,其特征在于,所述获取预置时间范围内的多维度数据的指标值并构建成初始数据集,之前还包括:将获取到的产品运营指标数据按照类别存储在预置存储介质中,形成多维度数据,所述预置存储介质包括Hbase、Hive、Mysql。3.根据权利要求2所述的多维度数据分析方法,其特征在于,所述将获取到的产品运营指标数据按照类别存储在预置存储介质中,形成多维度数据,之后还包括:为所述多维度数据配置维度名称后,将所述维度名称与存储的指标值建立关联关系。4.根据权利要求1所述的多维度数据分析方法,其特征在于,所述基于下钻分析原理,对所述维度名称组合的所述维度值和对应的所述维度指标值进行离散度分析,得到离散分析结果,之后还包括:在所述离散分析结果满足预置预警条件的情况下执行预警操作。5.一种多维度数据分析装置,其特征在于,包括:数据获取模块,用于获取预置时间范围内的多维度数据的指标值并构建成初始数据集;分类整理模块,用于将所述初始数...

【专利技术属性】
技术研发人员:卜昌浩张继东赵子颖黄毓铭谢志强刘润浩李家辉
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1