一种多维数据集的洞察方法以及装置制造方法及图纸

技术编号:32122866 阅读:10 留言:0更新日期:2022-01-29 19:09
本发明专利技术提供了一种多维数据集的洞察方法以及装置,该方法包括:根据接收到的用户的数据洞察请求获取到目标多维数据集;针对目标多维数据集进行数据切片处理,生成多个数据切片;根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;将洞察对象进行数据模式检验,生成数据洞察结果。解决了针对于比较大型的多维数据集,现有技术挖掘出的数据不够深入、价值较低的技术问题。价值较低的技术问题。价值较低的技术问题。

【技术实现步骤摘要】
一种多维数据集的洞察方法以及装置


[0001]本专利技术涉及数据挖掘领域,尤其是涉及多维数据集的洞察方法以及装置。

技术介绍

[0002]数据挖掘主要是面向决策,从海量数据中挖掘不为人知、无法直观得出的结论,例如内容推荐、相关度计算等。数据挖掘的工作更注重数据内在联系,数据仓库组建,分析系统开发,挖掘算法设计,往往需要研发人员从ETL开始处理原始数据,因此数据挖掘对研发人员的计算机水平有较高要求。
[0003]在现有技术下,在多维数据集中进行数据分析,往往是由专业的数据分析人员在OLAP系统上来完成的。OLAP是一个建立数据系统的方法,核心思想就是建立多维度的数据立方体,以维度(Dimension)和度量(Measure)为基本概念,辅以元数据,实现可以钻取、切片、切块、旋转等灵活、系统、直观的数据展现。
[0004]需要说明的是,针对于比较大型的多维数据集,现有技术挖掘出的数据不够深入、价值较低。

技术实现思路

[0005]本专利技术提供了一种多维数据集的洞察方法以及装置,以解决针对于比较大型的多维数据集,现有技术挖掘出的数据的价值较低的技术问题。
[0006]根据本专利技术的第一方面,提供了一种多维数据集的洞察方法,该方法包括:根据接收到的用户的数据洞察请求获取到目标多维数据集;针对目标多维数据集进行数据切片处理,生成多个数据切片;根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;将洞察对象进行数据模式检验,生成数据洞察结果。
[0007]进一步地,将洞察对象进行如下一个或多个的数据模式检验:首位贡献度检验、占比检验、两指标相关性检验、全局离群点检验、趋势检验、周期检验、转折点检验、时序异常检验。
[0008]进一步地,数据模式检验的结果为真或者假,其中,将洞察对象进行数据模式检验,生成数据洞察结果的步骤包括:将数据模式检验的结果为真的洞察对象确定为目标洞察对象;根据目标洞察对象生成数据洞察结果。
[0009]进一步地,在将洞察对象进行数据模式检验,生成数据洞察结果之后,方法包括:将多个数据洞察结果按照数据范围进行排序;控制将排序后的多个数据洞察结果进行可视化展示。
[0010]根据本专利技术的第二方面,提供了一种多维数据集的洞察装置,装置包括:获取单元,用于根据接收到的用户的数据洞察请求获取到目标多维数据集;成单元,用于针对目标多维数据集进行数据切片处理,生成多个数据切片;确定单元,用于根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标
的聚合方式;检验单元,用于将洞察对象进行数据模式检验,生成数据洞察结果。
[0011]进一步地,将洞察对象进行如下一个或多个的数据模式检验:首位贡献度检验、占比检验、两指标相关性检验、全局离群点检验、趋势检验、周期检验、转折点检验、时序异常检验。
[0012]进一步地,数据模式检验的结果为真或者假,其中,生成单元包括:确定模块,用于将数据模式检验的结果为真的洞察对象确定为目标洞察对象;生成模块,用于根据目标洞察对象生成数据洞察结果。
[0013]进一步地,装置还包括:排序单元,用于将多个数据洞察结果按照数据范围进行排序;展示单元,用于控制将排序后的多个数据洞察结果进行可视化展示。
[0014]根据本专利技术的第三方面,提供了一种计算机设备,包括存储器和处理器,存储器上存储有计算机指令,计算机指令在由处理器执行时导致上述任一项的方法被执行。
[0015]根据本专利技术的第四方面,提供了一种非暂时性计算机可读存储介质,其上存储有计算机程序,计算机程序在由处理器执行时导致上述任一项的方法被执行。
[0016]本专利技术提供了一种多维数据集的洞察方法以及装置,该方法包括:根据接收到的用户的数据洞察请求获取到目标多维数据集;针对目标多维数据集进行数据切片处理,生成多个数据切片;根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;将洞察对象进行数据模式检验,生成数据洞察结果。解决了针对于比较大型的多维数据集,现有技术挖掘出的数据的价值较低的技术问题。
附图说明
[0017]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本专利技术实施例一的多维数据集的洞察方法的流程图;
[0019]图2为本专利技术实施例一的可选的多维数据集的洞察方法的示意图;
[0020]图3为本专利技术实施例二的多维数据集的洞察装置的示意图。
具体实施方式
[0021]为了使本专利技术的上述以及其他特征和优点更加清楚,下面结合附图进一步描述本专利技术。应当理解,本文给出的具体实施例是出于向本领域技术人员解释的目的,仅是示例性的,而非限制性的。
[0022]在以下描述中,阐述了许多具体细节以提供对本专利技术的透彻理解。然而,对于本领域普通技术人员来说,明显的是,不需要采用具体细节来实践本专利技术。在其他情况下,未详细描述众所周知的步骤或操作,以避免模糊本专利技术。
[0023]实施例一
[0024]本申请提供了一种多维数据集的洞察方法,如图1所示,该方法包括:
[0025]步骤S11,根据接收到的用户的数据洞察请求获取到目标多维数据集。
[0026]具体的,在本方案中,本方案的方法步骤可以由服务器或者其他带有处理器的硬件设备来执行,本方案可以接受用户的数据洞察请求,上述数据洞察请求可以为用户针对某目标多维数据集中的数据进行数据洞察的请求,比如,用户希望针对车辆每日销售的明细表进行洞察,本方案则根据用户的数据洞察请求去获取到车辆每日销售的明细表所在的数据库并且获取到目标多维数据集,目标数据多维数据集的例子如下表1所示。需要说明的是,用户输入数据洞察请求,即意味着用于需要这对上述目标多维数据集中通过数据挖掘得到价值度高的数据。
[0027]表1:目标数据多维数据集
[0028][0029][0030]需要说明的是,在上述表格中,xx网、xx买车为不同的线上汽车销售平台。
[0031]步骤S13,针对目标多维数据集进行数据切片处理,生成多个数据切片。
[0032]具体的,在本方案中,可以采用BUC的方式来遍历目标多维度数据集,然后完成数据切片,从而生成多个数据切片的结果集,上述目标多维数据集可以为一个立方体,以上表1为例,立方体=(所有型号、所有渠道、所有类型),即在上述立方体中包括型号、渠道以及类型三个维度。本方案则采用BUC方式来对上述立方体进行数据切片。需要说明的是,一个数据切片是指在多维数据中任意指定若干维度等于某一成员后得到的相对源数据立方体的在某本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多维数据集的洞察方法,其特征在于,所述方法包括:根据接收到的用户的数据洞察请求获取到目标多维数据集;针对所述目标多维数据集进行数据切片处理,生成多个数据切片;根据所述数据切片确定所述数据切片的洞察对象,其中,所述洞察对象包括所述数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;将所述洞察对象进行数据模式检验,生成数据洞察结果。2.根据权利要求1所述的方法,其特征在于,将所述洞察对象进行如下一个或多个的数据模式检验:首位贡献度检验、占比检验、两指标相关性检验、全局离群点检验、趋势检验、周期检验、转折点检验、时序异常检验。3.根据权利要求1所述的方法,其特征在于,所述数据模式检验的结果为真或者假,其中,将所述洞察对象进行数据模式检验,生成数据洞察结果的步骤包括:将数据模式检验的结果为真的洞察对象确定为目标洞察对象;根据所述目标洞察对象生成所述数据洞察结果。4.根据权利要求1所述的方法,其特征在于,在将所述洞察对象进行数据模式检验,生成数据洞察结果之后,所述方法包括:将多个数据洞察结果按照数据范围进行排序;控制将排序后的多个数据洞察结果进行可视化展示。5.一种多维数据集的洞察装置,其特征在于,所述装置包括:获取单元,用于根据接收到的用户的数据洞察请求获取到目标多维数据集;生成单元,用于针对所述目标多维数据集进行数据切片...

【专利技术属性】
技术研发人员:程鑫张亚东苗寒邹常林张探探周成
申请(专利权)人:北京元年科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1