指标异常波动的检测方法、装置及设备制造方法及图纸

技术编号:19692406 阅读:22 留言:0更新日期:2018-12-08 11:19
本说明书提供一种指标异常波动的检测方法、装置及设备,本实施例提供有数据检测配置接口,通过该接口,可以供用户输入待检测维度和指标的变化率;针对待检测维度,可以调用分析模型计算待检测维度的信息熵、信息增益率或二八原则参数中的一个或多个参数,通过所计算的参数可以检测出各个维度对指标异常变动的影响程度。

【技术实现步骤摘要】
指标异常波动的检测方法、装置及设备
本说明书涉及数据分析
,尤其涉及指标异常波动的检测方法、装置及设备。
技术介绍
随着信息技术的发展,各行各业在运营的过程中每天都会产生大量的数据。针对这些数据,数据分析师常常会有很多关注的指标,例如新增用户数量、活跃用户数量等等。这些指标的波动情况,常常采用同比或环比等变化率来表征。通过这些指标的变化率,数据分析师可以查看指标是否发生异常波动,例如,若变化率较大,可能说明该指标出现了异常波动。实际业务场景中,指标的异常波动可能由多种原因产生,以用户数量同比为例,影响用户数量的维度,可能包括职业、用户所在城市、年龄或性别等等,不同维度对于用户数量波动的影响程度可能不同。基于此,需要提供一种能够检测指标异常波动、确定异常波动原因的方案。
技术实现思路
为克服相关技术中存在的问题,本说明书提供了指标异常波动的检测方法、装置及设备。根据本说明书实施例的第一方面,提供一种指标异常波动的检测方法,所述方法包括:提供配置接口,通过所述配置接口获取数据检测配置信息,所述数据检测配置信息包括:待检测维度和指标的变化率;加载待检测数据,将所述待检测维度和所述指标的变化率作为分析模型的输入,调用所述分析模型,其中,所述分析模型用于:利用所述待检测数据计算所述待检测维度的如下一种或多种参数:信息熵、信息增益率或二八原则参数,并基于计算得到的参数确定所述待检测维度对所述指标的变化率的影响程度;输出所述检测结果。可选的,所述变化率包括:同比或环比。可选的,所述信息熵基于如下方式确定:所述信息熵中的随机事件分为两类:所述待检测维度的枚举值对应变化率是否大于所述指标的变化率;所述随机事件出现的概率基于如下方式确定:所述对应变化率大于所述指标的变化率的枚举值个数占待检测维度的枚举值总个数的比例。可选的,所述信息熵通过如下方式计算得到:其中,gm(D)表示维度m的信息熵,n等于2,pi表示所述比例,D表示所述整体变化率。可选的,所述信息增益率基于所述信息熵与所述待检测维度的枚举值总个数的比值而确定。可选的,所述二八原则参数基于目标个数Q占所述待检测维度的枚举值总个数的比例而确定;其中,所述目标个数Q表示:将所述待检测维度的枚举值按照对应的变化绝对值从高至低排序,前Q个枚举值对应的变化绝对值的和值超过所述指标的变化绝对值的设定比例,所述设定比例基于80%而确定。可选的,所述影响程度与所述信息熵或信息增益率呈正相关,与所述二八原则参数呈负相关。可选的,所述分析模型运行于Hive平台中。根据本说明书实施例的第二方面,提供一种指标异常波动的检测装置,包括:配置模块,用于:提供配置接口,通过所述配置接口获取数据检测配置信息,所述数据检测配置信息包括:待检测维度和指标的变化率;计算模块,用于:加载待检测数据,将所述待检测维度和所述指标的变化率作为分析模型的输入,调用所述分析模型,其中,所述分析模型用于:利用所述待检测数据计算所述待检测维度的如下一种或多种参数:信息熵、信息增益率或二八原则参数,并基于计算得到的参数确定所述待检测维度对所述指标的变化率的影响程度;输出模块,用于:输出所述检测结果。可选的,所述变化率包括:同比或环比。可选的,所述信息熵基于如下方式确定:所述信息熵中的随机事件分为两类:所述待检测维度的枚举值对应变化率是否大于所述指标的变化率;所述随机事件出现的概率基于如下方式确定:所述对应变化率大于所述指标的变化率的枚举值个数占待检测维度的枚举值总个数的比例。可选的,所述信息熵通过如下方式计算得到:其中,gm(D)表示维度m的信息熵,n等于2,pi表示所述比例,D表示所述整体变化率。可选的,所述信息增益率基于所述信息熵与所述待检测维度的枚举值总个数的比值而确定。可选的,所述二八原则参数基于目标个数Q占所述待检测维度的枚举值总个数的比例而确定;其中,所述目标个数Q表示:将所述待检测维度的枚举值按照对应的变化绝对值从高至低排序,前Q个枚举值对应的变化绝对值的和值超过所述指标的变化绝对值的设定比例,所述设定比例基于80%而确定。可选的,所述影响程度与所述信息熵或信息增益率呈正相关,与所述二八原则参数呈负相关。可选的,所述分析模型运行于Hive平台中。根据本说明书实施例的第三方面,提供一种指标异常波动的检测设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:提供配置接口,通过所述配置接口获取数据检测配置信息,所述数据检测配置信息包括:待检测维度和指标的变化率;加载待检测数据,将所述待检测维度和所述指标的变化率作为分析模型的输入,调用所述分析模型,其中,所述分析模型用于:利用所述待检测数据计算所述待检测维度的如下一种或多种参数:信息熵、信息增益率或二八原则参数,并基于计算得到的参数确定所述待检测维度对所述指标的变化率的影响程度;输出所述检测结果。本说明书的实施例提供的技术方案可以包括以下有益效果:本说明书实施例中提供有数据检测配置接口,通过该接口,可以供用户输入待检测维度和指标的变化率;针对待检测维度,可以调用分析模型计算待检测维度的信息熵、信息增益率或二八原则参数中的一个或多个参数,通过所计算的参数可以检测出各个维度对指标异常变动的影响程度。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。图1A是本说明书根据一示例性实施例示出的一种指标异常波动的检测方法的流程图。图1B是本说明书根据一示例性实施例示出的一种指标异常波动的检测方法的应用场景图。图2是本说明书实施例指标异常波动的检测装置所在设备的一种硬件结构图。图3是本说明书根据一示例性实施例示出的一种指标异常波动的检测装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。在大数据的趋势下,分析指标是否发生异常波动、分析异常波动的产生原因已经成为从事数据工作者每天需要从事的工作。在很多业务场景下,数据分析师会关注业务数据的多种指标。作为例子,数据的指标可以包括:曝光量、广告点击率、渠本文档来自技高网...

【技术保护点】
1.一种指标异常波动的检测方法,包括:提供配置接口,通过所述配置接口获取数据检测配置信息,所述数据检测配置信息包括:待检测维度和指标的变化率;加载待检测数据,将所述待检测维度和所述指标的变化率作为分析模型的输入,调用所述分析模型,其中,所述分析模型用于:利用所述待检测数据计算所述待检测维度的如下一种或多种参数:信息熵、信息增益率或二八原则参数,并基于计算得到的参数确定所述待检测维度对所述指标的变化率的影响程度;输出所述检测结果。

【技术特征摘要】
1.一种指标异常波动的检测方法,包括:提供配置接口,通过所述配置接口获取数据检测配置信息,所述数据检测配置信息包括:待检测维度和指标的变化率;加载待检测数据,将所述待检测维度和所述指标的变化率作为分析模型的输入,调用所述分析模型,其中,所述分析模型用于:利用所述待检测数据计算所述待检测维度的如下一种或多种参数:信息熵、信息增益率或二八原则参数,并基于计算得到的参数确定所述待检测维度对所述指标的变化率的影响程度;输出所述检测结果。2.根据权利要求1所述的方法,所述变化率包括:同比或环比。3.根据权利要求1所述的方法,所述信息熵基于如下方式确定:所述信息熵中的随机事件分为两类:所述待检测维度的枚举值对应变化率是否大于所述指标的变化率;其中,所述随机事件出现的概率基于如下方式确定:所述对应变化率大于所述指标的变化率的枚举值个数占待检测维度的枚举值总个数的比例。4.根据权利要求3所述的方法,所述信息熵通过如下方式计算得到:其中,gm(D)表示维度m的信息熵,n等于2,pi表示所述比例,D表示所述整体变化率。5.根据权利要求1所述的方法,所述信息增益率基于所述信息熵与所述待检测维度的枚举值总个数的比值而确定。6.根据权利要求1所述的方法,所述二八原则参数基于目标个数Q占所述待检测维度的枚举值总个数的比例而确定;其中,所述目标个数Q表示:将所述待检测维度的枚举值按照对应的变化绝对值从高至低排序,前Q个枚举值对应的变化绝对值的和值超过所述指标的变化绝对值的设定比例,所述设定比例基于80%而确定。7.根据权利要求1所述的方法,所述影响程度与所述信息熵或信息增益率呈正相关,与所述二八原则参数呈负相关。8.根据权利要求1所述的方法,所述分析模型运行于Hive平台中。9.一种指标异常波动的检测装置,所述装置包括:配置模块,用于:提供数据检测配置接口,通过所述接口获取数据检测请求,所述数据检测请求包含:待检测...

【专利技术属性】
技术研发人员:王蓬金赵坤张冠男邹润
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1