数据异常点的异常维度确定方法技术

技术编号:30518334 阅读:20 留言:0更新日期:2021-10-27 23:01
本公开涉及一种数据异常点的异常维度确定方法,其中,方法包括:获取发生异常的指标及其异常值;遍历指标的所有维度值,根据指标的指标类型、异常值、历史周期内的检测数据,计算每一维度值的占比变化;若占比变化大于阈值,则确定为异常维度值。根据本公开的技术方案可以对数据异常点的异常维度进行召回,能够帮助企业快速定位异常维度,降低企业分析异常值的门槛,提高了问题排查效率、降低人工成本。降低人工成本。降低人工成本。

【技术实现步骤摘要】
数据异常点的异常维度确定方法


[0001]本公开涉及数据处理
,尤其涉及一种数据异常点的异常维度确定方法。

技术介绍

[0002]随着数据驱动理念的普及,监控异常数据并对异常数据进行分析,以从数据分析中总结业务运营经验对企业而言至关重要,发现数据异常进行定位排查也已经成为分析师、产品、运营工作的日常。
[0003]然而,目前通过分析师人工进行异常分析定位的方式,非常消耗人力资源,且由于异常分析定位比较复杂,人工进行异常分析的方式效率也比较低下,甚至大多时候,人工排查并不能得出有效结论,导致出现无法解释的数据异常点。因此,如何快速对数据异常点的异常维度进行召回成为亟待解决的问题。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种数据异常点的异常维度确定方法。
[0005]第一方面,本公开实施例提供了一种数据异常点的异常维度确定方法,包括:
[0006]获取发生异常的指标和异常值;
[0007]遍历所述指标的所有维度值,根据所述指标的指标类型、所述异常值、历史周期内的检测数据,计算每一维度值的占比变化;
[0008]若所述占比变化大于阈值,确定为异常维度值。
[0009]第二方面,本公开实施例提供了一种数据异常点的异常维度确定装置,包括:
[0010]获取模块,用于获取发生异常的指标和异常值;
[0011]计算模块,用于遍历所述指标的所有维度值,根据所述指标的指标类型、所述异常值、历史周期内的检测数据,计算每一维度值的占比变化;
[0012]确定模块,用于若所述占比变化大于阈值,确定为异常维度值。
[0013]第三方面,本公开实施例提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述第一方面所述的数据异常点的异常维度确定方法。
[0014]第四方面,本公开实施例提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的数据异常点的异常维度确定方法。
[0015]本公开实施例提供的技术方案与现有技术相比具有如下优点:提供了一种自动确定数据异常点的异常维度的方案,能够帮助企业快速定位异常维度,降低企业分析异常数据的门槛,提高了问题排查效率、降低人工成本。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0017]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本公开实施例所提供的一种数据异常点的异常维度确定方法的流程示意图;
[0019]图2为本公开实施例所提供的另一种数据异常点的异常维度确定方法的流程示意图;
[0020]图3为本公开实施例提供的一种异常维度分析界面图;
[0021]图4为本公开实施例所提供的另一种数据异常点的异常维度确定方法的流程示意图;
[0022]图5为本公开实施例提供的另一种异常维度分析界面图;
[0023]图6为本公开实施例提供的一种维度分层设置界面图;
[0024]图7为本公开实施例所提供的一种数据异常点的异常维度确定装置的结构示意图;
[0025]图8为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0026]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0027]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
[0028]图1为本公开实施例所提供的一种数据异常点的异常维度确定方法的流程示意图,本公开实施例可以适用于数据异常监控分析场景下,对数据异常点的异常维度分析。本公开实施例提供的方法可以由数据异常点的异常维度确定装置来执行,该装置可以采用软件和/或硬件实现,并可集成在任意具有计算能力的电子设备上,例如智能手机、平板电脑等用户终端。
[0029]如图1所示,本公开实施例提供的数据异常点的异常维度确定方法可包括:
[0030]步骤101,获取发生异常的指标和异常值。
[0031]本公开实施例中,在检测到数据异常点的情况下,获取该数据异常点的指标、以及与指标对应的异常值。其中,数据异常点是指基于某一指标检测到异常数据的监控周期,例如,指标为应用程序点击量,监控周期为每天,若检测到当天的应用程序点击量大于预设值,则确定当天的应用程序点击量异常,进而确定为数据异常点。
[0032]下面对本公开实施例中涉及的术语进行解释说明。
[0033]其中,指标用于指示对何种数据进行异常监控,例如指标可以是点击量、下载次
数、点击率等。
[0034]每一指标可对应一个或多个维度,例如维度可以是国家、城市、地区、设备型号、屏幕高度等。
[0035]每一维度可对应一个或多个维度值,例如对于城市这一维度,对应的维度值可以是北京、上海等。
[0036]指标值是指基于指标检测得到的数据,例如,基于下载次数这一指标检测得到在北京这一维度值下的指标值为500次,在上海这一维度值下的指标值为700次。
[0037]异常值可包括:在发生异常的周期内基于指标检测得到的总体指标值,以及在该指标的各维度值下的指标值。
[0038]可选的,确定数据异常点的实现方式可包括:获取用于异常监控的指标和监控周期,以及获取多个历史监控周期内与指标对应的多个历史指标值,进而,根据预测算法和历史指标值进行预测,生成当前监控周期的预测区间,其中,该预测区间用于指示当前监控周期内指标值在正常情况下的取值范围,预测算法可采用prophet算法等。进一步,采集当前监控周期内与指标对应的指标值,将采集的指标值与预测区间进行比较,若采集的指标值处于预测区间外,确定指标值存在异常,当前监控周期为数据异常点。
[0039]步骤102,遍历指标的所有维度值,根据指标的指标类型、异常值、历史周期内的检测数据,计算每一维度值的占比变化。
[0040]本公开实施例中,对于每一维度值,可以确定该维度值在异常值中的占比情况,以及确定该维度值在历史周期内的检测数据中的占比情况,进而根据在异常值和检测数据中的占比情况,确定占比变化。
[0041]其中,历史周期可以是基于该指标没有检测到异常值的监控周期,该历史周期可以是当前周期的上一周期,也可以是预先设置的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据异常点的异常维度确定方法,其特征在于,包括:获取发生异常的指标和异常值;遍历所述指标的所有维度值,根据所述指标的指标类型、所述异常值、历史周期内的检测数据,计算每一维度值的占比变化;若所述占比变化与大于阈值,则确定为异常维度值。2.如权利要求1所述的方法,其特征在于,所述指标类型为累加型,所述根据所述指标的指标类型、所述异常值、历史周期内的检测数据,计算每一维度值的占比变化,包括:根据所述异常值确定当前周期内所述每一维度值的第一占比,根据所述检测数据确定历史周期内所述每一维度值的第二占比;将所述第一占比与所述第二占比之间的差值,作为所述每一维度值的占比变化。3.如权利要求1所述的方法,其特征在于,所述指标类型为比率型,所述根据所述指标的指标类型、所述异常值、历史周期内的检测数据,计算每一维度值的占比变化,包括:根据所述异常值确定当前周期内所述每一维度值的第一分子占比和第一分母占比,根据所述检测数据确定历史周期内所述每一维度值的第二分子占比和第二分母占比;将所述第一分子占比与所述第二分子占比之间的差值,作为所述每一维度值的分子占比变化;将所述第一分母占比与所述第二分母占比之间的差值,作为所述每一维度值的分母占比变化;将所述分子占比变化与所述分母占比变化之间差值的绝对值,作为所述每一维度值的占比变化。4.如权利要求1

3任一项所述的方法,其特征在于,所述占比变化的分布为偏态分布,所述根据所述每一维度值的占比变化计算平均值,包括:将所述占比变化的偏态分布表示转换为正态分布表示,根据转换后的占比变化计算平均值;所述若所述占比变化大于阈值,则确定为异常维度值,包括:根据所述每一维度值的占比变化计算平均值和标准差;若所述占比变化大于所述平均值与两倍所述标准差之和,则...

【专利技术属性】
技术研发人员:桑文锋刘耀洲曹犟付力力安志远岳帅胡士文肖又维
申请(专利权)人:神策网络科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1