异常数据的确定方法、装置及存储介质制造方法及图纸

技术编号:38740897 阅读:12 留言:0更新日期:2023-09-08 23:25
本申请提供一种异常数据的确定方法、装置及存储介质,涉及通信领域,用于提高异常数据检测结果的准确性。该方法包括:获取历史时段的第一指标信息和目标时段的第二指标信息。将第一指标信息输入训练后的预测模型,得到预测模型输出的第一预测范围,第一预测范围包括:第二指标信息中每个指标数据的标准范围。根据第二指标信息与第一预测范围,确定第一类数据,第一类数据为第二指标信息中指标数据未在指标数据的标准范围内的数据。根据预设检测规则对第一类数据进行检测,确定第二类数据,第二类数据为第一类数据中未满足预设检测规则的数据。确定异常数据,异常数据包括第二类数据。据。据。

【技术实现步骤摘要】
异常数据的确定方法、装置及存储介质


[0001]本申请涉及通信领域,尤其涉及一种异常数据的确定方法、装置及存储介质。

技术介绍

[0002]随着互联网技术的普及与发展,互联网平台所涉及的业务场景越来越纷繁多样,业务指标数据也随之增多。工作人员需要对大规模的业务指标数据进行监控,以及时发现异常指标数据。
[0003]目前,异常检测的方法主要包括:基于规则的异常检测和基于统计的异常检测。其中,基于规则的异常检测是根据经验设定相关的规则确定异常指标数据,例如:设置固定的阈值;基于统计的异常检测是利用数据统计的分布规律确定异常指标数据,例如:通过绝对中位差或极值理论获得异常指标数据。但是,上述方法可能会导致异常指标数据检测结果不准确。

技术实现思路

[0004]本申请提供一种异常数据的确定方法、装置及存储介质,用于提高异常数据检测结果的准确性。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供一种异常数据的确定方法。该方法中,异常数据的确定装置(可以简称为“确定装置”)获取历史时段的第一指标信息和目标时段的第二指标信息,指标信息包括多个指标数据,历史时段为目标时段之前的时段。确定装置可以将第一指标信息输入训练后的预测模型,得到预测模型输出的第一预测范围,预测模型用于预测第二指标信息中指标数据的标准范围,第一预测范围包括:第二指标信息中每个指标数据的标准范围。确定装置可以根据第二指标信息与第一预测范围,确定第一类数据,第一类数据为第二指标信息中未在标准范围内的指标数据。之后,确定装置可以根据预设检测规则对第一类数据进行检测,确定第二类数据,第二类数据为第一类数据中未满足预设检测规则的指标数据。确定装置可以确定异常数据,异常数据包括第二类数据。
[0007]可选的,异常数据的确定方法还包括:确定装置可以根据第二指标信息和第一类数据,确定第三类数据,第三类数据为第二指标信息中除第一类数据以外的指标数据。确定装置可以根据预设检测规则对第三类数据进行检测,确定第四类数据,第四类数据为第三类数据中未满足预设检测规则的指标数据。其中,异常信息还包括第四类数据。
[0008]可选的,第一指标信息和第二指标信息均为第一维度对应的用户的指标信息。异常数据的确定方法还包括:确定装置可以获取目标时段的第三指标信息,第三指标信息为第二维度对应的用户的指标信息,第二维度对应的用户包括第一维度对应的用户。上述“获取历史时段的第一指标信息和目标时段的第二指标信息”包括:若第三指标信息中存在未满足预设检测规则的指标数据,确定装置则可以获取历史时段的第一指标信息和目标时段的第二指标信息。
[0009]可选的,维度包括以下至少一项:地理维度、时间维度、业务类型维度。
[0010]第二方面,本申请提供一种异常数据的确定装置,该装置包括获取模块、处理模块。
[0011]获取模块,用于获取历史时段的第一指标信息和目标时段的第二指标信息,指标信息包括多个指标数据,历史时段为目标时段之前的时段。处理模块,用于将第一指标信息输入训练后的预测模型,得到预测模型输出的第一预测范围,预测模型用于预测第二指标信息中指标数据的标准范围,第一预测范围包括:第二指标信息中每个指标数据的标准范围。处理模块,还用于根据第二指标信息与第一预测范围,确定第一类数据,第一类数据为第二指标信息中未在标准范围内的指标数据。处理模块,还用于根据预设检测规则对第一类数据进行检测,确定第二类数据,第二类数据为第一类数据中未满足预设检测规则的指标数据。处理模块,还用于确定异常数据,异常数据包括第二类数据。
[0012]可选的,处理模块,还用于根据第二指标信息和第一类数据,确定第三类数据,第三类数据为第二指标信息中除第一类数据以外的指标数据。处理模块,还用于根据预设检测规则对第三类数据进行检测,确定第四类数据,第四类数据为第三类数据中未满足预设检测规则的指标数据。其中,异常数据还包括第四类数据。
[0013]可选的,第一指标信息和第二指标信息均为第一维度对应的用户的指标信息。获取模块,还用于获取目标时段的第三指标信息,第三指标信息为第二维度对应的用户的指标信息,第二维度对应的用户包括第一维度对应的用户。获取模块,具体用于若第三指标信息中存在未满足预设检测规则的指标数据,则获取历史时段的第一指标信息和目标时段的第二指标信息。
[0014]可选的,维度包括以下至少一项:地理维度、时间维度、业务类型维度。
[0015]第三方面,本申请提供了一种异常数据的确定装置,该装置包括:处理器和存储器。处理器和存储器耦合。存储器用于存储一个或多个程序,该一个或多个程序包括计算机执行指令,当该异常数据的确定装置运行时,处理器执行该存储器存储的该计算机执行指令,以实现如第一方面中的任一种可能的实现方式中所描述的异常数据的确定方法。
[0016]第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述第一方面中的任一种可能的实现方式中所描述的异常数据的确定方法。
[0017]第五方面,本申请提供了一种计算机程序产品,包括计算机程序,当其计算机程序被处理器执行时,使得计算机实现如第一方面中的任一种可能的实现方式中所描述的异常数据的确定方法。
[0018]上述方案中,异常数据的确定装置、计算机设备、计算机存储介质或者计算机程序产品所能解决的技术问题以及实现的技术效果可以参见上述第一方面所解决的技术问题以及技术效果,在此不再赘述。
[0019]本申请提供的技术方案至少带来以下有益效果:服务器可以获取历史时段的第一指标信息和历史时段之后的目标时段的第二指标信息,指标信息包括多个指标数据。然后,服务器可以将第一指标信息输入训练后的预测模型,确定第一预测范围,即第二指标信息中每个指标数据的标准范围。接着,服务器可以根据第二指标信息与第一预测范围,确定第一类数据,第一类数据为第二指标信息中未在标准范围内的指标数据。如此,服务器可以先
通过预测模型,确定多个指标数据中是否存在异常数据(即未在标准范围内的数据)。之后,服务器可以根据预测检测规则对第一类数据进行检测,确定第二类数据和异常数据,第二类数据为第一类数据中未满足预测检测规则的指标数据。这样一来,在服务器通过预测模型确定多个指标数据中是否存在异常数据之后,服务器可以根据预设检测规则,对通过预测模型得到的异常数据再次进行检测。这样一来,可以提高异常数据检测结果的准确性。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
[0021]图1是根据一示例性实施例示出的一种异常数据的确定系统的架构示意图;
[0022]图2是根据一示例性实施例示出的一种异常数据的确定方法的流程图;
[0023]图3是根据一示例性实施例示出的另一种异常数据的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常数据的确定方法,其特征在于,所述方法包括:获取历史时段的第一指标信息和目标时段的第二指标信息,指标信息包括多个指标数据,所述历史时段为所述目标时段之前的时段;将所述第一指标信息输入训练后的预测模型,得到所述预测模型输出的第一预测范围,所述预测模型用于预测所述第二指标信息中所述指标数据的标准范围,所述第一预测范围包括所述第二指标信息中每个所述指标数据的标准范围;根据所述第二指标信息与所述第一预测范围,确定第一类数据,所述第一类数据为所述第二指标信息中未在所述标准范围内的指标数据;根据预设检测规则对所述第一类数据进行检测,确定第二类数据,所述第二类数据为所述第一类数据中未满足所述预设检测规则的指标数据;确定异常数据,所述异常数据包括所述第二类数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第二指标信息和所述第一类数据,确定第三类数据,所述第三类数据为所述第二指标信息中除所述第一类数据以外的指标数据;根据所述预设检测规则对所述第三类数据进行检测,确定第四类数据,所述第四类数据为所述第三类数据中未满足所述预设检测规则的指标数据;其中,所述异常数据还包括所述第四类数据。3.根据权利要求1或2所述的方法,其特征在于,所述第一指标信息和所述第二指标信息均为第一维度对应的用户的指标信息;在获取历史时段的第一指标信息和目标时段的第二指标信息之前,所述方法还包括:获取所述目标时段的第三指标信息,所述第三指标信息为第二维度对应的用户的指标信息,所述第二维度对应的用户包括所述第一维度对应的用户;所述获取历史时段的第一指标信息和目标时段的第二指标信息,包括:若所述第三指标信息中存在未满足所述预设检测规则的指标数据,则获取所述历史时段的第一指标信息和所述目标时段的第二指标信息。4.根据权利要求3所述的方法,其特征在于,维度包括以下至少一项:地理维度、时间维度、业务类型维度。5.一种异常数据的确定装置,其特征在于,所述装置包括:获取模块,用于获取历史时段的第一指标信息和目标时段的第二指标信息,指标信息包括多个指标数据,所述历史时段为所述目标时段之前的时段;处理模块,用于将所述第一指标信息输入训练后的预测模型,得到所述预测模型输出的第一预测范围,所述预测模型...

【专利技术属性】
技术研发人员:路程张进
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1