【技术实现步骤摘要】
异常数据检测方法、装置、设备及存储介质
[0001]本申请属于异常检测技术,尤其涉及一种异常数据检测方法、装置、设备及存储介质。
技术介绍
[0002]通常,为了便于维护电子设备运行的稳定性,开发人员需要在电子设备运行过程中,对电子设备的多个性能进行异常数据检测,以及时发现电子设备的性能异常数据点。
[0003]目前,业界主要通过3
‑
sigma算法来检测异常数据,而3
‑
sigma算法是非时序异常检测算法,且使用3
‑
sigma算法的前提是假设所有数据均呈正态分布。这样,由于非时序异常检测算法对周期性数据和趋势性数据并不友好,且电子设备中不同性能对应的待测数据未必都符合正态分布的规律,因此,导致异常数据的检测结果并不准确。
技术实现思路
[0004]本申请实施例提供一种异常数据检测方法、装置、设备及存储介质,能够提高异常数据检测结果的准确性。
[0005]第一方面,本申请实施例提供一种异常数据检测方法,该方法包括:
[0006]获取参考时序数据和待测时序数据;
[0007]根据参考时序数据的分布特征,确定待测时序数据中每个待测数据对应的偏离度,其中,偏离度包括基于预测数据的第一偏离度、基于全局分布的第二偏离度以及基于局部分布的第三偏离度;
[0008]根据待测时序数据中每个待测数据对应的偏离度,确定待测时序数据中的异常数据。
[0009]第二方面,本申请实施例提供一种异常数据检测方法,该方法包括:< ...
【技术保护点】
【技术特征摘要】
1.一种异常数据检测方法,包括:获取参考时序数据和待测时序数据;根据所述参考时序数据的分布特征,确定所述待测时序数据中每个待测数据对应的偏离度,其中,所述偏离度包括基于预测数据的第一偏离度、基于全局分布的第二偏离度以及基于局部分布的第三偏离度;根据所述待测时序数据中每个待测数据对应的偏离度,确定所述待测时序数据中的异常数据。2.根据权利要求1所述的方法,其中,所述根据所述参考时序数据的分布特征,确定所述待测时序数据中每个待测数据对应的偏离度,包括:根据所述参考时序数据的分布特征,确定所述待测时序数据中每个待测数据对应的预测值;将所述待测数据的数据值与对应的预测值之间的差值,确定为所述待测数据对应的第一偏离度,得到所述待测时序数据中每个待测数据对应的第一偏离度。3.根据权利要求1所述的方法,其中,所述根据所述参考时序数据的分布特征,确定所述待测时序数据中每个待测数据对应的偏离度,包括:根据所述参考时序数据拟合得到目标分布;基于所述目标分布确定所述待测时序数据中每个待测数据对应的第二偏离度。4.根据权利要求3所述的方法,其中,所述目标分布为柯西
‑
洛伦兹分布;所述根据所述参考时序数据拟合得到目标分布,包括:获取所述参考时序数据对应的第一中位数,以及所述参考时序数据中每个参考数据对应的第四偏离度,其中,所述第四偏离度包括所述参考数据的数据值与所述第一中位数之间的差值;根据每个参考数据对应的第四偏离度,确定所述第四偏离度对应的第二中位数;以所述第一中位数为分布峰值位置的位置参数,以所述第二中位数为尺度参数,拟合得到所述目标分布。5.根据权利要求1所述的方法,其中,所述根据所述参考时序数据的分布特征,确定所述待测时序数据中每个待测数据对应的偏离度,包括:针对所述待测时序数据中每个待测数据,确定所述待测数据对应周围预设范围内的待测数据平均值;将所述待测数据对应的数据值与所述待测数据平均值之间的差值,确定为所述待测数据对应的第三偏离度,得到所述待测时序数据中每个待测数据对应的第三偏离度。6.根据权利要求1所述的方法,其中,所述根据所述待测时序数据中每个待测数据对应的偏离度,确定所述待测时序数据中的异常数据,包括:根据所述待测时序数据中每个待测数据对应的所述第一偏离度,确定所述待测时序数据中的第一异常数据;根据所述待测时序数据中每个待测数据对应的所述第二偏离度,确定所述待测时序数据中的第二异常数据;根据所述待测时序数据中每个待测数据对应的所述第三偏离度,确定所述待测时序数据中的第三异常数据;
将所述待测时序数据中同时属于所述第一异常数据、所述第二异常数据和所述第三异常数据的待测数据,确定为所述异常数据。7.根据权利要求6所述的方法,其中,所述根据所述待测时序数据中每个待测数据对应的所述第一偏离度,确定所述待测时序数据中的第一异常数据,包括:获取所述参考时序数据对应的数据幅值和数据抖动幅度;将所述待测时序数据中第一偏离度大...
【专利技术属性】
技术研发人员:孙婉宁,马旭华,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。