异常检测方法、装置、存储介质和计算机设备制造方法及图纸

技术编号：32974991 阅读：18 留言：0更新日期：2022-04-09 11:50

本申请提供了一种异常检测方法、装置、存储介质和计算机设备，包括：基于采集数据构建内容异常检测模型，基于k

全部详细技术资料下载

【技术实现步骤摘要】
异常检测方法、装置、存储介质和计算机设备

[0001]本申请属于异常检测
，具体涉及一种异常检测方法、装置、存储介质和计算机设备。

技术介绍

[0002]异常检测技术常被应用于众多领域，如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据，显著提升准确性。
[0003]现有的异常检测技术采用最近邻算法，最近邻算法主要基于正常的数据对象会比较集中，而异常往往与它的邻居远离的假设。在最近邻算法中，采用测试对象到其第k个最近邻的距离作为异常程度的分数。这种算法的基本机制是：数据的异常分数是其与其第k个邻居之间的距离。然后设定一个阈值，如果测试数据的异常分数大于这个阈值，那么这个数据就是异常的，反之，这个数据就是正常的。或者，将所有数据按异常分数排序，把最大的n个挑选出来作为异常。
[0004]由于基于最近邻的异常检测算法根本上是利用被检测点到第k个最近邻的距离。但是，基于最近邻的异常检测算法的偶然性很大，而且参数k的选择对异常检测的性能影响非常大。如果k很小，那么一部分以小团体形式存在的异常就不会被检测出来，反之，如果k很大，那么很多正常的点都会被误报。在实际应用中，异常出现的规模通常不是均匀的，也就是说异常点有时是很孤立的，有时是小团体，导致现有的基于最近邻的异常检测算法的误判效率较高。

技术实现思路

[0005]因此，本申请要解决的技术问题在于提供一种异常检测方法、装置、存储介质和计算机设备，能够降低异常检...

【技术保护点】

【技术特征摘要】
1.一种异常检测方法，其特征在于，包括：基于采集数据构建内容异常检测模型，基于k
‑
means聚类算法构建上下文异常检测模型；通过所述内容异常检测模型判断输入数据是否为内容异常数据；在所述输入数据为所述内容异常数据的情况下，获取所述输入数据的上下文信息；通过所述上下文异常检测模型基于所述上下文信息判断所述内容异常数据是否为异常数据。2.根据权利要求1所述的异常检测方法，其特征在于，所述基于采集数据构建内容异常检测模型，包括：通过单变量高斯预测函数基于采集数据构建内容异常检测模型的历史模型。3.根据权利要求1所述的异常检测方法，其特征在于，所述基于k
‑
means聚类算法构建上下文异常检测模型，包括：通过所述k
‑
means聚类算基于采集大数据构建所述上下文异常检测模型；所述上下文异常检测模型基于多元高斯函数判断所述内容异常数据是否为异常数据。4.根据权利要求1所述的异常检测方法，其特征在于，通过所述上下文异常检测模型基于所述上下文信息判断所述内容异常数据是否为异常数据，包括：确定所述内容异常数据的聚类个数，并确定所述内容异常数据的聚类类别；计算所述内容异常数据的稠密度，基于所述稠密度通过k
‑
means聚类算法将所述内容异常数据迭代至类别对应的聚类中；通过所述上下文异常检测模型基于所述稠密度判断所述内容异常数据是否为异常数据。5.根据权利要求4所述的异常检测方法，其特征在于，所述计算所述内容异常数据的稠密度，包括：计算所述内容异常数据中数据点p的k
‑
距离；基于所述数据点p的k
‑
距离计算所述数据点p的k
‑
距离邻居聚类；计算所述数据点p与数据点o的可达距离；基于所述可达距离计算...

【专利技术属性】
技术研发人员：唐海龙，胡绍勇，
申请(专利权)人：上海观安信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人