一种基于子空间簇的多维数据异常值识别方法及系统技术方案

技术编号:40468125 阅读:15 留言:0更新日期:2024-02-22 23:22
本发明专利技术公开了一种基于子空间簇的多维数据异常值识别方法及系统,该方法包括:获取多维网络数据并根据数据时刻进行数据切分处理,得到切分后的多维网络数据;引入维度强相关系数对切分后的多维网络数据进行相关性计算处理,构建子空间簇;获取子空间簇的样本均值与子空间簇的距离系数均值,对子空间簇进行异常值识别处理,得到识别结果。该系统包括:多维数据切分模块、子空间簇识别模块和异常值识别模块。本发明专利技术能够通过减少强关联数据对异常值检测的影响和判断,从而提高异常值检测的精度。本发明专利技术作为一种基于子空间簇的多维数据异常值识别方法及系统,可广泛应用于数据识别技术领域。

【技术实现步骤摘要】

本专利技术涉及数据识别,尤其涉及一种基于子空间簇的多维数据异常值识别方法及系统


技术介绍

1、5g网络和数据网络快速发展,app数据和ai数据的极速增长;日常的网络运行过程中会产生各种网络数据,各种网络例如网站、app或者小程序等,譬如网络用户各类数据、网络应用性能数据,网络数据的复杂度和多样性同时也使网络数据分析难度不断增加。另外,网络数据的异常值可以提供有关整个网络中局部异常的信息,为了网络的正常安全运行,网络数据异常值检测研究需要应用于网络维护工作中。异常值检测有利于实现自动运维,可以自动识别kpi异常点,或者实现自动上报,提醒现在的网络质量状态,从而为网络的正常运行提供有力保障,现有的网络数据异常值检测方法包括基于统计的方法和基于分布的方法,其中,基于统计的方法主要是根据统计学原理,对网络数据进行均值、方差、标准差等统计分析,以判断是否存在异常值,基于分布的方法主要是根据数据分布的特性,通过观察数据分布情况来检测异常值。例如,均方差方法可以用来判断数据分布的离散程度,从而识别异常值,但是现有异常值检测方法缺少对多维数据间关联性全面和有效地分析,缺本文档来自技高网...

【技术保护点】

1.一种基于子空间簇的多维数据异常值识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述获取多维网络数据并根据数据时刻进行数据切分处理,得到切分后的多维网络数据这一步骤,其具体包括:

3.根据权利要求2所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述多维数据网格的表达式具体如下所示:

4.根据权利要求1所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述引入维度强相关系数对所述切分后的多维网络数据进行相关性计算处理,构建子空间簇这一步骤,其具体包括:

...

【技术特征摘要】

1.一种基于子空间簇的多维数据异常值识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述获取多维网络数据并根据数据时刻进行数据切分处理,得到切分后的多维网络数据这一步骤,其具体包括:

3.根据权利要求2所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述多维数据网格的表达式具体如下所示:

4.根据权利要求1所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述引入维度强相关系数对所述切分后的多维网络数据进行相关性计算处理,构建子空间簇这一步骤,其具体包括:

5.根据权利要求4所述一种基于子空间簇的多维数据异常值识别方法,其特征在于,所述切分后的多维网络数据的协方差矩阵的计算表达式具体如下所示:...

【专利技术属性】
技术研发人员:黄志青余俊
申请(专利权)人:广州恒沙数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1