基于Wasserstein距离和联合优化策略的云数据中心异常定位方法技术

技术编号:38404682 阅读:16 留言:0更新日期:2023-08-07 11:14
本发明专利技术公开了基于Wasserstein距离和联合优化策略的云数据中心异常定位方法,涉及计算机技术领域,包括S1构建异常检测模型;S2获取历史数据,并导入异常检测模型进行训练优化;S3实时获取数据中心传感器设备的采集数据;S4采集数据导入优化后的异常检测模型进行异常检测,并得到异常结果;基于使用Wasserstein距离和梯度惩罚的GAN架构和并行训练的长短期记忆网络预测器实现。使用Wasserstein距离和梯度惩罚,可以正确衡量生成器生成的数据和原始样板数据之间的分布差异,解决经典GAN模型中使用JS散度导致的模式崩溃和梯度消失的问题,使整个训练过程稳定且收敛。LSTM神经网络对数据进行特征提取并预测下一个时间步的预期值,使用预测误差参与异常打分阶段提高模型的异常检测精度。常检测精度。常检测精度。

【技术实现步骤摘要】
基于Wasserstein距离和联合优化策略的云数据中心异常定位方法


[0001]本专利技术涉及计算机
,尤其涉及一种基于Wasserstein距离和联合优化策略的云数据中心异常定位方法。

技术介绍

[0002]近年来,云计算技术的发展日新月异。作为支持云计算服务的基础设施,云数据中心是一套复杂的高度虚拟化、自动化的设施,使得系统容易陷入异常,导致低质量的用户体验。因此,云数据中心的异常检测技术至关重要,因为数据主要来自物联网(IoT)的各种传感器。因此,我们一般会在云数据中心中考虑到多变量时间序列异常检测。然而,由于异常点的稀疏性和时间数据的噪声,异常点的模式可能与正常模式相似,这导致一些细微异常很难被区分。此外,现有的检测技术仍然有很高的误报率,并将正常行为判断为异常行为。因此,在保证多变量时间序列数据的检测召回率的同时降低误报率仍然是一个挑战,由于在多变量时间序列分析中效果较好,基于深度学习的异常检测方法吸引了越来越多的研究兴趣,近年来,国内外相关研究人员在多元时间序列异常检测方面取得了相当大的进展,根据是否使用神经网络,时间序列异常检测算法主要分为两类传统的时间序列异常检测方法和基于深度学习的异常检测方法,时间序列异常检测方法的缺点是需要关于异常持续时间和异常数量的先验知识,或者难以扩展到处理云数据中心中具有非线性和非平滑序列的多变量时间序列;基于深度学习的异常检测方法的缺点是在处理非线性、高维度和噪声数据时有局限性。
[0003]因此,现有的异常检测方法仍然存在以下不足:

由于物联网监控对象的复杂性和高动态性,采集的实时数据的非平稳、非线性和高噪声等特性使得时间序列不同时间特性和空间特性之间的相关性信息提取难度增加,导致异常检测的假阳率增加。

面对高维、海量的数据,现有的基于深度学习的检测方法通常采用单一的异常判定标准,这难以满足实际生产环境中对细微异常的有效检出的需求。

技术实现思路

[0004]本专利技术的目的就在于为了解决上述问题设计了一种基于Wasserstein距离和联合优化策略的云数据中心异常定位方法。
[0005]本专利技术通过以下技术方案来实现上述目的:
[0006]基于Wasserstein距离和联合优化策略的云数据中心异常定位方法,包括:
[0007]S1、构建异常检测模型,异常检测模型包括数据处理层、预测器、生成器、判别器和输出层,数据处理层用于处理导入异常检测模型的数据,输出层用于分析并输出异常结果,数据处理层的输出作为预测器、生成器和判别器的输入,预测器、生成器和判别器的输出均作为输出层的输入;
[0008]S2、获取历史数据,并导入异常检测模型进行训练优化;
[0009]S3、实时获取数据中心传感器设备的采集数据;
[0010]S4、采集数据导入优化后的异常检测模型进行异常检测,并得到异常结果。
[0011]本专利技术的有益效果在于:本技术基于使用Wasserstein距离和梯度惩罚的GAN架构和并行训练的长短期记忆网络预测器实现。一方面,使用Wasserstein距离和梯度惩罚,可以正确衡量生成器生成的数据和原始样板数据之间的分布差异,从而解决经典GAN模型中使用JS散度导致的模式崩溃和梯度消失的问题,使整个训练过程稳定且收敛。另一方面,使用LSTM神经网络对数据的时序信息进行特征提取并由此预测下一个时间步的预期值,使用预测误差参与异常打分阶段提高模型的异常检测精度。
附图说明
[0012]图1是本专利技术基于Wasserstein距离和联合优化策略的云数据中心异常定位方法的模型架构图;
[0013]图2是本专利技术基于Wasserstein距离和联合优化策略的云数据中心异常定位方法的流程示意图;
[0014]图3是本异常检测模型与所有基线方法在4个数据集上的异常检测性能指标对比图;
[0015]图4是本异常检测模型与与基于GAN的多元时间序列异常检测方法MADGAN的训练过程收敛性对比图;
[0016]图5是本专利技术基于Wasserstein距离和联合优化策略的云数据中心异常定位方法与5种异常检测方法在4个数据集上的检测性能对比。
具体实施方式
[0017]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0018]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0020]在本专利技术的描述中,需要理解的是,术语“上”、“下”、“内”、“外”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该专利技术产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0021]此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0022]在本专利技术的描述中,还需要说明的是,除非另有明确的规定和限定,“设置”、“连接”等术语应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也可以通过中间媒介间接连接,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。
[0023]下面结合附图,对本专利技术的具体实施方式进行详细说明。
[0024]如图1、图2所示,基于Wasserstein距离和联合优化策略的云数据中心异常定位方法,包括:
[0025]S1、构建异常检测模型,异常检测模型包括数据处理层、预测器、生成器、判别器和输出层,数据处理层用于处理导入异常检测模型的数据,输出层用于分析并输出异常结果,数据处理层的输出作为预测器、生成器和判别器的输入,预测器、生成器和判别器的输出均作为输出层的输入;生成器包括三层MLP神经网络,MLP神经网络的隐藏层的大小为输入数据维度的一半,判别器包括一层一维卷积层和两层MLP神经网络,一维卷积层的卷积核大小为3,padding为1,预测器包括两层LSTM神经网络和一层MLP神经网络。
[0026]S2、获取历史数据,并导入异常检测模型进行训练优化;具体包括:
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于Wasserstein距离和联合优化策略的云数据中心异常定位方法,其特征在于,包括:S1、构建异常检测模型,异常检测模型包括数据处理层、预测器、生成器、判别器和输出层,数据处理层用于处理导入异常检测模型的数据,输出层用于分析并输出异常结果,数据处理层的输出作为预测器、生成器和判别器的输入,预测器、生成器和判别器的输出均作为输出层的输入;S2、获取历史数据,并导入异常检测模型进行训练优化;S3、实时获取数据中心传感器设备的采集数据;S4、采集数据导入优化后的异常检测模型进行异常检测,并得到异常结果。2.根据权利要求1所述的基于Wasserstein距离和联合优化策略的云数据中心异常定位方法,其特征在于,生成器包括三层MLP神经网络,MLP神经网络的隐藏层的大小为输入数据维度的一半,判别器包括一层一维卷积层和两层MLP神经网络,一维卷积层的卷积核大小为3,padding为1,预测器包括两层LSTM神经网络和一层MLP神经网络。3.根据权利要求1所述的基于Wasserstein距离和联合优化策略的云数据中心异常定位方法,其特征在于,S2包括:S21、获取历史数据,历史数据为多变量时间序列x=[x1,x2,

,x
T
],其中T为多变量时间序列的长度,x
t
∈R
M
是在时间t的值,M是输入中的特征数;S22、对历史数据进行预处理获得训练数据集X∈R
N
×
S
,x
1:T
被分割成N个长度为S的时间序列,用x
i,1:S
来表示X中的第i
th
个时间序列;S23、数据处理层对训练数据集进行最大值最小值归一化处理,根据提前设定好的滑动窗口来输入数据到生成器、判别器和预测器中,每一个滑动窗口分为条件域数据和目标域数据;S24、滑动窗口的目标域数据作为生成器和判别器的输入,滑动窗口的目标域数据和条件域均作为预测器的输入;S25、滑动窗口的目标域数据加上潜在空间的噪声后,由生成器进行重构输出重构后的数据,判别器比较滑动窗口的目标域数据和生成器重构的数据,进行相似度判断,利用相似度判断的结果更新生成器的训练参数,直到生成器和判别器之间达到纳什均衡;滑动窗口的条件域数据输入到预测器,预测器输...

【专利技术属性】
技术研发人员:陈鹏戚思博陈娟任建华单文煜张永辉牛宪华徐雷
申请(专利权)人:衢州海易科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1