【技术实现步骤摘要】
一种基于GCN
‑
LSTM和注意力机制的异常检测方法及系统
[0001]本专利技术涉及人工智能检测
,更具体的,涉及一种基于GCN
‑
LSTM和注意力机制的异常检测方法及系统。
技术介绍
[0002]在现在的社会中,云计算服务正在被广泛应用。云计算服务,指的是基于互联网的相关服务的增加、使用和交互模式,通过互联网技术来提供可扩展以及可虚拟化的资源。由于云计算服务的架构日渐庞大,现在对系统相对应的性能指标数据也会随之增多,因此需要大量的运维人员来对系统环境进行部署和维护。
[0003]现在对于云计算服务的异常目前还没有一个统一的定义,因而在不同的应用场景所发生的异常会有不同的定义。目前普遍定义的异常值是指偏离整体样本的观察值。在经过长年的发展,形成了不同的类型的异常检测,比如:基于规则的异常检测方法、基于统计的异常检测方法、基于机器学习的异常检测方法以及基于概率统计的异常检测。
[0004]现有的异常检测方法面临如下几个难点和挑战:
[0005]一是使用场景受限,不少方法仅能在特定要求时保持优秀的表现,例如拥有完善的规则库和专家知识库,有满足模型要求的数据等,如果不能符合这些要求,这些方法往往表现不佳。
[0006]二是数据分类不平衡,标签依赖程度高。由于云服务器在实际运行过程中,发生异常的频率较低,所采集的异常数据量较少,当前效果较好的异常检测算法大多是有监督算法,需要使用大量有标签的异常数据;因此如何解决数据短缺的问题是当前异常检测任务不得不 ...
【技术保护点】
【技术特征摘要】
1.一种基于GCN
‑
LSTM和注意力机制的异常检测方法,其特征在于,包括以下步骤:S1.构建结合了GCN网络和LSTM网络的GCN
‑
LSTM模型,并构建基于GCN
‑
LSTM模型的序列重构模型;所述的序列重构模型为融入了注意力模型的基于GCN
‑
LSTM模型的编码器
‑
解码器模型;S2.对得到的序列重构模型进行训练和测试,得到测试好的序列重构模型;S3.将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列;S4.将重构序列和待检测数据序列作差,构建误差序列,并将误差序列分为训练数据集和测试数据集两部分;S5.构建基于Copula函数的异常检测模型,并将训练数据集输入异常检测模型中进行训练;S6.将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果。2.如权利要求1所述的基于GCN
‑
LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S3中,将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列的过程具体为;S301.获取待检测数据序列,将待检测数据序列以时序排列,将排列好的待检测数据序列输入序列重构模型中的编码器
‑
解码器模型中的编码器,通过编码器提取待检测数据序列的特征;S302.将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量;S303.将特征结合加权向量输入到解码器中,通过解码器解码得到重构序列。3.如权利要求2所述的基于GCN
‑
LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S301中,将排列好的待检测数据序列输入序列重构模型中的编码器
‑
解码器模型中的编码器,通过编码器提取待检测数据序列的特征的过程具体为:A1.设初始时间t0=t
‑
s+1,其中s为待检测数据序列时长,t为时间变量,将排列好的待检测数据序列表示为待检测数据序列A2.结合GCN网络的边集合E,通过第1个GCN
‑
LSTM模型的GCN网络单元提取待检测数据序列中数据的空间特征,将得到的空间特征输入第1个GCN
‑
LSTM模型的LSTM网络中提取其时间特征并得到的隐藏层状态将得到的隐藏层状态输入下一个GCN
‑
LSTM模型中;A3.结合上一个GCN
‑
LSTM模型得到的隐藏层状态和GCN网络的边集合E,通过第2个GCN
‑
LSTM模型的GCN网络提取待检测数据序列中数据的空间特征,将得到的空间特征输入第2个GCN
‑
LSTM模型的LSTM网络中,提取其时间特征并得到的隐藏层状态将得到的隐藏层状态输入下一个GCN
‑
LSTM模型中;以此递进,直到得到整个待检测数
据序列的隐藏层状态,将整个待检测数据序列的隐藏层状态整理为特征的序列4.如权利要求3所述的基于GCN
‑
LSTM和注意力机制的异常检测方法,其特征在于:在所述的步骤S302中,将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量的过程具体为:B1.将特征的序列输入注意力模型,计算当前时刻t对应各个历史时刻的时间注意力权重向量a
t
,具体表示为:其中,W
a
是可训练权重矩阵;b
a
是注意力权重的偏置向量;tanh表示激活函数;最后有:其中,a
i
为第i时刻的注意力权重值;B2.通过softmax函数对得到的各个时间的注意力权重系数进行归一化处理,得到时间注意力权重有:有:B3.将得到时间注意力权重与其对应的特征的序列进行加权,得到加权向量c
t
,具体表示为:5.如权利要求1所述的基于GCN
‑
LSTM和注意力机制的异常检测方法,其特征在于:在所述的步骤S6中,将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果的过程具体为:S601.面向测试数据集的每一个维度,使用非参数方法估计其异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,并且计算偏度系数;S602.根据得到的测试数据集的每一个维度异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,计算测试数据集中每一个时间快照的empiricalcopula观测值;S603.根据测试数据集中每一个时间快照的empirical copula观测值获得偏度系数的empirical copula观测值;S604.根据得到的测试数据集中每一个时间快照的empirical copula观测值和偏度系数的empirical copula观测值,计算测试数据集中每一个时间快照的左尾部、右尾部以及偏度系数的概率;S605.根据测试数据集中每一...
【专利技术属性】
技术研发人员:郭炜彬,陈家辉,石林,叶臻强,黄浩楠,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。