一种基于GCN-LSTM和注意力机制的异常检测方法及系统技术方案

技术编号:35187365 阅读:37 留言:0更新日期:2022-10-12 17:59
本发明专利技术公开了一种基于GCN

【技术实现步骤摘要】
一种基于GCN

LSTM和注意力机制的异常检测方法及系统


[0001]本专利技术涉及人工智能检测
,更具体的,涉及一种基于GCN

LSTM和注意力机制的异常检测方法及系统。

技术介绍

[0002]在现在的社会中,云计算服务正在被广泛应用。云计算服务,指的是基于互联网的相关服务的增加、使用和交互模式,通过互联网技术来提供可扩展以及可虚拟化的资源。由于云计算服务的架构日渐庞大,现在对系统相对应的性能指标数据也会随之增多,因此需要大量的运维人员来对系统环境进行部署和维护。
[0003]现在对于云计算服务的异常目前还没有一个统一的定义,因而在不同的应用场景所发生的异常会有不同的定义。目前普遍定义的异常值是指偏离整体样本的观察值。在经过长年的发展,形成了不同的类型的异常检测,比如:基于规则的异常检测方法、基于统计的异常检测方法、基于机器学习的异常检测方法以及基于概率统计的异常检测。
[0004]现有的异常检测方法面临如下几个难点和挑战:
[0005]一是使用场景受限,不少方法仅能在特定要求时保持优秀的表现,例如拥有完善的规则库和专家知识库,有满足模型要求的数据等,如果不能符合这些要求,这些方法往往表现不佳。
[0006]二是数据分类不平衡,标签依赖程度高。由于云服务器在实际运行过程中,发生异常的频率较低,所采集的异常数据量较少,当前效果较好的异常检测算法大多是有监督算法,需要使用大量有标签的异常数据;因此如何解决数据短缺的问题是当前异常检测任务不得不面对和思考的问题。
[0007]三是特征利用不充分。云服务器所记录的数据首先是一种时间序列数据,需要考虑其复杂的动态变化以及周期性;由于云计算服务所覆盖的地域和领域较广,且也是一种有着空间维度属性的数据,不同空间上的分布让其内部的运作情况也有区别。因此如何充分利用对时间序列上下文变量之间的变化和空间分布的变化是需要考虑的问题之一。
[0008]四是数据各维度之间的关联性问题。当前云服务器记录的数据各维度之间并不是相互独立的。不同维度之间的数据可能会存在非稳态的依赖关系,然而现有异常检测的算法无法充分考虑不同维度之间的数据之间的关联性。
[0009]五是目前检测方法采用的异常阈值界定标准模糊。不同领域的数据集对异常的概念定义都有一定差异,在实际的云计算服务工程应用中,如何选取合适的阈值区分异常与否也是当前算法和模型的一大难点。
[0010]现有技术有一种基于自编码器的无监督学习图像异常检测方法,该方法为:将样本分为训练样本和测试样本,分别对训练样本和测试样本进行预处理,然后将预处理之后的训练样本/测试样本输入到自编码器进行重建得到重建结果,分别计算其重建损失、重建过程中编码器和解码器对应层之间的加权特征一致性损失、特征判别损失和对抗损失;然后对上述损失加权求和,作为总的损失函数;最后计算测试样本的异常得分。然后使用特征
归一化将每个样本的异常得分映射到[0,1],计算接收者操作特征曲线下的面积作为评估指标。
[0011]然而现有技术有应用场景小、无法利用多维特征的问题,因此如何专利技术一种应用场景大,能够利用多维特征的异常检测方法,是本
亟需解决的问题

技术实现思路

[0012]本专利技术为了解决现有技术应用场景小、无法利用多维特征的问题,提供了一种基于GCN

LSTM和注意力机制的异常检测方法及系统,其具有结果准确,步骤清晰的特点。
[0013]为实现上述本专利技术目的,采用的技术方案如下:
[0014]一种基于GCN

LSTM和注意力机制的异常检测方法,包括以下步骤:
[0015]S1.构建结合了GCN网络和LSTM网络的GCN

LSTM模型,并构建基于GCN

LSTM模型的序列重构模型;所述的序列重构模型为融入了注意力模型的基于GCN

LSTM模型的编码器

解码器模型;
[0016]S2.对得到的序列重构模型进行训练和测试,得到测试好的序列重构模型;
[0017]S3.将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列;
[0018]S4.将重构序列和待检测数据序列作差,构建误差序列,并将误差序列分为训练数据集和测试数据集两部分;
[0019]S5.构建基于Copula函数的异常检测模型,并将训练数据集输入异常检测模型中进行训练;
[0020]S6.将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果。
[0021]优选的,在所述步骤S3中,将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列的过程,具体为;
[0022]S301.获取待检测数据序列,将待检测数据序列以时序排列,将排列好的待检测数据序列输入序列重构模型中的编码器,通过编码器提取待检测数据序列的特征;
[0023]S302.将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量;
[0024]S303.将特征结合加权向量输入到解码器中,通过解码器解码得到重构序列。
[0025]更进一步的,在所述步骤S301中,将排列好的待检测数据序列输入序列重构模型中的编码器

解码器模型中的编码器,通过编码器提取待检测数据序列的特征的过程具体为:
[0026]A1.设初始时间t0=t

s+1,其中s为待检测数据序列时长,t为时间变量,将排列好的待检测数据序列表示为待检测数据序列
[0027]A2.结合GCN网络的边集合E,通过第1个GCN

LSTM模型的GCN网络单元提取待检测数据序列中数据的空间特征,将得到的空间特征输入第1个GCN

LSTM模型的LSTM网络中
提取其时间特征并得到的隐藏层状态将得到的隐藏层状态输入下一个GCN

LSTM模型中;
[0028]A3.结合上一个GCN

LSTM模型得到的隐藏层状态和GCN网络的边集合E,通过第2个GCN

LSTM模型的GCN网络提取待检测数据序列中数据的空间特征,将得到的空间特征输入第2个GCN

LSTM模型的LSTM网络中,提取其时间特征并得到的隐藏层状态将得到的隐藏层状态输入下一个GCN

LSTM模型中;以此递进,直到得到整个待检测数据序列的隐藏层状态,将整个待检测数据序列的隐藏层状态整理为特征的序列
[0029]更进一步的,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于GCN

LSTM和注意力机制的异常检测方法,其特征在于,包括以下步骤:S1.构建结合了GCN网络和LSTM网络的GCN

LSTM模型,并构建基于GCN

LSTM模型的序列重构模型;所述的序列重构模型为融入了注意力模型的基于GCN

LSTM模型的编码器

解码器模型;S2.对得到的序列重构模型进行训练和测试,得到测试好的序列重构模型;S3.将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列;S4.将重构序列和待检测数据序列作差,构建误差序列,并将误差序列分为训练数据集和测试数据集两部分;S5.构建基于Copula函数的异常检测模型,并将训练数据集输入异常检测模型中进行训练;S6.将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果。2.如权利要求1所述的基于GCN

LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S3中,将待检测数据序列以时序排列并输入训练好的序列重构模型中,通过编码器提取待检测数据序列的特征,并通过注意力模型得到待检测数据序列的特征的加权向量,最后通过解码器结合特征与加权向量生成重构序列的过程具体为;S301.获取待检测数据序列,将待检测数据序列以时序排列,将排列好的待检测数据序列输入序列重构模型中的编码器

解码器模型中的编码器,通过编码器提取待检测数据序列的特征;S302.将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量;S303.将特征结合加权向量输入到解码器中,通过解码器解码得到重构序列。3.如权利要求2所述的基于GCN

LSTM和注意力机制的异常检测方法,其特征在于:在所述步骤S301中,将排列好的待检测数据序列输入序列重构模型中的编码器

解码器模型中的编码器,通过编码器提取待检测数据序列的特征的过程具体为:A1.设初始时间t0=t

s+1,其中s为待检测数据序列时长,t为时间变量,将排列好的待检测数据序列表示为待检测数据序列A2.结合GCN网络的边集合E,通过第1个GCN

LSTM模型的GCN网络单元提取待检测数据序列中数据的空间特征,将得到的空间特征输入第1个GCN

LSTM模型的LSTM网络中提取其时间特征并得到的隐藏层状态将得到的隐藏层状态输入下一个GCN

LSTM模型中;A3.结合上一个GCN

LSTM模型得到的隐藏层状态和GCN网络的边集合E,通过第2个GCN

LSTM模型的GCN网络提取待检测数据序列中数据的空间特征,将得到的空间特征输入第2个GCN

LSTM模型的LSTM网络中,提取其时间特征并得到的隐藏层状态将得到的隐藏层状态输入下一个GCN

LSTM模型中;以此递进,直到得到整个待检测数
据序列的隐藏层状态,将整个待检测数据序列的隐藏层状态整理为特征的序列4.如权利要求3所述的基于GCN

LSTM和注意力机制的异常检测方法,其特征在于:在所述的步骤S302中,将特征的序列输入注意力模型,通过注意力模型以分配权重的方式计算得到加权向量的过程具体为:B1.将特征的序列输入注意力模型,计算当前时刻t对应各个历史时刻的时间注意力权重向量a
t
,具体表示为:其中,W
a
是可训练权重矩阵;b
a
是注意力权重的偏置向量;tanh表示激活函数;最后有:其中,a
i
为第i时刻的注意力权重值;B2.通过softmax函数对得到的各个时间的注意力权重系数进行归一化处理,得到时间注意力权重有:有:B3.将得到时间注意力权重与其对应的特征的序列进行加权,得到加权向量c
t
,具体表示为:5.如权利要求1所述的基于GCN

LSTM和注意力机制的异常检测方法,其特征在于:在所述的步骤S6中,将测试数据集输入训练好的异常检测模型进行异常检测,得到测试集异常序列数据检测结果的过程具体为:S601.面向测试数据集的每一个维度,使用非参数方法估计其异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,并且计算偏度系数;S602.根据得到的测试数据集的每一个维度异常样本在概率分布的左尾部以及右尾部的经验累积联合分布,计算测试数据集中每一个时间快照的empiricalcopula观测值;S603.根据测试数据集中每一个时间快照的empirical copula观测值获得偏度系数的empirical copula观测值;S604.根据得到的测试数据集中每一个时间快照的empirical copula观测值和偏度系数的empirical copula观测值,计算测试数据集中每一个时间快照的左尾部、右尾部以及偏度系数的概率;S605.根据测试数据集中每一...

【专利技术属性】
技术研发人员:郭炜彬陈家辉石林叶臻强黄浩楠
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1