基于生成对抗网络的大规模软件系统的异常检测方法技术方案

技术编号：36527014 阅读：17 留言：0更新日期：2023-02-01 16:06

本发明专利技术公开了基于生成对抗网络的大规模软件系统的异常检测方法，包括使用聚类的方法去提取日志模板，使用Bert方法建立日志的词向量库，构建并训练检测模型，把训练好的模型对大规模软件系统进行异常检测，将异常检测任务转化为基于特征的序列预测；提出了一种基于LSTM的生成性对抗网络(GAN)，该网络使用组合事件作为输入，缓解了LSTM网络对时序的强依赖型和系统自身的失序问题，同时GAN中的生成器和鉴别器相互博弈，直到生成器生成的虚假样例能欺骗鉴别器，这样生成器就能作为检测模型，根据时序系统日志，去分辨即将到来的异常事件，最后我们还将添加注意力机制，识别一些关键词义，进一步提高识别的准确性。进一步提高识别的准确性。进一步提高识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于生成对抗网络的大规模软件系统的异常检测方法

[0001]本专利技术涉及信息识别检测
，具体为基于生成对抗网络的大规模软件系统的异常检测方法。

技术介绍

[0002]近年来，随着人工智能领域的高速发展以及软件系统规模、复杂性的进一步提高，智能运维(AiOps)方面的研究也越来越受到国内外学者的广泛关注。其中系统异常日志检测无疑是目前最贴近企业实际需求的方向，因为系统日志中涵盖着各类有价值的信息(比如告警等)。但是其数量和复杂性的日益增长已经逐渐无法通过人工去进行检测和排查。所以采用机器学习的方法训练出异常日志的检测模型已成必然趋势。
[0003]但是采用机器学习方法存在以下问题：一段时间内包含大量的日志，如果存在异常，那么这段时间的所有日志都需要被检测，但是异常日志却无法及时定位；因此管理员需要诊断一段时间内的工作日志，这是一个艰难的任务，且在一段时间内的所有日志生成后，异常才会告警；换句话说，当异常日志到达时，无法有效地检测和响应异常；第三，一般来说，系统日志都具有时序行，由于系统延迟等未知原因，使得日志顺序混乱。
[0004]为此，提出基于生成对抗网络的大规模软件系统的异常检测方法，该方法利用了深度学习的相关理论。

技术实现思路

[0005]本专利技术的目的在于提供基于生成对抗网络的大规模软件系统的异常检测方法，以解决上述
技术介绍
中提出的管理员需要诊断一段时间内的工作日志，并一段时间内的所有日志生成后，异常才会告警的问题。
[0006]为实现上述目的，本专利技术提供...

【技术保护点】

【技术特征摘要】
1.基于生成对抗网络的大规模软件系统的异常检测方法，其特征在于：包括以下步骤；步骤一：提取日志模板；步骤二：构建日志模板的词向量库；步骤三：构建基于GAN的异常检测模型；步骤四：将训练好的模型对大规模软件系统进行异常检测。2.根据权利要求1所述的基于生成对抗网络的大规模软件系统的异常检测方法，其特征在于：步骤一中采用聚类算法的方法提取日志模板。3.根据权利要求1所述的基于生成对抗网络的大规模软件系统的异常检测方法，其特征在于：步骤二中采用Bert模型的方法求解词向量，Bert模型由输入层、编码层和输出层构成，编码层由多个Transformer组成，具体包括：通过Bert模型提取源系统日志和目标系统日志中特征词之间的依赖关系，具体提取算法如公式(1)所示：其中，Q、K和V分别表示Query向量、Key向量和Value向量，对应编码器的输入字向量矩阵，dk为输入向量的维度。4.根据权利要求1所述的基于生成对抗网络的大规模软件系统的异常检测方法，其特征在于：步骤三中GAN系统包括生成器和鉴别器，生成器试图捕获真实训练数据集的分布，由正常和异常日志组成的假训练集并合成可信的样例，鉴别器则旨在通过判断模型区分使用真实和合成数据构建的数据集中的假实例，同时在生成器中添加键值对注意力机制。5.根据权利要求4所述的基于生成对抗网络的大规模软件系...

【专利技术属性】
技术研发人员：胡海晨，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人