【技术实现步骤摘要】
基于图卷积神经网络的特征增强云容器异常日志分类方法
[0001]本公开实施例涉及数据处理
,尤其涉及一种基于图卷积神经网络的特征增强云容器异常日志分类方法。
技术介绍
[0002]目前,异常日志分类是指程序员通过分析异常日志类别,定位程序漏洞并将其分配给对应的修复程序进行漏洞修补,解决潜在安全性问题的过程。异常日志中的关键字段可以辅助程序员完成异常日志分类工作,进而修复应用软件漏洞。因此,异常日志是修复应用软件漏洞的关键信息资源。
[0003]由于引入了自动崩溃报告系统,大大提高了异常日志的生成速度,增加了程序员在异常日志分类任务上的工作量。目前,相较于传统的机器学习方法,基于深度学习的异常日志分类方法避免了人为设定异常日志特征提取过程,在处理异常日志分类任务上更加优越。其中,基于堆栈跟踪的相似性度量方法是一种基于深度学习的度量异常日志报告相似度的方法,主要用于异常日志分类任务,其核心思想是将异常日志报告划分为若干堆栈跟踪数据帧并输入到神经网络中进行迭代训练,以获取堆栈跟踪数据帧的特征向量表示。接着,通过全连接层完成异常日志分类任务。基于堆栈跟踪的相似性度量方法使用深度学习模型提取异常日志向量表示,在用户级应用程序的异常日志分类任务上有良好的应用。
[0004]堆栈数据帧的特征向量表示是异常日志分类任务的关键流程,目前一般使用长短期记忆网络(LSTM)来处理按时间序列生成的异常日志堆栈跟踪数据帧。具体地,使用两个LSTM,其中一个顺序接收堆栈跟踪数据帧,另一个逆序接收堆栈跟踪数据帧,连接两个网络 ...
【技术保护点】
【技术特征摘要】
1.一种基于图卷积神经网络的特征增强云容器异常日志分类方法,其特征在于,包括:步骤1,从异常日志数据集中读取异常日志;步骤2,将异常日志划分为堆栈跟踪数据帧;步骤3,将堆栈跟踪数据帧进行标记和裁剪;步骤4,将堆栈跟踪数据帧构建为Bert模型的输入特征向量F
in
;步骤5,将输入特征向量F
in
输入编码器中,输出特征向量F
out
并分割为[F
CLS
,F
log
];步骤6,构建一张图,将向量F
log
当作点特征,向量F
CLS
的余弦相似性结果当作边关系,将该图输入到图卷积神经网络中进行相关性优化,对其进行特征增强;步骤7,将图卷积神经网络特征增强后的异常日志特征向量经过全连接层和激活函数映射成一维特征向量,然后对该一维向量进行相似性度量,并据此对异常日志进行分类。2.根据权利要求1所述的方法,其特征在于,所述步骤2具体包括:将异常日志内信息划分成若干数据帧按照先进后出的方式存储在堆栈内部,形成所述堆栈跟踪数据帧,其中,每个所述堆栈跟踪数据帧的格式为(帧名,偏移量)。3.根据权利要求2所述的方法,其特征在于,所述步骤4具体包括:步骤4.1,构造云容器异常日志堆栈跟踪数据帧T={t1,t2,...,t
L
},其中L是堆栈跟踪数据帧的数量,先每组堆栈跟踪数据帧的头部加入词元CLS,每个堆栈跟踪数据帧尾部加入词元SEP;步骤4.2,使用句子转换网络,将堆栈跟踪数据帧T转换为嵌入向量V={v
i
|v
i
∈R
(S+L+1)
×
K
,i=1,2,
…
,S+L+1},其中S表示异常日志中单词数量,K表示嵌入向量的维度;步骤4.3,使用线性投影函数sin(
·
)和cos(
·
)对位置信息进行编码,得到嵌入位置...
【专利技术属性】
技术研发人员:林震,胡超,施鹤远,费洪晓,刘荣凯,梁锴,湛誉,
申请(专利权)人:中南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。