【技术实现步骤摘要】
确定日志特征序列的方法、漏洞分析方法及系统、设备
本专利技术涉及计算机
,特别涉及一种确定日志特征序列的方法、漏洞分析方法及系统、设备。
技术介绍
bug指计算机上存在的漏洞,原因是系统安全策略上存在的缺陷,从而可以使攻击者能够在未授权的情况下访问或破坏系统。工程师通常通过对产生漏洞的相关日志进行分析,从而得到漏洞产生的原因。具体可以通过提取日志的特征序列,进而利用分类算法对日志中漏洞产生原因进行分类预测。分类是指根据文本的特征或属性,划分到已有的类别中。常用的分类算法包括:决策树算法、贝叶斯(Bayes)分类算法、支持向量机(SupportVectorMachine,SVM)分类算法、人工神经网络(ArtificialNeuralNetwork,ANN)分类算法、k近邻(k-NearestNeighbor,KNN)分类算法、模糊分类算法等。现有技术中提取日志特征序列的算法有很多,但每种特征提取算法不可避免地都存在提取结果不准确的问题,从而导致利用分类算法对日志中漏洞产生原因进行分类预测的结果不
【技术保护点】
1.一种确定日志特征序列的方法,其特征在于,包括以下步骤:/n提取日志样本集合的原始特征序列;其中,所述日志样本集合包括若干日志样本,每个日志样本均包括与漏洞相关的日志以及产生所述漏洞的原因的正确类别;/n针对删除所述原始特征序列中至少一个特征元素前后的特征序列,分别利用分类算法对每个日志样本中漏洞产生的原因进行分类预测;/n根据删除所述特征元素前后每个日志样本的最大出错率确定目标特征序列;/n其中,所述最大出错率为分类预测的原因属于错误类别的最大概率与分类预测的原因属于正确类别的概率的比值,所述目标特征序列中特征元素的数量小于等于所述原始特征序列中特征元素的数量。/n
【技术特征摘要】
1.一种确定日志特征序列的方法,其特征在于,包括以下步骤:
提取日志样本集合的原始特征序列;其中,所述日志样本集合包括若干日志样本,每个日志样本均包括与漏洞相关的日志以及产生所述漏洞的原因的正确类别;
针对删除所述原始特征序列中至少一个特征元素前后的特征序列,分别利用分类算法对每个日志样本中漏洞产生的原因进行分类预测;
根据删除所述特征元素前后每个日志样本的最大出错率确定目标特征序列;
其中,所述最大出错率为分类预测的原因属于错误类别的最大概率与分类预测的原因属于正确类别的概率的比值,所述目标特征序列中特征元素的数量小于等于所述原始特征序列中特征元素的数量。
2.如权利要求1所述的方法,其特征在于,所述根据每个日志样本的最大出错率确定目标特征序列,具体包括:
若删除所述特征元素后所有日志样本的最大出错率之和降低,则判断是否每个日志样本的最大出错率均降低,若是,则将删除所述特征元素后的特征序列确定为目标特征序列。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
若不是每个日志样本的最大出错率均降低,则根据未降低的最大出错率判断是否将漏洞产生的原因分类预测为正确类别;
若是,则将删除所述特征元素后的特征序列确定为目标特征序列。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述针对删除所述原始特征序列中至少一个特征元素前后的特征序列,分别利用分类算法对每个日志样本中漏洞产生的原因进行分类预测;根据删除所述特征元素前后每个日志样本的最大出错率确定目标特征序列,具体包括:
逐一删除所述原始特征序列中的特征元素;
针对删除特征元素前后的特征序列,分别利用分类算法对每个日志样本中漏洞产生的原因进行分类预测;
根据删除特征元素后每个日志样本的最大出错率判断是否满足条件;
若满足条件,则将所述原始特征序列更新为删除特征元素后的特征序列,若不满足条件,则将所述原始特征序列恢复为删除特征元素前的特征序列;
将所述原始特征序列确定为目标特征序列。
5.一种确定日志特征序列的系统,其特征在于,包括:
原始特征提取模块,用于提取日志样本集合的原始特征序列;其中,所述日志样本集合包括若干日志样本,每个日志样本均包括与漏洞相关的日志以及产生所述漏洞的原因的正确类别;
第一分类预测模块,用于针对删除所述原始特征序列中至少一个特征元素前后的特征序列,分别利用分类算法对每个日志样本中漏洞产生的原因进行分类预测;
目标特征确定模块,用于根据删除所述特征元素前后每个日志样本的最大出错率确定目标特征序列;
其中,所述最大出错率为分类预测的原因属于错误类别的最大概率与分类预测的原因属于正确类别的概率的比值,所述目标特征序列中特征元素的数量小于等于所述原始特...
【专利技术属性】
技术研发人员:余弘,张辉,
申请(专利权)人:北京紫光展锐通信技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。