基于人工智能的服务器集群安全漏洞检测方法技术

技术编号:33071078 阅读:16 留言:0更新日期:2022-04-15 10:05
本发明专利技术涉及人工智能技术领域,具体涉及基于人工智能的服务器集群安全漏洞检测方法,包括:获取每个已知漏洞类型下的所有日志数据,并为每个已知漏洞类型随机分配一个标签向量,根据标签向量以及日志数据训练神经网络;通过神经网络获得固定时间段内的日志数据的特征向量,并将所有特征向量进行聚类获得所有待评估类别,计算出每个待评估类别的融合特征向量,根据每个待评估类别的融合特征向量和每个待评估类别对应的标签向量获得每个待评估类别对应的已知漏洞类型,进而获得所有的安全漏洞。本发明专利技术使得安全漏洞能够被及时准确的发现,避免了反应安全漏洞的日志数据的特征信息被没有安全漏洞的日志数据的特征信息淹没或干扰这一情况。干扰这一情况。干扰这一情况。

【技术实现步骤摘要】
基于人工智能的服务器集群安全漏洞检测方法


[0001]本专利技术涉及人工智能
,具体涉及基于人工智能的服务器集群安全漏洞检测方法。

技术介绍

[0002]服务器集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能正常运行。集群中的运行的计算机节点越多,其中涉及的网络通信、访问权限、文件数据管理、资源调度等服务都变得更加复杂,也更加容易出现安全漏洞;安全漏洞的往往是通过日志数据的异常与否来检测的,每个时间段内服务器集群输出的日志数据很多,这些日志数据中既包括大量的正常操作日志,也包含异常操作的日志,但是异常日志混杂在正常日志中,使得异常日志所表征的信息被正常日志淹没,难以提取异常日志的特征,使得安全漏洞检测方法不及时或不准确;而且随着网络攻击的多样化,一些安全漏洞能以被发现,最终造成集群节点推出运行,降低集群的数据处理能力或者损失服务器集群的数据等后果。

技术实现思路

[0003]为了解决上述技术问题,本专利技术的目的在于提供基于人工智能的服务器集群安全漏洞检测方法,所采用的技术方案具体如下:本专利技术提供了基于人工智能的服务器集群安全漏洞检测方法,所述方法包括以下步骤:将无安全漏洞和所有的安全漏洞类型合并在一起统一称为已知漏洞类型,获取每个已知漏洞类型下的所有日志数据,然后为每个已知漏洞类型随机分配一个标签向量,将所有日志数据分别输入到待训练的神经网络中,神经网络输出每条日志数据对应的特征向量,根据标签向量并通过设计的损失函数训练所述待训练的神经网络;将固定时间段内获取到的日志数据分别输入训练好的神经网络中,分别获得网络输出的所有特征向量,根据标签向量将所述的所有特征向量进行聚类并获得所有待评估类别,并使每个待评估类别对应一个标签向量,将每个待评估类别中的特征向量进行融合后获得每个待评估类别的融合特征向量,根据每个待评估类别的融合特征向量和每个待评估类别对应的标签向量获得每个待评估类别对应的已知漏洞类型,所有待评估类别对应的已知漏洞类型作为固定时间段内的出现的已知漏洞类型。
[0004]进一步地,所述的每个待评估类别的融合特征向量的获取步骤包括:计算每个待评估类别中任意一个特征向量与其他所有待评估类别中所有特征向量的所有余弦相似度,将所述所有余弦相似度中的最大值的倒数称为所述任意一个特征向量的识别有效性,以每个待评估类别中每个特征向量的识别有效性为权重,对每个待评估类别中所有特征向量进行加权求和,获得的结果称为每个待评估类别的融合特征向量。
[0005]进一步地,所述的每个待评估类别对应的已知漏洞类型的获取步骤包括:
计算每个待评估类别的融合特征向量和每个待评估类别对应的标签向量的第一余弦相似度;获取每个待评估类别对应的标签向量与参考向量构成的平面,所述的参考向量是指已知漏洞类型中的无安全漏洞对应的标签向量,然后将每个待评估类别的融合特征向量正交投影在所述平面上,并获得在所述平面上的投影向量,计算所述投影向量与每个待评估类别对应的标签向量的第二余弦相似度,以及计算所述投影向量与参考向量的第三余弦相似度;将第二余弦相似度、第三余弦相似度归一化处理,获得第二余弦相似度的归一化结果,所述归一化结果与第一余弦相似度的均值称为每个待评估类别的漏洞置信度,当漏洞置信度大于预设阈值时表示每个待评估类别对应一个已知漏洞类型,每个待评估类别对应的已知漏洞类型为每个待评估类别对应的标签向量所对应的已知漏洞类型。
[0006]进一步地,所述的所有待评估类别的获取步骤包括:首先获取任意一个特征向量与所有标签向量的所有余弦相似度,获得所述所有余弦相似度中余弦相似度取最大值时对应的标签向量,称为任意一个特征向量的聚类中心,然后同理获取所有特征向量的聚类中心,最后将具有相同聚类中心的所有特征向量聚类为同一个类别,进而获得所有类别,每个类别称为待评估类别,并且对应一个聚类中心,所述的聚类中心就是标签向量。
[0007]进一步地,所述的损失函数的获取步骤包括:获取日志数据输入待训练的神经网络之后输出的特征向量,首先计算所述日志数据对应的已知漏洞类型对应的标签向量与所述特征向量的第四余弦相似度,然后将所述特征向量与其他所有标签向量的余弦相似度进行求和,将所述的求和结果与所述第四余弦相似度的差作为待训练网络的损失函数。
[0008]进一步地,所述的标签向量的获取步骤包括:在预设维度的欧式空间中构建一个半径为1的一个超球体,获取欧式空间中第一象限内的所述超球体的球面,所述第一象限是指欧式空间中所有的并且每个维度的都大于等于0的点所存在的空间,在所述球面上随机获取一定数量的均匀分布的点,所述的点的数量等于已知漏洞类型的个数,每个点对应一个已知漏洞类型,所述的每个点就是一个标签向量。
[0009]进一步地,所述待训练神经网络的网络结构采用的是循环神经网络的网络结构,其训练过程是:首先随机选择一个已知漏洞类型,随机获取已知漏洞类型下的一个日志数据,将日志数据输入待训练神经网络中,根据损失函数,并利用随机梯度下降法更新待训练神经网络的参数,直至损失函数收敛,收敛之后的待训练神经网络就是训练好的神经网络。
[0010]进一步地,所述的所有的安全漏洞类型包括但不限于:文件读写安全漏洞、权限访问安全漏洞、存储资源调度安全漏洞。
[0011]本专利技术具有如下有益效果:通过神经网络提取一段时间内的日志数据的特征向量,对特征向量进行聚类以及融合后获得一段时间内的所有的安全漏洞,使得安全漏洞能够被及时准确的发现,避免了反应安全漏洞的日志数据的特征信息被没有安全漏洞的日志数据的特征信息淹没或干扰这一情况。
附图说明
[0012]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0013]图1为本专利技术一个实施例所提供的基于人工智能的服务器集群安全漏洞检测方法的流程图。
具体实施方式
[0014]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的基于人工智能的服务器集群安全漏洞检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
[0015]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0016]下面结合附图具体的说明本专利技术所提供的基于人工智能的服务器集群安全漏洞检测方法的具体方案。
[0017]请参阅图1,其示出了本专利技术基于人工智能的服务器集群安全漏洞检测方法,其特征在于,该方法包括以下步骤:获取所有已知漏洞类型下的日志数据,并且为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于人工智能的服务器集群安全漏洞检测方法,其特征在于,该方法包括以下步骤:将无安全漏洞和所有的安全漏洞类型合并在一起统一称为已知漏洞类型,获取每个已知漏洞类型下的所有日志数据,然后为每个已知漏洞类型随机分配一个标签向量,将所有日志数据分别输入到待训练的神经网络中,神经网络输出每条日志数据对应的特征向量,根据标签向量并通过设计的损失函数训练所述待训练的神经网络;将固定时间段内获取到的日志数据分别输入训练好的神经网络中,分别获得网络输出的所有特征向量,根据标签向量将所述的所有特征向量进行聚类并获得所有待评估类别,并使每个待评估类别对应一个标签向量,将每个待评估类别中的特征向量进行融合后获得每个待评估类别的融合特征向量,根据每个待评估类别的融合特征向量和每个待评估类别对应的标签向量获得每个待评估类别对应的已知漏洞类型,所有待评估类别对应的已知漏洞类型作为固定时间段内的出现的已知漏洞类型。2.根据权利要求1所述的基于人工智能的服务器集群安全漏洞检测方法,其特征在于,所述的每个待评估类别的融合特征向量的获取步骤包括:计算每个待评估类别中任意一个特征向量与其他所有待评估类别中所有特征向量的所有余弦相似度,将所述所有余弦相似度中的最大值的倒数称为所述任意一个特征向量的识别有效性,以每个待评估类别中每个特征向量的识别有效性为权重,对每个待评估类别中所有特征向量进行加权求和,获得的结果称为每个待评估类别的融合特征向量。3.根据权利要求1所述的基于人工智能的服务器集群安全漏洞检测方法,其特征在于,所述的每个待评估类别对应的已知漏洞类型的获取步骤包括:计算每个待评估类别的融合特征向量和每个待评估类别对应的标签向量的第一余弦相似度;获取每个待评估类别对应的标签向量与参考向量构成的平面,所述的参考向量是指已知漏洞类型中的无安全漏洞对应的标签向量,然后将每个待评估类别的融合特征向量正交投影在所述平面上,并获得在所述平面上的投影向量,计算所述投影向量与每个待评估类别对应的标签向量的第二余弦相似度,以及计算所述投影向量与参考向量的第三余弦相似度;将第二余弦相似度、第三余弦相似度归一化处理,获得第二余弦相似度的归一化结果,所述归一化结果与第一余弦相似度的均值称为每个待评估类别的漏洞置信度,当漏洞置信度大于预设阈值时表示每个...

【专利技术属性】
技术研发人员:陈婷婷田长福王坡常朝辉王红梅
申请(专利权)人:山东卓朗检测股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1