【技术实现步骤摘要】
一种基于增量学习的在线自适应入侵检测方法
[0001]本专利技术属于网络安全
,进一步涉及入侵检测方法,具体为一种基于增量学习的在线自适应入侵检测方法,可用于实时检测网络中的攻击行为并在线更新入侵检测系统。
技术介绍
[0002]深度神经网络作为一种智能算法,在复杂数据分析方面充分展示了其优势所在,能够很好地应用在入侵检测领域,然而大部分深度神经网络只能针对已知类别的网络入侵进行良好的训练,即大部分神经网络模型是为一个封闭的环境所设计的。在现实生活中,已知类别的网络攻击并不能有效地涵盖所有攻击类别。增量学习是一类能够通过学习新增样本、扩展和更新现有模型的算法。它能够保存大部分在已知类别中学习的知识,并且不断地从新增类别中学习新的知识。增量学习算法的主要特征包括:具备从新增样本中学习新知识的能力;模型在训练过程中不需要或者仅需要部分原始数据集;模型对旧知识具有记忆的能力,不会出现灾难性遗忘的问题;模型能够对新增样本中可能出现的新类别进行自适应学习。虽然增量学习为处理新增类别提供了思路,但是目前用于入侵检测的增量学习算法仍不能实现在线实时地检测网络入侵行为,导致入侵检测技术缺乏自适应性,实时性以及可靠性。
[0003]中国专利申请CN108173708A公开了一种基于深度学习的异常流量检测方法,该方法包括获取用户端流量数据,利用流量检测分类其对流量进行异常检测,基于异常数据对流量检测分类器进行在线训练三个阶段。首先,利用嗅探器获取用户端的流量数据构建可训练数据集;其次,利用异常检测设备中预先构建的流量检测分 ...
【技术保护点】
【技术特征摘要】
1.一种基于增量学习的在线自适应入侵检测方法,包括如下步骤:(1)对原始数据集进行预处理:从网络中获取公开入侵检测数据集作为初始已知类别样本集,提取每条数据记录的特征和标签,去除部分无效数据,根据标签对剩余数据记录进行分类,并对字符型特征进行独热编码,制作包含数据、标签、列表的二进制文件样本集,将该文件样本集中的数据划分为初始已知类别训练集D
old
和验证集D
valid
两部分;D
old
={X1,X2,...,X
n
},D
valid
={T1,T2,...,T
n
},其中,n为初始已知类别样本的类别数量,X
n
、T
n
分别表示所有第n类初始已知类别训练样本、验证样本;(2)搭建待扩展分类网络模型:采用时空网络结构,将一维卷积神经网络和长短期记忆神经网络串接在一起作为网络结构,搭建依次由两个第一一维卷积神经网络层conv1d、第一最大池化层max_pooling_1、第二一维卷积神经网络层conv1d_2、第二最大池化层max_pooling_2、长短期记忆神经网络层lstm、暂退层dropout以及第一全连接层dense_1组成的待扩展分类网络模型,以18*1的一维矩阵作为输入,输出代表样本类型预测分数的1*1的矩阵;(3)利用初始已知类别样本训练集D
old
和交叉熵损失函数L
c
训练待扩展分类网络模型,获取可检测已知类别的入侵检测模型,同时利用初始已知类别验证集D
valid
在入侵检测模型训练过程中检验该模型的状态、收敛情况,并根据检验结果调整超参数实现训练效果优化,得到训练好的入侵检测模型(4)利用流量特征提取工具CICFlowMeter的实时提取模块Realtime实时捕获网络中的数据记录,去除部分无效数据记录,对有效数据记录进行分析得到50
‑
80个数据特征并保存;(5)对步骤(4)得到的数据特征进行特征提取,根据提取到的特征组合得到在线入侵检测样本集D
online
;(6)实时入侵检测:将在线入侵样本集D
online
放入步骤(3)中训练好的入侵检测模型中进行预测,根据模型预测结果判断在线入侵检测样本集D
online
中每一个样本的类型,具体如下:若样本分类为正常的样本,则继续对样本集D
online
中其它样本进行实时入侵检测;若样本分类为已知异常类别的样本,则将该样本反馈至管理员做进一步分析,同时继续对样本集D
online
中其它样本进行实时入侵检测;若样本分类为未知类别的样本,则进行人工判断,确定该样本是否可用,如果判断为不可用,则继续对样本集D
online
中其它样本进行实时入侵检测;如果判断为可用,则执行步骤(7);(7)根据可用样本数据记录的信息,人工标注未知类别样本的标签,并构建未知类别样本集D
unknown
:D
unknown
={X1,X2,...,X
m
},其中m为未知类别样本的类别数量,X
m
为样本类别为m的所有未知样本集。
(8)在初始已知类别样本集中选取具有代表性的样本构建已知类别样本集D
known
:D
known
={D
t
,D
f
,D
r
},其中D
t
为在待扩展分类模型上分类正确且分数前1%高的数据样本集,D
f
为在待扩展分类模型上分类错误的全部数据样本集,D
r
为随机选择1%剩余已知类别样本的数据样本集;(9)构建用于后续在线更新模型的增量样本集D
ne...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。