一种基于CNN_LSTM的网络流量异常检测方法技术

技术编号：26763183 阅读：21 留言：0更新日期：2020-12-18 23:21

本发明专利技术公开了一种基于CNN_LSTM的网络流量异常检测方法，对数据集进行预处理，处理结束后针对样本数量采用分布不均问题，使用Smote技术过采样，然后采用一维卷积神经网络(CNN)的方法进行特征提取，利用深度学习中长短期记忆网络(LSTM)来训练数据，当损失函数满足条件时终止训练，得到训练好的模型，本发明专利技术采用的一维卷积神经网络对网络流量这种序列数据进行特征提取，实用性较，同时对恶意流量检测有较好的效果，准确率高，误报率较低。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN_LSTM的网络流量异常检测方法
本专利技术涉及一种基于CNN_LSTM的网络流量异常检测方法，属于机器学习

技术介绍
通过监控网络流量包或系统日志，自动高效检测恶意流量是网络安全的重要保障，目前国内外已经有很多工作来检测恶意流量。主要有传统的方法和基于机器学习的方法，这两种方法都有特征提取这一阶段。传统的方法主要是安全专家研究不同攻击类别的特点，为特征设定一个较为合理的阈值；机器学习的方法是基于给定的模型从数据集中自动学习恶意流量的模式。随着深度学习在语音识别、文本分析等方面的广泛应用，深度学习模型在从大规模数据集中的学习潜力受到了越来越多的关注，有很多安全人员将其应用到网络入侵检测的研究中，取得了不错的效果。CNN一般由卷积层、池化层、全连接层组成，卷积神经网路中每层卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法优化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网络能从低级特征中迭代提取更复杂的特征。通常在卷积层之后会得到维度很大的特征，将特征切成几个区域，取其最大值或平均值，得到新的、维度较小的特征。把所有局部特征结合变成全局特征，用来计算最后每一类的得分。RNN(包括但不限于LSTM)在时序数据中性能较好的原因是其全局化处理和memory(hidden)cell。全局化表示完整的输入才能包含所有信息，只看一部分(局部化)可能丢失信息从而导致建模失效；memorycell保留每一步的信息...

【技术保护点】
1.一种基于CNN_LSTM的网络流量异常检测方法，其特征在于，包括以下步骤：/n步骤1：采集网络流量相关数据形成数据集，并对数据集进行预处理：/n步骤1-1：将数据集中非数值的字段通过机器学习模块sklearn中LabelEncoder()函数将非数值型的数据处理成数值型的形式；/n步骤1-2：对数据集中有缺失值数据进行填充补上；/n步骤1-3：将数据集中的攻击流量和正常流量分别标记为1和0；将标签和其他特征属性分开存放；/n步骤1-4：通过机器学习模块sklearn中的Normalizer()函数对数据集中的数据进行正则化处理；/n步骤1-5：将数据集中的数据采用reshape()函数转变输入维度；/n步骤2：Smote过采样/n步骤2-1：首先从步骤1得到的数据集中少数类的全部样本中找到样本的k个近邻；/n步骤2-2：从这k个近邻中随机选择一个样本，生成一个0到1之间的随机数，从而生成一个新的样本；/n步骤2-3：重复步骤2-2，合成多个样本；/n步骤3：通过合成的多个样本对CNN_LSTM模型进行训练：/n步骤3-1：循环神经网络CNN包括依次连接的输入层、卷积层、池化层、全连...

【技术特征摘要】
1.一种基于CNN_LSTM的网络流量异常检测方法，其特征在于，包括以下步骤：
步骤1：采集网络流量相关数据形成数据集，并对数据集进行预处理：
步骤1-1：将数据集中非数值的字段通过机器学习模块sklearn中LabelEncoder()函数将非数值型的数据处理成数值型的形式；
步骤1-2：对数据集中有缺失值数据进行填充补上；
步骤1-3：将数据集中的攻击流量和正常流量分别标记为1和0；将标签和其他特征属性分开存放；
步骤1-4：通过机器学习模块sklearn中的Normalizer()函数对数据集中的数据进行正则化处理；
步骤1-5：将数据集中的数据采用reshape()函数转变输入维度；
步骤2：Smote过采样
步骤2-1：首先从步骤1得到的数据集中少数类的全部样本中找到样本的k个近邻；
步骤2-2：从这k个近邻中随机选择一个样本，生成一个0到1之间的随机数，从而生成一个新的样本；
步骤2-3：重复步骤2-2，合成多个样本；
步骤3：通过合成的多个样本对CNN_LSTM模型进行训练：
步骤3-1：循环神经网络CNN包括依次连接的输入层、卷积层、池化层、全连接层，卷积层采用一维卷积，用relu函数作为激活函数；
步骤3-2：选用LSTM模型，LSTM模型是紧跟在卷积神经网络CNN后面...

【专利技术属性】
技术研发人员：马明艳，陈伟，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人