基于深度循环神经网络的应用层通信协议识别的方法技术

技术编号:18950772 阅读:59 留言:0更新日期:2018-09-15 13:20
本发明专利技术属于以协议为特征的技术领域,公开了一种基于深度循环神经网络的应用层通信协议识别的方法,获取应用层通信协议原始数据,并对其进行格式、进制处理得到0‑255的比特流数据;根据不同协议的帧长度进行评估和预处理,得到神经网络训练所需实验数据集;构建LSTM‑DNN神经网络,其中包括两层LSTM层、两层DNN层和分类层,设置交叉熵损失函数和Adam权值更新函数,得到网络架构;利用数据集对网络进行训练和验证,得到具备应用层通信协议识别能力的深度循环神经网络,对待测比特流数据进行预处理和识别。本发明专利技术无需协议先验知识,具有较高的识别准确率,并且在网络训练完成后可以实时识别协议数据。

Recognition method of application level communication protocol based on deep recurrent neural network

The invention belongs to the technical field characterized by protocol, and discloses a method for identifying application layer communication protocol based on deep cyclic neural network, which obtains the original data of application layer communication protocol, and processes it in format and in decimal form to obtain 0_255 bit stream data, and evaluates and preprocesses the frame length of different protocols. The experimental data set for neural network training is obtained by processing, and the LSTM DNN neural network is constructed, which includes two layers of LSTM layer, two layers of DNN layer and classification layer. The depth of recognition ability of recurrent neural network is used to preprocess and recognize the bit stream data. The invention does not need protocol prior knowledge, has high recognition accuracy, and can identify protocol data in real time after network training.

【技术实现步骤摘要】
基于深度循环神经网络的应用层通信协议识别的方法
本专利技术属于以协议为特征的
,尤其涉及一种基于深度循环神经网络的应用层通信协议识别的方法。
技术介绍
目前,业内常用的现有技术是这样的:信息爆炸年代,其传播媒介也必定会随之快速发展,作为承载信息的网络便是其中之一。由于网络的快速发展,各种协议便层出不穷,尤其是大量私有协议如雨后春笋般涌现在人们眼前,因此能够准确识别出各种协议对于网络安全、网络规划与管理、网络流量优化等来说都意义重大。议识别问题是国内外学者关注的焦点问题,都做了大量的研究工作。目前应用层协议识别常用的方法有三种:一是传统的基于端口的识别技术,即是对端口号进行匹配的一种协议识别技术。这种技术一般针对知名端口进行识别,该识别方法最大的优点就是简单易行,并不需要进行复杂的分组处理即可得出结论。常用到的端口有:知名端口(端口号0-1024),注册端口(端口号1025-49151),动态、私有端口(端口号49152-65535)。然而随着各种P2P协议的广泛应用以及逃避防火墙检测的需要,传统的基于常用端口识别协议的方法已经出现问题。端口识别技术仅应用于知名端口的识别,识别范本文档来自技高网...

【技术保护点】
1.一种基于深度循环神经网络的应用层通信协议识别的方法,其特征在于,所述基于深度循环神经网络的应用层通信协议识别的方法获取应用层通信协议原始数据,并对其进行格式、进制处理得到0‑255的比特流数据;根据不同协议的帧长度进行评估和预处理,得到神经网络训练所需实验数据集;构建LSTM‑DNN神经网络,其中包括两层LSTM层、两层DNN层和分类层,设置交叉熵损失函数和Adam权值更新函数,得到网络架构;利用数据集对网络进行训练和验证,得到具备应用层通信协议识别能力的深度循环神经网络,对待测比特流数据进行预处理和识别。

【技术特征摘要】
1.一种基于深度循环神经网络的应用层通信协议识别的方法,其特征在于,所述基于深度循环神经网络的应用层通信协议识别的方法获取应用层通信协议原始数据,并对其进行格式、进制处理得到0-255的比特流数据;根据不同协议的帧长度进行评估和预处理,得到神经网络训练所需实验数据集;构建LSTM-DNN神经网络,其中包括两层LSTM层、两层DNN层和分类层,设置交叉熵损失函数和Adam权值更新函数,得到网络架构;利用数据集对网络进行训练和验证,得到具备应用层通信协议识别能力的深度循环神经网络,对待测比特流数据进行预处理和识别。2.如权利要求1所述的基于深度循环神经网络的应用层通信协议识别的方法,其特征在于,所述基于深度循环神经网络的应用层通信协议识别的方法包括以下步骤:步骤一,获取计算机网络应用层协议数据,对协议数据进行格式处理,去除比特流以外冗余信息;将数据转换成算法可以识别的十进制数据,得到数据集D1,数据范围为0-255,转向步骤二;步骤二,分别计算分别计算数据集D1中各数据段基准长度,得到基准长度集合L,L={L1,L2,...LK},计算L中的最大值max(L)和L中最小值min(L)的差记为P,如果P<min(L)/2,转向步骤三,否则转向步骤四;步骤三,当P<min(L)/2时,选取L集合的平均值mean(L)作为基准长度,如果基准长度为偶数则不处理,否则对平均值加1处理;对数据集D1切割和补零操作,具体来说:对数据长度大于基准长度的数据段,保留前基准长度的数据;对数据长度小于基准长度的数据,在数据后补零到基准长度;得到数据集D2,转向步骤五;步骤四,当P>min(L)/2时,以max(L)为基准长度,如果基准长度为偶数则不处理,否则对基准长度加1处理,对数据集D1中每个数据段进行补零操作,具体来说:对数据长度小于基准长度的数据,在数据后补零到基准长度,得到数据集D3,转向步骤五;步骤五,构建循环神经网络,选取LSTM神经元和普通神经元,构建LSTM-DNN神经网络,其中包括两层LSTM层、两层DNN层和分类层,得到初始网络架构S1,转向步骤六;步骤六,当数据来源为数据集D2时,使用前80%的数据来训练网络架...

【专利技术属性】
技术研发人员:沈中唐靖旋李万张文瑞
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1