一种协议识别方法及系统技术方案

技术编号：12408941 阅读：51 留言：0更新日期：2015-11-29 17:10

本发明专利技术公开了一种协议识别方法及系统，其中，所述方法包括：接收待识别协议的数据流，所述数据流包括上行数据包和下行数据包；将所述上行数据包和下行数据包进行拼接，以及进行格式转换，获得格式转换后的载荷数据流；采用深度学习模型对所述载荷数据流进行协议识别，获取用于输出的所述数据流的协议识别结果；其中，所述深度学习模型为预先采用训练数据流获取的用于识别网络数据流的模型。上述方法无需人工筛选特征，能够较好的提高网络数据流的协议识别率，同时降低成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及通信
，具体涉及一种协议识别方法及系统。
技术介绍
协议识别是指根据网络流和流中的数据信息，推测出网络流量所属的协议类型。现有的协议识别方法包括:基于端口、基于静态特征和基于统计特征的协议识别方法。基于端口的协议识别方法主要是根据一些知名端口来识别当前数据流的协议标签。如HTTP (HyperText Transfer Protocol，超文本传输协议)使用80端口，21端口是FTP (File Transfer Protocol，文件传输协议)服务器专用的等等。实际使用中，这种方法的识别能力非常有限，对于注册和动态端口就无能为力了。基于静态特征的协议识别方法主要是通过对TCP (Transmiss1n ControlProtocol，传输控制协议)的有效载荷精确匹配特征码来识别当前数据流的协议标签。然而，该方法的缺陷是:特征规则覆盖不全，难以匹配新出现的特征。最近应用的基于统计特征的协议识别方法主要是结合机器学习算法来识别协议的方法，该方法相对比端口协议识别和静态特征协议识别均有较好的提高，但是基于统计特征的协议识别中对特征的选取主要依靠人为筛选，成本较高，且效率非常低。为此，如何提供一种成本低，且识别准确率高的协议识别方法成为当前需要解决的问题。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决或者减缓上述问题的协议识别方法及系统。根据本专利技术的一个方面，提供了一种协议识别系统，包括:接收单元，用于接收待识别协议的数据流，所述数据流包括上行数据包和下行数据包；格式转换单元，用于对所述...

【技术保护点】
一种协议识别系统，其特征在于，包括：接收单元，用于接收待识别协议的数据流，所述数据流包括上行数据包和下行数据包；格式转换单元，用于对所述上行数据包和下行数据包进行拼接，并进行格式转换，获得格式转换后的载荷数据流；协议识别单元，用于采用深度学习模型对所述载荷数据流进行协议识别，获取用于输出的所述数据流的协议识别结果；其中，所述深度学习模型为预先采用训练数据流通过深度学习获取的用于识别网络数据流的模型。

【技术特征摘要】

【专利技术属性】
技术研发人员：王占一，刘博，张卓，黄传明，
申请(专利权)人：北京奇虎科技有限公司，北京奇安信科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人