一种提高应用层流量分类准确率的方法技术

技术编号:14894025 阅读:98 留言:0更新日期:2017-03-29 04:35
本发明专利技术涉及一种提高应用层流量分类准确率的方法,其特征在于,主要包括以下步骤:第一步、将未知应用的应用层流量进行预处理,以作为基于粗糙集的流量特征建模的基础;第二步、基于粗糙集的流量特征进行建模;第三步、选取指导分类的属性;第四步、计算属性的总粗糙度;第五步、按照属性粗糙度对各类进行排序;第六步、根据粗糙度实施类进行分割;第七步、根据最小描述长度准则,确定最佳聚类簇数。该方法大大减少不相关流量造成的噪声影响,提高协议关键词提取的准确率,进而可为应用层流量识别、异常检测提供可靠而准确的流量特征。

【技术实现步骤摘要】

本专利技术涉及一种提高应用层流量分类准确率的方法
技术介绍
协议逆向工程可自动化地为协议流量识别、入侵检测、协议规范重构等应用提供丰富而准确的协议基本组成要素和流量特征。提取协议关键词是协议逆向工程中最为关键的一项任务,是影响后续工作准确率和可靠程序的重要环节。协议关键词是协议中的常量字符串或协议的命令符等,例如,HTTP协议使用的请求方法“GET”、FTP的退出命令符“QUIT”等。在处理多种不同协议的混杂流量时,不同协议的关键出现的频率互相干扰,而现有的协议逆向工程技术大都基于词频挖掘协议关键词,因此,直接对混杂流量进行协议关键词提取的效果不理想。现有未知流量的聚类都采用基于数值型特征的聚类算法。Erman等人采用基于K-means和DBSCAN的流量聚类方法,分析网络应用的通信特征。Erman等人还提出基于EM算法的无监督流量分类方法,用于对无标记的网络流量进行聚类分析,以根据相似性将网络流量分为不同的类别。这些工作都通过将流量特征转化为数值型特征,再定义流之间的相似度或距离,然后在k-means、EM等聚类算法的协助下进行流量聚类或分类的。流量特征在量化的过程中会出现信息本文档来自技高网...
一种提高应用层流量分类准确率的方法

【技术保护点】
一种提高应用层流量分类准确率的方法,其特征在于,主要包括以下步骤:第一步、将未知应用的应用层流量进行预处理,以作为基于粗糙集的流量特征建模的基础;第二步、基于粗糙集的流量特征进行建模;第三步、选取指导分类的属性;第四步、计算属性的总粗糙度;第五步、按照属性粗糙度对各类进行排序;第六步、根据粗糙度实施类进行分割;第七步、根据最小描述长度准则,确定最佳聚类簇数。

【技术特征摘要】
1.一种提高应用层流量分类准确率的方法,其特征在于,主要包括以下步骤:第一步、将未知应用的应用层流量进行预处理,以作为基于粗糙集的流量特征建模的基础;第二步、基于粗糙集的流量特征进行建模;第三步、选取指导分类的属性;第四步、计算属性的总粗糙度;第五步、按照属性粗糙度对各类进行排序;第六步、根据粗糙度实施类进行分割;第七步、根据最小描述长度准则,确定最佳聚...

【专利技术属性】
技术研发人员:罗建桢蔡君戴青云徐小平
申请(专利权)人:广东技术师范学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1