【技术实现步骤摘要】
本专利技术涉及一种提高应用层流量分类准确率的方法。
技术介绍
协议逆向工程可自动化地为协议流量识别、入侵检测、协议规范重构等应用提供丰富而准确的协议基本组成要素和流量特征。提取协议关键词是协议逆向工程中最为关键的一项任务,是影响后续工作准确率和可靠程序的重要环节。协议关键词是协议中的常量字符串或协议的命令符等,例如,HTTP协议使用的请求方法“GET”、FTP的退出命令符“QUIT”等。在处理多种不同协议的混杂流量时,不同协议的关键出现的频率互相干扰,而现有的协议逆向工程技术大都基于词频挖掘协议关键词,因此,直接对混杂流量进行协议关键词提取的效果不理想。现有未知流量的聚类都采用基于数值型特征的聚类算法。Erman等人采用基于K-means和DBSCAN的流量聚类方法,分析网络应用的通信特征。Erman等人还提出基于EM算法的无监督流量分类方法,用于对无标记的网络流量进行聚类分析,以根据相似性将网络流量分为不同的类别。这些工作都通过将流量特征转化为数值型特征,再定义流之间的相似度或距离,然后在k-means、EM等聚类算法的协助下进行流量聚类或分类的。流量特征在量化的过程中会出现信息损失或失真,影响聚类分析的准确性。为此,Mahmood等人提出一个用于处理混合类型特征(包括数值型特征、非数据值特征、层次化特征等)的流量聚类分析框架,然后他们只关注于分析流的网络层、传输层等简单的特征,例如采用的传输协议(UDP、TCP等),导致方法对应用层数据的分析准确性不高。Parmar等人提出一种最小化最小粗糙度(MMR)的非数值型数值处理方法,有效地展示和证明了粗糙集 ...
【技术保护点】
一种提高应用层流量分类准确率的方法,其特征在于,主要包括以下步骤:第一步、将未知应用的应用层流量进行预处理,以作为基于粗糙集的流量特征建模的基础;第二步、基于粗糙集的流量特征进行建模;第三步、选取指导分类的属性;第四步、计算属性的总粗糙度;第五步、按照属性粗糙度对各类进行排序;第六步、根据粗糙度实施类进行分割;第七步、根据最小描述长度准则,确定最佳聚类簇数。
【技术特征摘要】
1.一种提高应用层流量分类准确率的方法,其特征在于,主要包括以下步骤:第一步、将未知应用的应用层流量进行预处理,以作为基于粗糙集的流量特征建模的基础;第二步、基于粗糙集的流量特征进行建模;第三步、选取指导分类的属性;第四步、计算属性的总粗糙度;第五步、按照属性粗糙度对各类进行排序;第六步、根据粗糙度实施类进行分割;第七步、根据最小描述长度准则,确定最佳聚...
【专利技术属性】
技术研发人员:罗建桢,蔡君,戴青云,徐小平,
申请(专利权)人:广东技术师范学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。