一种高效网络报文分类方法技术

技术编号：15938878 阅读：65 留言：0更新日期：2017-08-04 21:45

本发明专利技术公开了一种高效网络报文分类方法，其基于决策树的分类方法结构简单，易形成规则，效率高，不需额外知识，适用于数据量较大、数据格式多样的情况，尤其对于实时报文分类这种对速度要求较高的系统，采用决策树方法是合理的选择，本发明专利技术提出的基于信息熵的决策树算法也是基于启发式策略，是多叉层次树基础上的一种改进，在层次树中，本发明专利技术顺序的根据头部位信息来确定其所属的规则子集，这样易形成规则子集划分均匀的现象，根据对具体规则库的观察，发现若从中抽取几位最具区分意义的位，基于这些位的熵值特性，得出具有较大熵值增益的位，则能够将规则均衡的划分到子集中去，从而减少最坏情况的复杂度。

An efficient network packet classification method

The invention discloses an efficient network packet classification method, the classification method based on decision tree has the advantages of simple structure, high efficiency, easy to form rules, without additional knowledge, suitable for a large amount of data and diverse data formats, especially for real-time packet classification system for the speed of high degree, using decision tree method is a reasonable choice, the decision tree based on information entropy algorithm is based on heuristic strategy, an improved binary hierarchy tree based on hierarchy tree, in order according to the invention, the head position information to determine the set of rules, it is easy to form uniform rules of subset partition phenomenon according to the observation, specific rules, if extracted from several of the most distinguished significance, these characteristics based on the entropy obtained with larger entropy gain. Bits can then divide the rules into subsets to reduce the worst-case complexity.

全部详细技术资料下载

【技术实现步骤摘要】
一种高效网络报文分类方法
本专利技术涉及一种高效网络报文分类方法，属于计算机网络

技术介绍
计算机网络正处于蓬勃发展的时期，网络速度不断提高，用户数量急剧增长，同时，Internet服务也开始由原先的尽力服务(best-effortservice)向QoS(qualityofservice)发展，网络设备(路由器、交换机等)的功能必须由原先单纯的转发分组提升到具有内容知晓(content-awareness)的能力，而分组分类则是其中重要的一环。许多网络关键技术，如虚拟专用网(VPNs)、网络地址转换(NAT)、防火墙、网络入侵检测(IDS)、QoS、拥塞控制、组播等都涉及到分组分类。因此，分组分类速度的快慢、功能的强弱将直接影响到许多网络技术的性能，并且对下一代网络及其服务质量有关键性的影响。并且，分组分类是现今网络研究的重要议题之一。纵观分类算法的发展趋势，基于算法在时间和空间复杂度上的限制，启发式策略一般具有较快的速度，同时在应用上也具有较好的前景。经典的启发式算法都是对规则头部进行范围切割，在切割中，采取即定的启发式策略，尽量达到规则分布的均衡性，从而能在时间和空间复杂度上更好的折衷平衡。启发式算法的共同点是采取某种策略，以把规则均匀的分布到子集中去，本方案即是根据启发式策略来实现。
技术实现思路
本专利技术针对现有的技术问题，提供一种高效网络报文分类方法，目的是使得网络报文更加直观简单易实现，预处理开销小，并具有更佳的效果，拟解决现有技术存在的问题。为实现上述目的，本专利技术提供如下技术方案：一种高效网络报文分类方法，其特征在于，该方法采用...

【技术保护点】
一种高效网络报文分类方法，其特征在于，该方法采用基于信息熵的决策树算法来实现，具体方法是，在选取规则子集时，确定阀方法是，在多叉层次树中，根据具体规则库，按照熵值特性，从中抽取若干位具有区分性质的位，即选取最大熵值增益的位，将其规则均衡的划分到子集中去，从而确定其所属的规则子集。

【技术特征摘要】
1.一种高效网络报文分类方法，其特征在于，该方法采用基于信息熵的决策树算法来实现，具体方法是，在选取规则子集时，确定阀方法是，在多叉层次树中，根据具体规则库，按照熵值特性，从中抽取若干位具有区分性质的位，即选取最大熵值增益的位，将其规则均衡的划分到子集中去，从而确定其所属的规则子集。2.根据权利要求1所述的一种高效网络报文分类方法，其特征在于：基于信息熵的决策树建立的方法具体为：（i）将全体规则集作为根节点；（ii）对五元组的每一位，计算其信息熵增益；（iii）选择熵值增益最大的前n个特征位组合作为决策分支属性；（iv）把与决策属性处取值相同的规则归于同一子集，作为下一层节点,建立子节点；（v）若叶子节点中规则数目不大于叶子节点阈值，则划分停止，如果叶子节点中规则数目大于叶子节点阈值,则返回步骤（ii），直至叶子节点中规则数目不大于叶子节点阈值。...

【专利技术属性】
技术研发人员：董小明，陈卓，钱萌，
申请(专利权)人：安庆师范大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人