【技术实现步骤摘要】
本专利技术涉及信息安全
,具体涉及一种基于决策树剪枝(Decision Tree Pruning)的模式匹配方法。
技术介绍
模式匹配算法广泛应用于入侵检测、信息检索、模式识别、基因匹配等众多领域。性能稳定的模式匹配算法是网络入侵检测系统的“倍增器”。基于自动机的模式匹配算法具备性能稳定的特点,其中以AC算法为代表。由于AC算法拥有线性最差时间复杂度,柔性高,可容忍短模式,可抵抗复杂度攻击,因此是目前首选的在线匹配算法之一。然而,随着对模式匹配性能需求的增加,基于自动机类的模式匹配算法成为高性能模式匹配体系结构设计的基础。但此类算法生成的DFSA规模较大,特别对于大规模模式集(10万以上模式集)生成自动机的规模需要大量的内存存储,这大大阻碍了自动机类匹配算法的应用。
技术实现思路
本专利技术所要解决的技术问题是针对现有基于自动机的模式匹配算法需要大量的内存存储的问题,提供一种基于决策树剪枝的模式匹配方法。为解决上述问题,本专利技术是通过以下技术方案实现的:基于决策树剪枝的模式匹配方法,包括如下步骤:步骤A.即根据自动机生成规则,将模式集中的模式串依次添加到自动机中;步骤B.在自动机生成过程中,每一个模式串添加完成,即将此模式串添加到当前节点的输出表中;步骤C.对生成的自动机进行剪枝,去除对分类来说属于非必要的节点,减少自动机节点数量,简化自动机;在对自动机进行剪枝的过程中,生成后缀表;步骤D.计算自动机各节点的状态深度,其中节点的状态深度为该节点距根节点的最短路径长度;步骤E.根据节点状态深度,计算出各节点的失败指针;步骤F.依次取出文本串中字符输入自 ...
【技术保护点】
基于决策树剪枝的模式匹配方法,其特征是,包括如下步骤:步骤A.即根据自动机生成规则,将模式集中的模式串依次添加到自动机中;步骤B.在自动机生成过程中,每一个模式串添加完成,即将此模式串添加到当前节点的输出表中;步骤C.对生成的自动机进行剪枝,去除对分类来说属于非必要的节点,减少自动机节点数量,简化自动机;在对自动机进行剪枝的过程中,生成后缀表;步骤D.计算自动机各节点的状态深度,其中节点的状态深度为该节点距根节点的最短路径长度;步骤E.根据节点状态深度,计算出各节点的失败指针;步骤F.依次取出文本串中字符输入自动机,完成模式匹配。
【技术特征摘要】
1.基于决策树剪枝的模式匹配方法,其特征是,包括如下步骤:步骤A.即根据自动机生成规则,将模式集中的模式串依次添加到自动机中;步骤B.在自动机生成过程中,每一个模式串添加完成,即将此模式串添加到当前节点的输出表中;步骤C.对生成的自动机进行剪枝,去除对分类来说属于非必要的节点,减少自动机节点数量,简化自动机;在对自动机进行剪枝的过程中,生成后缀表;步骤D.计算自动机各节点的状态深度,其中节点的状态深度为该节点距根节点的最短路径长度;步骤E.根据节点状态深度,计算出各节点的失败指针;步骤F.依次取出文本串中字符输入自动机,完成模式匹配。2.根据权利要求1所述的基于决策树剪枝的模式匹配方法,其特征是,步骤C的过程具体为:步骤C1.对自动机的各个分支进行逐个遍历;步骤C2.当从根节点遍历至终端叶子节点的过程中,仅存在终端叶子节点这一个输出节点,即输出节点为1个时,则从终端叶子节点开始向上回溯至最后一个单分枝节点,将该单分枝节点的剪枝标志位置为1,修剪掉该单分枝节点之后的枝叶,并将该单分枝节点的后续枝叶包含的后缀以字符串的形式存储于后缀表;步骤C3.当从根节点遍历至终端叶子节点的过程中,存在除终端叶子节点这一个输出节点之外的其他输出节点,即输出节点为2个以上时,则从终端叶子节点开始向上回溯至倒数第二个输出节点,将该倒数第二个输出节点的剪枝标志位置为1,修剪掉该倒数第二个输出节点之后的枝叶,并将该倒数第二个输出节点的后续枝叶包含的...
【专利技术属性】
技术研发人员:古天龙,王亚南,徐周波,常亮,陈帅,王敏,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。