当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于可编程交换机的正则表达式匹配加速方法技术

技术编号:40905207 阅读:21 留言:0更新日期:2024-04-18 14:36
本发明专利技术涉及一种基于可编程交换机的正则表达式匹配加速方法。该方法能够解决DFA状态爆炸的问题,并且快速有效地找到最优的正则表达式分组方案。该方法包含一种基于粒子群算法的正则表达式分组方案求解算法PGA及一种高效的启发式初始化方案,用于高效求解正则表达式分组方案。然后将ADFA与正则表达式分组结合在一起,成功地将正则表达式模式匹配所需要的内存降低到了可编程交换机可以接受的程度。最后将此系统部署到BMV2/Tofino上,利用Tofino的多管道并行机制进行测试,展示在可编程交换机上实现正则表达式匹配的可行性和高效性。

【技术实现步骤摘要】

本专利技术涉及一种基于可编程交换机的正则表达式匹配加速方法


技术介绍

1、正则表达式匹配是许多网路功能的底层模块之一,比如网络入侵检测系统(nids)和网络入侵预防系统(nips)等。这些应用使用正则表达式匹配来进行dpi,通过检测流量中是否包含特定的模式,从而判断流量是否是恶意的。除此之外,在防火墙,网关等网络设备中,正则表达式匹配也常被用于检测ip地址,协议类型,端口号等内容,以便实现网络流量的分类,过滤以及控制管理。伴随着数据中心流量规模的日益增多,将正则表达式匹配模块部署在传统服务器上愈发难以满足吞吐量的需求。新兴的可编程交换机为高速模式匹配带来了新的希望。但是,将正则表达式匹配部署到可编程交换机上时又会面临将正则表达式编译成dfa所带来的空间爆炸问题。

2、面对dfa内存爆炸的问题,现有技术提出了一种基于的贪心算法来找到一个分组方案,这个方案运行速度快,但是对解空间的搜索不足,难以找到最优解。还有其他技术提出了gabg(grouping algorithm based on gene),利用群智能算法来求解最优分组问题,但gabg对本文档来自技高网...

【技术保护点】

1.一种基于可编程交换机的正则表达式匹配加速方法,其特征在于,设计SwitchRPM系统,综合利用一种基于粒子群算法并且实现分组负载均衡的正则表达式分组优化算法及一种高效的启发式初始化方案以高效求解正则表达式分组方案,并且结合确定型有限状态自动机DFA,降低正则表达式模式匹配所需要的内存开销。

2.根据权利要求1所述的一种基于可编程交换机的正则表达式匹配加速方法,其特征在于,所设计SwitchRPM系统部署到第二代软件可编程交换机BMV2和英特尔商用可编程交换机Tofino上,利用Tofino的多管道并行机制进行测试。

3.根据权利要求1或2所述的一种基于可编程交...

【技术特征摘要】

1.一种基于可编程交换机的正则表达式匹配加速方法,其特征在于,设计switchrpm系统,综合利用一种基于粒子群算法并且实现分组负载均衡的正则表达式分组优化算法及一种高效的启发式初始化方案以高效求解正则表达式分组方案,并且结合确定型有限状态自动机dfa,降低正则表达式模式匹配所需要的内存开销。

2.根据权利要求1所述的一种基于可编程交换机的正则表达式匹配加速方法,其特征在于,所设计switchrpm系统部署到第二代软件可编程交换机bmv2和英特尔商用可编程交换机tofino上,利用tofino的多管道并行机制进行测试。

3.根据权利要求1或2所述的一种基于可编程交换机的正则表达式匹配加速方法,其特征在于,包括如下步骤:

4.根据权利要求3所述的一种基于可编程交换机的正则表达式匹配加速方法,其特征在于,步骤(1)之前,需对正则表达式分组问题进行建模,并给出优化目标;对于一个具有n个正则表达式的规则集r,将其划分为k个互不相交的子集,其中,第i个子集被表示为gi,并且所有子集的并集为原始的规则集r,有:

5.根据权利要求4所...

【专利技术属性】
技术研发人员:林为伟林璟张栋黄家卿林航朱龙隆
申请(专利权)人:福州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1