基于FPGA的正则表达式匹配方法、装置、设备及介质制造方法及图纸

技术编号:42045897 阅读:19 留言:0更新日期:2024-07-16 23:28
本申请公开了一种基于FPGA的正则表达式匹配方法、装置、设备及介质,涉及数据分析领域,包括:FPGA通过调度器基于滑动窗口策略从第一预设缓存中读取待匹配报文的控制信息,确定与控制信息中的待匹配规则标识对应的正则表达式匹配器,基于待匹配报文的分配标志以及控制信息中的报文长度判断是否触发报文调度操作;若是则通过调度器将从第二预设缓存中读取的待匹配报文的报文数据分配至正则表达式匹配器;通过正则表达式匹配器利用与待匹配规则标识对应的正则表达式规则的重配置数据重配置自动机,并通过自动机对报文数据进行匹配以生成匹配信息。本申请通过在FPGA中设置对报文进行按需匹配的调度器,提升匹配性能和匹配系统的吞吐率。

【技术实现步骤摘要】

本专利技术涉及数据分析领域,特别涉及一种基于fpga的正则表达式匹配方法、装置、设备及介质。


技术介绍

1、正则表达式匹配在网络安全、机器学习和自然语言处理等多个领域有着广泛应用,其中一个重要应用是基于正则表达式匹配的深度报文检测(deeppacket inspection,dpi)。当前,一方面由于网络流量的迅速增长,对正则表达式匹配的速度提出了更高要求;另一方面由于摩尔定律失效,通用cpu(central processing unit,中央处理器)的处理能力增速放缓,单纯基于通用cpu采用软件实现深度报文检测,其性能扩展性已经难以满足需求。为应对这一挑战,大规模数据中心普遍部署了fpga(field programmable gate array,现场可编程逻辑门阵列)、gpu(graphic processing unit,图形处理器)等加速卡,以实现高效的软硬协同计算。但是目前基于fpga实现的深度报文检测还存在一些问题,具体为:现有的匹配工作都是将网络报文通过一个规则集中的所有正则表达式全都匹配一遍来完成。事实上,单个报文通常只需匹配少数几条正本文档来自技高网...

【技术保护点】

1.一种基于FPGA的正则表达式匹配方法,其特征在于,应用于FPGA,包括:

2.根据权利要求1所述的基于FPGA的正则表达式匹配方法,其特征在于,所述通过调度器基于滑动窗口策略从第一预设缓存中读取待匹配报文的控制信息之前,还包括:

3.根据权利要求1或2所述的基于FPGA的正则表达式匹配方法,其特征在于,所述基于滑动窗口策略从第一预设缓存中读取待匹配报文的控制信息,并确定与所述控制信息中的待匹配规则标识对应的正则表达式匹配器,基于所述待匹配报文的分配标志以及所述控制信息中的报文长度判断是否触发报文调度操作,包括:

4.根据权利要求3所述的基于FPGA...

【技术特征摘要】

1.一种基于fpga的正则表达式匹配方法,其特征在于,应用于fpga,包括:

2.根据权利要求1所述的基于fpga的正则表达式匹配方法,其特征在于,所述通过调度器基于滑动窗口策略从第一预设缓存中读取待匹配报文的控制信息之前,还包括:

3.根据权利要求1或2所述的基于fpga的正则表达式匹配方法,其特征在于,所述基于滑动窗口策略从第一预设缓存中读取待匹配报文的控制信息,并确定与所述控制信息中的待匹配规则标识对应的正则表达式匹配器,基于所述待匹配报文的分配标志以及所述控制信息中的报文长度判断是否触发报文调度操作,包括:

4.根据权利要求3所述的基于fpga的正则表达式匹配方法,其特征在于,所述通过所述正则表达式匹配器利用与所述待匹配规则标识对应的正则表达式规则的重配置数据进行自动机的重配置,并通过重配置后的所述自动机对所述报文数据进行正则表达式匹配操作,以生成匹配信息之后,还包括:

5.根据权利要求3所述的基于fpga的正则表达式匹配方法,其特征在于,所述将当前待处理报文作为当前待匹配报文,并从所述第一预设缓存中读取当前待匹配报文的控制信息,确定所述控制信息中的与所述未处理规则对应的...

【专利技术属性】
技术研发人员:张进徐伟海周正江逸茗
申请(专利权)人:紫金山实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1