一种高性能识别文件类型的方法技术

技术编号:24755499 阅读:51 留言:0更新日期:2020-07-04 09:01
本发明专利技术的一种高性能识别文件类型的方法,将智能网卡安装在其宿主机上作为测试服务器,通过文件类型识别规则配置智能网卡多核平台和智能网卡驱动,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡,智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎,文件类型识别程序根据搜索结果结合预配置的文件类型识别规则,输出文件类型的识别结果。通过将逻辑通道内的数据传输、多正则表达式的匹配、零拷贝传输等功能由智能网卡的多核平台处理,可以快速准确识别文件类型。

A high performance method for identifying file types

【技术实现步骤摘要】
一种高性能识别文件类型的方法
本专利技术属于计算机
,具体来说是一种高性能识别文件类型的方法。
技术介绍
随着网络技术的不断应用和完善,互联网已经成为信息发布的重要渠道,在信息交流中扮演着不可或缺的重要角色,针对互联网多样化的数据,进行内容还原、行为审计、网络取证等系统应运而生。而随着数据传输性能地与日俱增,对内容还原、行为审计、网络取证等系统的要求也不断提升。特别地,针对还原内容的深度审计、挖掘,例如关键字搜索等,我们通常会先将还原内容保存成文件,然后再对文件进行文件类型的识别,之后才能进行深度审计、挖掘。面对海量文件,我们需要一种高性能识别文件类型的方法,以提升系统的整体性能,提高产品的竞争力。
技术实现思路
1.专利技术要解决的技术问题本专利技术的目的在于解决现有的识别文件类型的方法效率低下的问题。2.技术方案为达到上述目的,本专利技术提供的技术方案为:本专利技术的一种高性能识别文件类型的方法,将智能网卡安装在其宿主机上作为测试服务器,通过文件类型识别规则配置智能网卡多核平台和智能网卡驱动,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡,智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎,文件类型识别程序根据搜索结果结合预配置的文件类型识别规则,输出文件类型的识别结果。优选的,所述方法包括如下步骤:S100、将智能网卡安装在其宿主机上作为测试服务器;S200、在测试服务器上配置智能网卡侧软硬件规则以及文件类型识别程序;S300、在测试服务器上配置智能网卡驱动;S400、在文件类型识别程序内配置文件类型识别规则;S500、输入待识别的文件,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡;S600、智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎;S700、智能网卡将搜索结果通过DMA方式发送到文件类型识别程序的接收通道中;S800、文件类型识别程序轮询接收通道以获取网卡的搜索结果,结合预配置的文件类型识别规则,输出文件类型的识别结果。优选的,所述步骤S200中还包括在测试服务器上设置有收包单元、发送单元和正则搜索硬件引擎。优选的,所述步骤S500中的文件类型识别程序提取文件的头部内容为不大于1920个字节,将提取的头部内容写入零拷贝发送通道的内存中并转换成硬件指令,硬件指令通过发送通道发送到智能网卡。优选的,所述步骤S400中的文件类型识别规则为设置若干个正则表达式,加载到智能加速卡的硬件搜索引擎,当匹配到不同的正则表达式时,输出该正则表达式相对应的文件类型。3.有益效果采用本专利技术提供的技术方案,与现有技术相比,具有如下有益效果:本专利技术的一种高性能识别文件类型的方法,将智能网卡安装在其宿主机上作为测试服务器,通过文件类型识别规则配置智能网卡多核平台和智能网卡驱动,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡,智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎,文件类型识别程序根据搜索结果结合预配置的文件类型识别规则,输出文件类型的识别结果。通过将逻辑通道内的数据传输、多正则表达式的匹配、零拷贝传输等功能由智能网卡的多核平台处理,可以快速准确识别文件类型。附图说明图1为本专利技术的一种高性能识别文件类型的方法的流程图。具体实施方式为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述,附图中给出了本专利技术的若干实施例,但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本专利技术的公开内容更加透彻全面。需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同;本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。实施例1参照附图1,本实施例的一种高性能识别文件类型的方法,将智能网卡安装在其宿主机上作为测试服务器,通过文件类型识别规则配置智能网卡多核平台和智能网卡驱动,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡,智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎,文件类型识别程序根据搜索结果结合预配置的文件类型识别规则,输出文件类型的识别结果。上述方法包括如下步骤:S100、将智能网卡安装在其宿主机上作为测试服务器;S200、在测试服务器上配置智能网卡侧软硬件规则以及文件类型识别程序;S300、在测试服务器上配置智能网卡驱动;S400、在文件类型识别程序内配置文件类型识别规则;S500、输入待识别的文件,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡;S600、智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎;S700、智能网卡将搜索结果通过DMA方式发送到文件类型识别程序的接收通道中;S800、文件类型识别程序轮询接收通道以获取网卡的搜索结果,结合预配置的文件类型识别规则,输出文件类型的识别结果。其中,步骤200中还包括在测试服务器上设置有收包单元、发送单元和正则搜索硬件引擎。步骤S500中的文件类型识别程序提取文件的头部内容为不大于1920个字节,将提取的头部内容写入零拷贝发送通道的内存中并转换成硬件指令,硬件指令通过发送通道发送到智能网卡。步骤S400中的文件类型识别规则为设置若干个正则表达式,加载到智能加速卡的硬件搜索引擎,当匹配到不同的正则表达式时,输出该正则表达式相对应的文件类型。本实施例的方法通过将逻辑通道内的数据传输、多正则表达式的匹配、零拷贝传输等功能由智能网卡的多核平台处理,可以快速准确识别文件类型。以上所述实施例仅表达了本专利技术的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本专利技术专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进,这些都属于本专利技术的保护范围;因此,本专利技术专利的保护范围应以所附权利要求为准。本文档来自技高网
...

【技术保护点】
1.一种高性能识别文件类型的方法,其特征在于:将智能网卡安装在其宿主机上作为测试服务器,通过文件类型识别规则配置智能网卡多核平台和智能网卡驱动,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡,智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎,文件类型识别程序根据搜索结果结合预配置的文件类型识别规则,输出文件类型的识别结果。/n

【技术特征摘要】
1.一种高性能识别文件类型的方法,其特征在于:将智能网卡安装在其宿主机上作为测试服务器,通过文件类型识别规则配置智能网卡多核平台和智能网卡驱动,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡,智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎,文件类型识别程序根据搜索结果结合预配置的文件类型识别规则,输出文件类型的识别结果。


2.根据权利要求1所述的一种高性能识别文件类型的方法,其特征在于:所述方法包括如下步骤:
S100、将智能网卡安装在其宿主机上作为测试服务器;
S200、在测试服务器上配置智能网卡侧软硬件规则以及文件类型识别程序;
S300、在测试服务器上配置智能网卡驱动;
S400、在文件类型识别程序内配置文件类型识别规则;
S500、输入待识别的文件,文件类型识别程序提取文件的头部内容,并通过发送通道发送到智能网卡;
S600、智能网卡将接收到的文件内容提交给正则表达式硬件搜索引擎;<...

【专利技术属性】
技术研发人员:葛云生蔡斌
申请(专利权)人:上海赋华网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1