【技术实现步骤摘要】
本专利技术涉及多模式串匹配
,特别是涉及ー种对WuManber算法进行测试的方法和系统。
技术介绍
多模式串匹配是计算机科学领域的ー个经典问题,对它的研究已经持续了几十年,已有的算法也有几百个。多模式串匹配算法广泛的应用在信息检索、信息过滤、病毒检测、入侵检测、计算生物学等方面。近年来,随着网络信息安全应用的发展,多模式串匹配技术作为其核心技术之一,也得到了很大的发展,尤其是在大規模、超大規模的串匹配、模糊匹配、正则匹配、硬件匹配技术等方面,都随着应用的強烈需求而迅速发展。多模式串匹配算法的应用环境有模式串集合本身、运行机器、输入文本等几个方 面,它们都对算法的性能有影响。对于ー个特定的多模式串匹配的应用,模式串集合和运行机器都是固定的,只有输入文本是一直在变化的,因此对于不同的输入文本,检测的速度会有变化。因此,通过设计相应的检测数据,利用多模式串匹配算法检测该测试数据,以产生最多的检测次数,使得多模式串匹配算法的测试速度剧烈下降,以寻找可以使多模式串匹配算法最低速度提高的改进方法。WuManber算法是ー种常用的多模式串匹配算法,它是Boyer-Moo ...
【技术保护点】
一种对WuManber算法进行测试的方法,其特征在于,所述方法,包括下列步骤:步骤100,根据模式串集合以及WuManber算法使用的散列函数,设计生成能够使WuManber算法验证次数最多的测试数据;步骤200,对WuManber算法使用所述测试数据进行测试,获得WuManber算法的最低运算速度。
【技术特征摘要】
1.一种对WuManber算法进行测试的方法,其特征在于,所述方法,包括下列步骤 步骤100,根据模式串集合以及WuManber算法使用的散列函数,设计生成能够使WuManber算法验证次数最多的测试数据; 步骤200,对WuManber算法使用所述测试数据进行测试,获得WuManber算法的最低运算速度。2.根据权利要求I所述的对WuManber算法进行测试的方法,其特征在于,所述步骤100,包括下列步骤 步骤110,根据模式串集合以及WuManber算法使用的散列函数,计算HASH表及HASH表的长度; 步骤120,根据所述HASH表的长度以及HASH表每一项通过散列函数对应的字符块生成有向无回路图; 步骤130,根据构造的所述有向无回路图,计算从起点到终点的一条最长路径,将路径上的标记组成的字符串记为L,L的长度为n-(lmin-b),其中,η为所述测试数据的长度,b为字符块B的长度,Imin为所述模式串的最短长度; 步骤140,将所述字符串L前面增加长度为lmin-b的任意属于字符集Σ的字符串作为要构造的测试数据,并将所述测试数据存储到外部存储器中。3.根据权利要求2所述的对WuManber算法进行测试的方法,其特征在于,所述步骤110,包括下列步骤 步骤111,根据所述模式串集合以及WuManber算法使用的散列函数计算出HASH表; 步骤112,计算所述HASH表每一列的长度W。4.根据权利要求3所述的对WuManber算法进行测试的方法,其特征在于,所述步骤111,包括下列步骤 步骤111a,根据所述配置信息获取字符集的大小σ和字符块大小b; 步骤111b,根据所述模式串集合计算模式串个数r和模式串最短长度Imin ; 步骤111c,根据计算模式串集合中每个模式串对应的字符块和WuManber算法使用的散列函数计算出每个模式串对应的HASH表的表项,,构造出HASH表。5.根据权利要求2所述的对WuManber算法进行测试的方法,其特征在于,所述步骤120,包括下列步骤 步骤 121,将结点 Vk, k e [b, η], π e N, s e [I, lmin-b+1]加到图 G 中,vk, 表示长度为k以π结尾并且当前需要跳跃s个字符的文本; 步骤122,根据公式I :6.一种对WuManber算法进行测试的系统,其特征在于,所述系统,包括 测试数据生成模块,用于根据模式串集合以及WuManber算法使用的散列函数,设计生成能够使WuManber算法验证次数最多的测试数据; 测试模块,用于对WuManber算法使用所述测试数据进行测试,获得WuManber算法的最低运行速度。7.根据权利要求6所述的对WuManber算法进行测试的系统,其特征在于,所述测试数据生成模块,包括 数据预处理单元,用于根据模式串集合以及WuManber算法使用的散列函数,计算HASH表及HASH表的长度; 数...
【专利技术属性】
技术研发人员:张宇,刘萍,刘燕兵,郭莉,陈训逊,李楠宁,薛晨,
申请(专利权)人:中国科学院计算技术研究所,国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。