模式匹配的方法和系统技术方案

技术编号:2854310 阅读:177 留言:0更新日期:2012-04-11 18:40
通过分别在可能源模式和目标模式的有序序列内只考虑源模式和目标模式的位置数可以获得模式匹配。包含目标模式的源模式位置数形成许多组。在每个i组内的源模式数和组间间隔内的源模式数取决于目标模式在源模式内的位置。目标模式的长度和字母集合中的元素数。每个组也有位置数,它的位置在有序序列的组内。将输入源模式的组位置数与从目标模式的位置数、目标模式的长度和字母集中的元素数得到的序列比较(9)。如果组位置数是序列的成员(10),那么源模式包含目标模式(11)。可以在未编码数据或Oh算术编码数据上执行模式匹配。(*该技术在2024年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及模式匹配。模式匹配是在源模式中寻找一些或所有目标模式的出现的过程。压缩模式匹配是在不解压源模式的情况下,在压缩的源模式中寻找一些或所有目标模式的出现的过程。
技术介绍
模式匹配是将分析规则应用于数据块以便识别数据块的特性。最普遍的模式匹配问题是在较大序列元素[X1...Xn](源模式)中寻找一些或所有序列元素[Y1...Ym](目标模式)的出现的过程。元素来自于有限元素集—字母集。该集合可以是英语字母表,{0,1},自然数等等。解决该问题的最常用算法是Knuth-Morris-Pratt算法,Boyer-Moore算法和Rabin-Karp算法。在公共领域中有许多模式匹配工具。这些中最著名的是文件内字符串查找族(grep family)。模式匹配用于简单文本搜索,在图像数据、语音数据、视频数据、音频数据、生物-医学序列分析等中搜索数据。数据压缩主要用于减少存储空间并加速数据传送。已知各种形式的压缩。特别的关注是算术编码压缩,对于该压缩,压缩模式匹配至今还没有成为可能。算术编码起源于70年代和80年代(参见示例US4,122,440)。算术编码用于多个领域,包括语音和本文档来自技高网...

【技术保护点】
一种通过确定可能模式序列内的源模式位置是否是和包括目标模式的可能模式序列内的一个位置相关的位置来确定目标模式是否出现在由来自字母表集合的一个或多个字符组成的源模式内的方法。

【技术特征摘要】
【国外来华专利技术】US 2003-3-13 10/386,4621.一种通过确定可能模式序列内的源模式位置是否是和包括目标模式的可能模式序列内的一个位置相关的位置来确定目标模式是否出现在由来自字母表集合的一个或多个字符组成的源模式内的方法。2.如权利要求1所述的方法,包括如下步骤i.根据字母表系统的库,通过将可能位置数序列划分为组来识别源模式的组头,其中组头是形成的每个组中的最高位置数;以及ii.确定源模式的组头值是否是和包括目标模式的可能模式序列内的目标模式位置相关的组头值。3.如权利要求2所述的方法,其中通过将可能位置数的升序序列划分为具有对应于被升高到小1的行的幂字母表的库的组尺寸的组来为每行直接或间接确定源模式的组头值,其中所述行行对应源模式内的目标模式位置。4.如权利要求3所述的方法,其中组头位置用于确定组头值对目标模式是否有效,并且其中组头位置是在该行组间的组头的组的位置。5.如权利要求2任意一种方式所示的方法,其中根据以下算法计算源模式的组头位置N=1+商((Sp-1)br-1)其中N=源模式组头位置数Sp=源模式位置数b=字母表库r=行数6.如权利要求5所述的方法,其中确定在步骤ii中是否存在匹配,以下算法的结果必须是0R=余数((N-Tp)/bT1)其中R=余数Tp=目标模式位置数T1=目标模式的长度7.如权利要求3所述的方法,其中有许多行,并且将该方法连续的应用于每一行。8.如权利要求3所述的方法,其中将该方法同时应用于超过一个源模式。9.如权利要求3所述的方法,其中搜索行的顺序取决于源模式的特性。10.如权利要求3所述的方法,其中在行中寻找目标模式的概率被估计并用于确定搜索行的顺序。11.如权利要求3所述的方法,其中在行中寻找目标模式的概率是已知的,并用于确定行的搜索顺序。12.如权利要求1所述的方法,其中源模式是算术编码数据。13.如权利要求12所述的方法,其中目标模式是算术编码数据。14.如权利要求12所述的方法,其中源模式是是使用算术编码压缩的。15.如权利要求13所述的方法,其中目标模式是使用算术编码压缩的。16.如权利要求1所述的方法,其中目标模式具有1个以上的元素。17.一种确定目标序列[X1...Xm]是否在源序列[Y1...Yq]内存在的方法,其中{X1...Xm}和{Y1...Yq}是有限有序集合{Z1...Zo}的成员,包括以下步骤i.在库o中构建源子序列值的集合,{[V1],...[V1...Vk],...[V1...Vn]},其中Vk=j∶Yk=Zj;以及ii.确定集合的任何值是否对应目标值序列{p,...p+kom,...

【专利技术属性】
技术研发人员:SKNV库马RS曼塔CS雷乌尔
申请(专利权)人:惠普开发有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1