一种用于消除字符串模糊匹配冗余的过滤方法技术

技术编号:2868606 阅读:359 留言:0更新日期:2012-04-11 18:40
一种用于消除字符串模糊匹配中冗余的过滤方法,包括对字符串,长度为m的模式串进行模糊匹配,所允许的模糊度为k,当前正在扫描字符串中的第j个字符,其特征在于所述方法还包括:    判断步骤:从第j+m-1个字符往前扫描,出现在模式串中的字符为有用字符,其他字符为无用字符,当发现了多于模糊度的无用字符时,跳转至最近的一个有用字符处,开始新的匹配。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于字符串匹配的过滤方法,特别是一种用于消除字符串模糊匹配中冗余的过滤方法,尤其适用于诸如中文等大字符集上的字符串匹配。
技术介绍
字符串模糊匹配在入侵检测、移动短消息过滤、文本编辑、信息查询、自动索引、计算生物学、信息提取等领域均有重要应用,已经成为改善计算机本身性能的一个重要课题。设s,t是两个字符串,ed(s,t)是指,把t转变成s所需要的修改次数,即s和t的差距。这里一次修改可以是插入、替换或删除一个字符。由修改的对称性,显然ed(s,t)=ed(t,s)。若ed(s,t)≤k,则称s是t的k-匹配。显然,ed(s,t)反映了s和t的近似程度。那么,字符串模糊匹配研究的问题是给定长为n的字符串t,长为m的模式串p,一个正整数k<m,要找出所有的j使得t中存在某子串 使ed(s,p)≤k。解决模糊字符串匹配是一种基于生成动态矩阵的方法,其时间复杂度为O(mn)。自从1980年P.Sellers发表该方法以来,许多人对之进行了改进。这些改进当中,最有效的是以下两种方法。第一种方法是位向量方法。当今计算机中,整数字长w一般为32或64,因此,可将32或64次的本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:陈开渠赵洁彭志威
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1