一种基于多索引的黑白名单检索方法及装置制造方法及图纸

技术编号:21605737 阅读:18 留言:0更新日期:2019-07-13 18:17
本发明专利技术公开了一种基于多索引的黑白名单检索方法,包括:获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数;在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型。上述的方法,只采用目标字符和对应的目标字符位就可以实现黑白名单的检索,避免了由于字符串呈现具备语义环境,字符出现的频率不符合均匀分布,对于频率更高首字符,检索者需要查询更多字符位后,方可完成检索,检索效率低的问题。

A Black-and-White List Retrieval Method and Device Based on Multi-index

【技术实现步骤摘要】
一种基于多索引的黑白名单检索方法及装置
本专利技术涉及检索
,尤其涉及一种基于多索引的黑白名单检索方法及装置。
技术介绍
字典索引是一种常见的黑白名单检索手段。通过对黑白名单中的字符串首字符建立索引,避免因顺序检索造成的时间花费。专利技术人对现有的字典索引方式进行研究发现,由于字符串呈现具备语义环境,字符出现的频率不符合均匀分布,对于频率更高首字符,检索者需要查询更多字符位后,方可完成检索,检索效率低。
技术实现思路
有鉴于此,本专利技术提供了一种基于多索引的黑白名单检索方法及装置,用以解决现有技术中由于字符串呈现具备语义环境,字符出现的频率不符合均匀分布,对于频率更高首字符,检索者需要查询更多字符位后,方可完成检索,检索效率低的问题。具体方案如下:一种基于多索引的黑白名单检索方法,包括:获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数;在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型。上述的方法,可选的,遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数包括:获取所述待匹配字符串中每一个字符和其所属字符位的对应关系;遍历所述预设的次数表中,确定每一个对应关系在所述预设的次数表中的出现次数。上述的方法,可选的,预设的次数表的构建过程包括:统计所述目标黑白名单集中包含的各个字符串中长度的最大值L2和全部字符的数量L3;统计在每一个字符位K中,由全部字符组成的集合S2中每一个字符S2[j]的出现次数,其中,1≤k≤L2,1≤j≤L3;其中,所述字符位K、每一个字符S2[j]和其对应的出现次数组成所述预设的次数表。上述的方法,可选的,在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型包括:判断与所述检索关键词对应的出现次数是否为1;若是,将与所述检索关键词对应的字符串作为目标字符串;依据所述目标字符串的标识,确定所述目标字符串所属目标名单。上述的方法,可选的,还包括:若所述目标字符串的数量大于1,继续输入其它检索关键词,依据所述其它检索关键词在所述目标字符串中进行检索,确定第一目标字符串,确定所述第一目标字符串所属目标名单,或;若所述目标字符串的数量为0,依据用户需求执行对应策略。一种基于多索引的黑白名单检索装置,其特征在于,包括:获取模块,用于获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;第一确定模块,用于遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数;第二确定模块,用于在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型。上述的装置,可选的,所述第一确定模块包括:获取单元,用于获取所述待匹配字符串中每一个字符和其所属字符位的对应关系;第一确定单元,用于遍历所述预设的次数表中,确定每一个对应关系在所述预设的次数表中的出现次数。上述的装置,可选的,所述第一确定模块中预设的次数表的构建过程包括:第一统计单元,用于统计所述目标黑白名单集中包含的各个字符串中长度的最大值L2和全部字符的数量L3;第二统计单元,用于统计在每一个字符位K中,由全部字符组成的集合S2中每一个字符S2[j]的出现次数,其中,1≤k≤L2,1≤j≤L3;其中,所述字符位K、每一个字符S2[j]和其对应的出现次数组成所述预设的次数表。上述的装置,可选的,所述第二确定模块包括:判断单元,用于判断与所述检索关键词对应的出现次数是否为1;第二确定单元,用于若是,将与所述检索关键词对应的字符串作为目标字符串;第三确定单元,用于依据所述目标字符串的标识,确定所述目标字符串所属目标名单。上述的装置,可选的,还包括:第四确定单元,用于若所述目标字符串的数量大于1,继续输入其它检索关键词,依据所述其它检索关键词在所述目标字符串中进行检索,确定第一目标字符串,确定所述第一目标字符串所属目标名单,或;执行单元,用于若所述目标字符串的数量为0,依据用户需求执行对应策略。与现有技术相比,本专利技术包括以下优点:本专利技术公开了一种基于多索引的黑白名单检索方法,包括:获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数;在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型。上述的方法,只采用目标字符和对应的目标字符位就可以实现黑白名单的检索,避免了由于字符串呈现具备语义环境,字符出现的频率不符合均匀分布,对于频率更高首字符,检索者需要查询更多字符位后,方可完成检索,检索效率低的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种基于多索引的黑白名单检索方法流程图;图2为本专利技术实施例公开的一种基于多索引的黑白名单检索方法又一流程图;图3为本专利技术实施例公开的一种基于多索引的黑白名单检索方法又一流程图;图4为本专利技术提供的一种基于多索引的黑白名单检索装置结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术公开了一种基于多索引的黑白名单检索方法,所述检索方法应用在黑白名单的检索过程中,所述查找方法针对特定检索目标,通过从出现频率最少的字符位开始检索取代传统首字符检索方法,减少因非均匀分布造成的时间花费,提高检索效率,所述检索方法的执行流程,如图1所示,包括步骤:S101、获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;本专利技术实施例中,所述待匹配字符串为目前需要检索的字符串,其中,所述待匹配字符串可以为数字组合、字母组合、数字和字母组合或者其它优选标识的组合方式,本专利技术中多所述待匹配字符串的形式不作限定。本专利技术中以所述待匹配字符串为“university”为例进行说明,其中,所述待匹配字符串的长度L1=10,S=[u,n,i,v,e,r,s,i,t,y],其中,1≤n≤10。S102、遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数;本专利技术实施例中,所述预设的次数表是针对目标黑白名单集进行建立的,其中,所述预设的次数表包含字符位、字符和出现次本文档来自技高网...

【技术保护点】
1.一种基于多索引的黑白名单检索方法,其特征在于,包括:获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;遍历所述预设的次数表,确定每一个字符位n中对应的字符S1n]在所述预设的次数表中的出现次数;在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型。

【技术特征摘要】
1.一种基于多索引的黑白名单检索方法,其特征在于,包括:获取待匹配字符串的长度L1和其中包含的每一个字符S1[n],其中,1≤n≤L1;遍历所述预设的次数表,确定每一个字符位n中对应的字符S1n]在所述预设的次数表中的出现次数;在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型。2.根据权利要求1所述的方法,其特征在于,遍历所述预设的次数表,确定每一个字符位n中对应的字符S1[n]在所述预设的次数表中的出现次数包括:获取所述待匹配字符串中每一个字符和其所属字符位的对应关系;遍历所述预设的次数表中,确定每一个对应关系在所述预设的次数表中的出现次数。3.根据权利要求1所述的方法,其特征在于,预设的次数表的构建过程包括:统计所述目标黑白名单集中包含的各个字符串中长度的最大值L2和全部字符的数量L3;统计在每一个字符位K中,由全部字符组成的集合S2中每一个字符S2[j]的出现次数,其中,1≤k≤L2,1≤j≤L3;其中,所述字符位K、每一个字符S2[j]和其对应的出现次数组成所述预设的次数表。4.根据权利要求1所述的方法,其特征在于,在各个出现次数中选取出现次数最少的目标字符和其对应的目标字符位作为检索关键词在目标黑白名单集中进行检索,确定所述待匹配字符串所属名单类型包括:判断与所述检索关键词对应的出现次数是否为1;若是,将与所述检索关键词对应的字符串作为目标字符串;依据所述目标字符串的标识,确定所述目标字符串所属目标名单。5.根据权利要求4所述的方法,其特征在于,还包括:若所述目标字符串的数量大于1,继续输入其它检索关键词,依据所述其它检索关键词在所述目标字符串中进行检索,确定第一目标字符串,确定所述第一目标字符串所属目标名单,或;若所述目标字符串的数量为0,依据用户需求执行对应策略。6.一种基于...

【专利技术属性】
技术研发人员:张子兴刘霞
申请(专利权)人:北京安护环宇科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1