关键词过滤方法和装置制造方法及图纸

技术编号:15902961 阅读:31 留言:0更新日期:2017-08-01 19:04
本发明专利技术公开了一种关键词过滤方法和装置。其中,关键词过滤方法包括:由互联网查询结果中获取多个关键词;按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词;从第一数量的关键词中选取第二数量的关键词;以及输出第二数量的关键词。通过本发明专利技术,达到了准确返回相应数量的关键词的效果。

Keywords filtration method and apparatus

The invention discloses a keyword filtering method and a device thereof. Among them, including keyword filtering method: obtain multiple keywords by the Internet query results; according to the preset matching rules to filter multiple keywords, get the first keyword quantity; select keywords second number of keywords from the first quantity; and the number of keywords output second. The invention achieves the effect of accurately returning the corresponding quantity of keywords.

【技术实现步骤摘要】
关键词过滤方法和装置
本专利技术涉及关键词过滤领域,具体而言,涉及一种关键词过滤方法和装置。
技术介绍
在通过数据库系统进行关键词选取的过程中,通常需要对关键词进行过滤,将关键词中的一些非法关键词、敏感关键词或是恶意关键词过滤。例如,当需要选取搜索引擎中搜索次数前10个关键词时,通常先查询出Top20或是Top100的关键词,再从查询出的关键词中过滤掉非法关键词,该非法关键词可以根据需要进行自定义,如满足一定规则的恶意关键词等。最后从剩下的关键词里选取出排名前10的关键词。在上述选取关键词的过程中,通常出现过滤后的关键词的数量小于需要选取的关键词的数量,导致无法准确的返回相应数量的关键词。例如上述中,Top20或是Top100中的关键词经过过滤之后,剩下关键词的数量小于10个。此时,需要返回所有的关键词,重新执行上述操作,这样造成数据库系统很大的开销。针对现有技术中由于过滤后的关键词的数量小于需要选取的关键词的数量导致无法准确的返回相应数量的关键词的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种关键词过滤方法和装置,以解决由于过滤后的关键词的数量小于需要选取的关键词的数量导致无法准确的返回相应数量的关键词的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种关键词过滤方法。根据本专利技术的关键词过滤方法包括:由互联网查询结果中获取多个关键词;按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词;从第一数量的关键词中选取第二数量的关键词;以及输出第二数量的关键词。进一步地,从第一数量的关键词中选取第二数量的关键词包括:获取第一数量的关键词中每一个关键词被搜索的次数;以及基于被搜索的次数从第一数量的关键词选取第二数量的关键词。进一步地,在按照预设匹配规则对多个关键词进行过滤之前,关键词过滤方法还包括:创建关键词过滤表,关键词过滤表中包括预设匹配规则,其中,按照预设匹配规则对多个关键词进行过滤包括:将多个关键词依次与关键词过滤表进行匹配;以及根据与关键词过滤表不匹配的关键词生成合法关键词列,将合法关键词列中的关键词作为第一数量的关键词,其中,与关键词过滤表匹配的关键词置为预设的默认值。进一步地,当在多个关键词中插入新增关键词时,按照预设匹配规则对多个关键词进行过滤还包括:通过trigger触发器将新增关键词与关键词过滤表进行匹配,得到匹配结果;以及根据匹配结果重新生成合法关键词列。进一步地,当多个关键词中关键词发生更改时,按照预设匹配规则对多个关键词进行过滤还包括:通过trigger触发器将更改的关键词与关键词过滤表进行匹配,得到匹配结果;以及根据匹配结果重新生成合法关键词列。为了实现上述目的,根据本专利技术的另一方面,提供了一种关键词过滤装置。根据本专利技术的关键词过滤装置包括:获取单元,用于由互联网查询结果中获取多个关键词;过滤单元,用于按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词;选取单元,用于从第一数量的关键词中选取第二数量的关键词;以及输出单元,用于输出第二数量的关键词。进一步地,选取单元包括:获取模块,用于获取第一数量的关键词中每一个关键词被搜索的次数;以及选取模块,用于基于被搜索的次数从第一数量的关键词选取第二数量的关键词。进一步地,关键词过滤装置还包括:创建单元,用于在按照预设匹配规则对多个关键词进行过滤之前,创建关键词过滤表,关键词过滤表中包括预设匹配规则,其中,过滤单元包括:第一匹配模块,用于将多个关键词依次与关键词过滤表进行匹配;以及第一生成模块,用于根据与关键词过滤表不匹配的关键词生成合法关键词列,将合法关键词列中的关键词作为第一数量的关键词,其中,与关键词过滤表匹配的关键词置为预设的默认值。进一步地,过滤单元还包括:第二匹配模块,用于当在多个关键词中插入新增关键词时,通过trigger触发器将新增关键词与关键词过滤表进行匹配,得到匹配结果;以及第二生成模块,用于根据匹配结果重新生成合法关键词列。进一步地,过滤单元还包括:第三匹配模块,用于当多个关键词中关键词发生更改时,通过trigger触发器将更改的关键词与关键词过滤表进行匹配,得到匹配结果;以及第三生成模块,用于根据匹配结果重新生成合法关键词列。通过本专利技术,按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词,从第一数量的关键词中选取第二数量的关键词,输出第二数量的关键词,解决由于过滤后的关键词的数量小于需要选取的关键词的数量导致无法准确的返回相应数量的关键词的问题,达到了准确返回相应数量的关键词的效果。附图说明构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的关键词过滤装置的示意图;图2是根据本专利技术实施例优选的关键词过滤装置的示意图;图3是根据本专利技术实施例的关键词过滤方法的流程图;以及图4是根据本专利技术实施例优选的关键词过滤方法的流程图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术实施例提供了一种关键词过滤装置,该装置可以通过计算机设备实现其功能。图1是根据本专利技术实施例的关键词过滤装置的示意图。如图1所示,该关键词过滤装置包括获取单元10、过滤单元30、选取单元50和输出单元70。获取单元10用于由互联网查询结果中获取多个关键词。互联网查询结果可以是所搜引擎中记录的查询结果,该查询结果包括大量的关键词,从互联网查询结果中获取多个关键词,以便于从对这多个关键词进行过滤,得到满足要求的关键词。其中,多个关键词可以是记录的所有的关键词,也可以是记录的一部分关键词,关键词的数量须多于最终满足要求的关键词的数量。例如,为了获取被搜索次数排名前10的关键词,首先获取大量的关键词,在从这些大量的关键词中进行过滤和筛选,最终得到满足上述要求的关键词。过滤单元30用于按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词。预设匹配规则可以是用于过滤非法关键词或者敏感关键词或者恶意关键词的规则,用于对获取到的多个关键词进行过滤。例如,当获取到的多个关键词中包含有对人有攻击性的词语、脏话词语等,这些均可以按照预设匹配规则进行过滤。当然,本文档来自技高网
...
关键词过滤方法和装置

【技术保护点】
一种关键词过滤方法,其特征在于,包括:由互联网查询结果中获取多个关键词;按照预设匹配规则对所述多个关键词进行过滤,得到第一数量的关键词;从所述第一数量的关键词中选取第二数量的关键词;输出所述第二数量的关键词;其中,在按照预设匹配规则对所述多个关键词进行过滤之前,所述关键词过滤方法还包括:创建关键词过滤表,所述关键词过滤表中包括所述预设匹配规则,其中,所述预设匹配规则包括指定匹配规则和与所述匹配规则相应的匹配值,其中,按照预设匹配规则对所述多个关键词进行过滤包括:将所述多个关键词依次与所述关键词过滤表进行匹配;以及根据与所述关键词过滤表不匹配的关键词生成合法关键词列,将所述合法关键词列中的关键词作为所述第一数量的关键词,其中,与所述关键词过滤表匹配的关键词置为预设的默认值。

【技术特征摘要】
1.一种关键词过滤方法,其特征在于,包括:由互联网查询结果中获取多个关键词;按照预设匹配规则对所述多个关键词进行过滤,得到第一数量的关键词;从所述第一数量的关键词中选取第二数量的关键词;输出所述第二数量的关键词;其中,在按照预设匹配规则对所述多个关键词进行过滤之前,所述关键词过滤方法还包括:创建关键词过滤表,所述关键词过滤表中包括所述预设匹配规则,其中,所述预设匹配规则包括指定匹配规则和与所述匹配规则相应的匹配值,其中,按照预设匹配规则对所述多个关键词进行过滤包括:将所述多个关键词依次与所述关键词过滤表进行匹配;以及根据与所述关键词过滤表不匹配的关键词生成合法关键词列,将所述合法关键词列中的关键词作为所述第一数量的关键词,其中,与所述关键词过滤表匹配的关键词置为预设的默认值。2.根据权利要求1所述的关键词过滤方法,其特征在于,从所述第一数量的关键词中选取所述第二数量的关键词包括:获取所述第一数量的关键词中每一个关键词被搜索的次数;以及基于所述被搜索的次数从所述第一数量的关键词选取所述第二数量的关键词。3.根据权利要求1所述的关键词过滤方法,其特征在于,当在所述多个关键词中插入新增关键词时,按照预设匹配规则对所述多个关键词进行过滤还包括:通过trigger触发器将所述新增关键词与所述关键词过滤表进行匹配,得到匹配结果;以及根据所述匹配结果重新生成合法关键词列。4.根据权利要求1所述的关键词过滤方法,其特征在于,当所述多个关键词中关键词发生更改时,按照预设匹配规则对所述多个关键词进行过滤还包括:通过trigger触发器将更改的关键词与所述关键词过滤表进行匹配,得到匹配结果;以及根据所述匹配结果重新生成合法关键词列。5.一种关键词过滤装置,其特征在于,包括:...

【专利技术属性】
技术研发人员:洪超
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1