一种关键词处理方法及系统、关键词搜索方法技术方案

技术编号:26342574 阅读:45 留言:0更新日期:2020-11-13 20:35
本发明专利技术涉及一种关键词处理方法及系统、关键词搜索方法,包括以下步骤:按照关键词的优先级对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。本发明专利技术的关键词搜索方法,形成关键词的闭环更新,实现在大数据搜索领域对关键词的完全管理和跟踪,避免搜索遗漏和反复搜索,提高了数据资源的利用效率,减少服务器运作负载,节省成本,提高了经济效益。

A keyword processing method, system and keyword search method

【技术实现步骤摘要】
一种关键词处理方法及系统、关键词搜索方法
本专利技术涉及大数据处理
,特别涉及一种关键词处理方法及系统、关键词搜索方法。
技术介绍
随着大数据技术的发展,关键词数量数以亿计,并且会定时定量更新相关内容。各企业单位会面对大量关键词,要保证各企业单位所搜集采集的大数据为最新的数据,才能开展有效的业务需求,那么就需要及时对大数据进行搜索和采集的管理。由于关键词的数量非常庞大,传统对关键词的管理方案存在反复搜索、无效搜索等问题,则会导致搜索不及时、搜索遗漏,从而降低了对关键词的搜索或使用效率。因此,如何提高关键词的搜索效率是本研究的重点。本研究由国家重点研发计划资助,课题编号:2019YFC0850103。
技术实现思路
本专利技术的目的在于解决传统方案的存在反复搜索、无效搜索导致搜索效率低的问题,提供一种关键词处理方法及系统、关键词搜索方法。为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:一种关键词处理方法及系统、关键词搜索方法,包括以下步骤:按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。本方案对关键词赋予标记字段,形成关键词的更新状态,便于后期使用者能够按照标记字段对关键词的相关内容进行搜索和使用;按照关键词的标记字段对关键词进行扫描,比如将标记字段中的更新时间作为优先级时,则可以根据更新时间的先后,对关键词进行扫描,这样可以保证对关键词进行扫描时,不出现搜索遗漏的问题,同时也可以提高搜索效率,也可以使用其他的标记字段作为优先级对关键词进行扫描;对关键词进行搜索后,将得到的状态结果返回关键词库,进行相当于标记的处理,可以避免对关键词的反复搜索,形成关键词的闭环更新,实现在大数据搜索领域对关键词的完全管理和跟踪,避免搜索遗漏和反复搜索,提高了数据资源的利用效率,减少服务器运作负载,节省成本,提高了经济效益。所述对关键词库中的关键词被赋予标记字段后,将关键词转换为结构数据;所述结构数据包括关键词字段名、数据类型、描述、备注;形成的所述更新状态包括关键词的入库时间、更新时间、更新失败时间。本方案对关键词赋予的标记字段,以及形成的更新状态可以为后续使用者进行搜索或使用时提供便利,并且更新状态中的入库时间、更新时间、更新失败时间还可以作为一种对关键词更新状态的标记处理,根据关键词的更新状态,就可以知道该关键词是否进行过搜索,以保证关键词搜索不反复进行。所述对关键词库中的关键词赋予标记字段的步骤之前,还包括步骤:获取原始数据,对获取的原始数据进行预处理,过滤无效数据,补充缺失字段的数据;将进行预处理后的数据作为关键词加入关键词库。本方案为建立关键词库的步骤,入库的关键词都要经过预处理,避免对无效数据进行搜索,进而降低搜索成本。所述将消息队列中的关键词发送至业务端进行搜索,得到状态结果的步骤,包括:按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果;所述搜索正常的状态结果包括关键词内容已更新或关键词内容未更新。所述将状态结果返回关键词库,以更新关键词的更新状态的步骤,包括:若状态结果为搜索正常,则该关键词在关键词库中的更新状态进行更新,包括该关键词的更新时间;若状态结果为搜索异常,则将搜索异常的状态结果返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间;若状态结果为超时未返回,则提高超时未返回的状态结果的关键词优先级,对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间,不再对该关键词进行搜索。一种关键词搜索方法,包括:按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,并将状态结果返回关键词库。一种关键词处理系统,包括:关键词库,用于存储关键词,以及关键词对应的标记字段和更新状态;词库服务器,用于对关键词库中的关键词赋予标记字段,并形成关键词的更新状态,以及按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;消息队列,用于存放词库服务器扫描的关键词;业务端,用于对消息列表中的关键词进行搜索,并将得到的状态结果返回关键词库,以更新关键词的更新状态。所述词库服务器用于对关键词赋予标记字段,将关键词转换为结构数据,所述结构数据包括关键词字段名、数据类型、描述、备注;以及形成的更新状态包括关键词的入库时间、更新时间、更新失败时间。还包括关键词预处理模块,用于获取原始数据,并对获取的原始数据进行预处理后作为关键词加入关键词库;所述预处理包括过滤无效的数据、补充缺失字段的数据。所述业务端根据关键词的标记字段对消息列表中的关键词进行搜索后得到的状态结果包括:搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果,所述搜索正常的状态结果包括关键词内容已更新或关键内容未更新。若业务端对关键词进行搜索后,状态结果为搜索正常,则将搜索正常的状态结果返回关键词库,词库服务器对该关键词的更新状态进行更新,更新的更新状态包括该关键词的更新时间;若业务端对关键词进行搜索后,状态结果为搜索异常,则将搜索异常的状态结果返回关键词库,词库服务器对该关键词的状态结果进行异常排查,并对该关键词的更新状态进行更新,更新的更新状态包括该关键词的更新失败时间;若业务端对关键词进行搜索后,状态结果为超时未返回,则将超时未返回的状态结果返回关键词库,词库服务器提高该关键词的优先级,业务端对该关键词进行再次搜索,若仍然为超时未返回的状态结果,则词库服务器对该关键词的状态结果进行异常排查,并对该关键词在关键词库中的更新状态进行更新,更新的更新状态包括该关键词的更新失败时间,且不再将该关键词发送到业务端进行搜索。与现有技术相比,本专利技术的有益效果:本专利技术的关键词搜索方法,形成关键词的闭环更新,实现在大数据搜索领域对关键词的完全管理和跟踪,避免搜索遗漏和反复搜索,提高了数据资源的利用效率,减少服务器运作负载,节省成本,提高了经济效益。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术提升关键词搜索效率的方法流程图。具体实施方式下面将结合本专利技术实本文档来自技高网...

【技术保护点】
1.一种关键词处理方法,其特征在于:包括以下步骤:/n按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;/n将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。/n

【技术特征摘要】
1.一种关键词处理方法,其特征在于:包括以下步骤:
按照关键词的标记字段对关键词库中的关键词进行扫描,从扫描的关键词中提取部分发送至消息队列;所述关键词库中的关键词被赋予标记字段,并形成了更新状态;
将消息队列中的关键词发送至业务端进行搜索,得到状态结果,并将状态结果返回关键词库,以更新关键词的更新状态。


2.根据权利要求1所述的一种关键词处理方法,其特征在于:所述对关键词库中的关键词被赋予标记字段后,将关键词转换为结构数据;所述结构数据包括关键词字段名、数据类型、描述、备注;形成的所述更新状态包括关键词的入库时间、更新时间、更新失败时间。


3.根据权利要求1所述的一种关键词处理方法,其特征在于:所述对关键词库中的关键词赋予标记字段的步骤之前,还包括步骤:获取原始数据,对获取的原始数据进行预处理,过滤无效数据,补充缺失字段的数据;将进行预处理后的数据作为关键词加入关键词库。


4.根据权利要求2所述的一种关键词处理方法,其特征在于:所述将消息队列中的关键词发送至业务端进行搜索,得到状态结果的步骤,包括:
按照关键词的标记字段对消息队列中的关键词在业务端进行搜索,得到搜索正常的状态结果、搜索异常的状态结果以及超时未返回的状态结果;所述搜索正常的状态结果包括关键词内容已更新或关键词内容未更新。


5.根据权利要求4所述的一种关键词处理方法,其特征在于:所述将状态结果返回关键词库,以更新关键词的更新状态的步骤,包括:
若状态结果为搜索正常,则该关键词在关键词库中的更新状态进行更新,包括该关键词的更新时间;
若状态结果为搜索异常,则将搜索异常的状态结果返回关键词库进行异常排查,并对该关键词在关键词库中的更新状态进行更新,包括该关键词的更新失败时间;
若状态结果为超时未返回,则提高超时未返回的状态结果的关键词...

【专利技术属性】
技术研发人员:丁明会刘龙均周小辉许杰吴桐
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1