一种搜索分词的方法、装置及计算机可读存储介质制造方法及图纸

技术编号:18941002 阅读:20 留言:0更新日期:2018-09-15 11:10
本发明专利技术公开一种搜索分词的方法、装置及计算机可读存储介质,其属于数据搜索处理技术领域,该方法包括以下步骤:接受搜索策略管理后台对搜索分词策略进行动态调整;根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端。本发明专利技术的搜索分词的方法、装置及计算机可读存储介质,其可通过在管理后台对搜索分词策略进行动态调整,来优化分词效果,提高搜索性能,提升搜索结果匹配度,并最终使得搜索结果能够更符合用户的搜索期望,提升用户使用体验。

Search segmentation method, device and computer readable storage medium

The invention discloses a method, device and computer-readable storage medium for searching word segmentation, which belongs to the technical field of data searching and processing. The method comprises the following steps: dynamically adjusting the search word segmentation strategy in the background of accepting the search strategy management; and searching sent by the client according to the currently adjusted search word segmentation strategy. The request is segmented and the search results are returned to the client. The search segmentation method, device and computer readable storage medium of the invention can optimize the segmentation effect, improve the search performance, enhance the matching degree of the search results, and finally make the search results more in line with the search expectations of the users and enhance the users by dynamically adjusting the search segmentation strategy in the management background. User's experience.

【技术实现步骤摘要】
一种搜索分词的方法、装置及计算机可读存储介质
本专利技术涉及数据搜索处理
,尤其涉及一种搜索分词的方法、装置及计算机可读存储介质。
技术介绍
搜索功能几乎是每个APP或WEB网站必备的功能,作为搜索功能的实现支撑技术,现今主流的全文搜索技术库主要是Lucene(高性能的、可扩展的信息检索工具库),而ElasticSearch(一个基于Lucene的搜索服务器)与Solr(独立的企业级搜索应用服务器)等软件在Lucene的基础上进行了封装,屏蔽了Lucene复杂的技术细节,对外提供简单的API,从而使得全文搜索的应用变得极其简单,只要部署好ElasticSearch集群服务,在业务程序中调用相应的API即可对用户端提供搜索效果较好的搜索功能。然而,在搜索功能的实际应用中,几乎很少会有直接根据搜索的匹配度高低返回结果给用户端,多数情况下,会把匹配结果结合其他维度因素进行最终得分排序计算处理,然后根据最终得分的高低,将排名前几位的搜索结果返回给用户端。如应用搜索中的匹配度+下载量模式,用户在应用商店中输入关键词进行搜索应用,应用商店的服务端会先使用关键词进行应用匹配搜索,然后把搜索出来的应用列表结合各个应用的下载量,按照一定的得分计算公式进行最终得分计算,并根据最后得分排序返回排名前几位的应用。在这样的场景下,会存在一类情况,某个应用对于关键词的匹配度不高,但因下载量极大,使得最终得分排在最前面,返回给用户端,然而这并非是用户所期望的搜索结果,使得用户的使用体验很差。
技术实现思路
本专利技术的主要目的在于提出搜索分词的方法、装置及计算机可读存储介质,旨在通过在管理后台对搜索分词策略进行动态调整,来优化分词效果,提高搜索性能,提升搜索结果匹配度,并最终使得搜索结果能够更符合用户的搜索期望,提升用户使用体验。为实现上述目的,本专利技术提供的一种搜索分词的方法,所述方法包括以下步骤:接受搜索策略管理后台对搜索分词策略进行动态调整;根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端。可选地,所述搜索策略管理后台通过调整分词过滤策略粒度来动态调整所述搜索分词策略。可选地,所述分词过滤策略粒度包括第一过滤策略粒度、第二过滤策略粒度以及第三过滤策略粒度;所述第一过滤策略粒度表示原生搜索分词策略;第二过滤策略粒度表示在所述原生搜索分词策略的基础上,将重复的单字分词结果过滤掉;第三过滤策略粒度表示在所述原生搜索分词策略的基础上,将重复的单字分词结果及重复的双字分词结果过滤掉。可选地,所述接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体包括:定期统计当前搜索结果是否符合用户的实际搜索期望;若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整。可选地,所述若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体包括:若统计出当前搜索结果不符合用户的实际搜索期望,则通过调整分词过滤策略粒度重新配置所述搜索分词策略。可选地,所述若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体还包括:将重新配置好的所述搜索分词策略同步保存在Zookeeper协调资源服务平台,以通过所述Zookeeper协调资源服务平台持久化所述搜索分词策略;通过ElasticSearch搜索服务集群实时监听所述Zookeeper资源协调服务平台上的所述搜索分词策略是否发生变化,并在所述搜索分词策略发生变化时,按所述搜索分词策略对所述ElasticSearch搜索服务集群中的各个节点进行调整。可选地,所述根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端的步骤具体包括:接收所述客户端发送过来的搜索请求,并对所述搜索请求进行合规性验证;根据当前调整的搜索分词策略对通过所述合规性验证的所述搜索请求进行分词搜索,并将搜索结果返回给所述客户端。可选地,所述接收所述客户端发送过来的搜索请求,并对所述搜索请求进行合规性验证的步骤具体包括:接收所述客户端发送过来的搜索请求,并通过参数校验及无效请求过滤来对所述搜索请求进行合规性验证。此外,为实现上述目的,本专利技术还提出一种搜索分词的装置,所述装置包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现上述的方法的步骤。此外,为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述的方法的步骤。本专利技术提出的搜索分词的方法、装置及计算机可读存储介质,其通过接受搜索策略管理后台对搜索分词策略进行动态调整,然后,再根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给该客户端。这样一来,当管理员发现前端用户反馈回来当前搜索结果不能符合用户的实际搜索期望时,便可在搜索策略管理后台对搜索分词策略进行动态调整,使得客户端发送过来的搜索请求可根据当前调整的搜索分词策略进行分词搜索,以将更符合用户的搜索期望的搜索结果返回给该客户端。可见,本专利技术的搜索分词的方法、装置及计算机可读存储介质,其可通过在管理后台对搜索分词策略进行动态调整,来优化分词效果,提高搜索性能,提升搜索结果匹配度,并最终使得搜索结果能够更符合用户的搜索期望,提升用户使用体验。附图说明图1为实现本专利技术各个实施例的移动终端的硬件结构示意图。图2为如图1所示的移动终端所基于的通信网络系统架构图。图3为本专利技术实施例一搜索分词的方法的流程框图。图4为图3所示搜索分词的方法步骤S110的具体流程框图。图5为图3所示搜索分词的方法步骤S120的具体流程框图。图6为本专利技术实施例二搜索分词的的装置的结构框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本专利技术的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。终端可以各种形式来实施。例如,本专利技术中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(PersonalDigitalAssistant,PDA)、便捷式媒体播放器(PortableMediaPlayer,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本专利技术的实施方式的构造也能够应用于固定类型的终端。请参阅图1,其为实现本专利技术各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(RadioFrequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元本文档来自技高网...

【技术保护点】
1.一种搜索分词的方法,其特征在于,所述方法包括以下步骤:接受搜索策略管理后台对搜索分词策略进行动态调整;根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端。

【技术特征摘要】
1.一种搜索分词的方法,其特征在于,所述方法包括以下步骤:接受搜索策略管理后台对搜索分词策略进行动态调整;根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端。2.根据权利要求1所述的方法,其特征在于,所述搜索策略管理后台通过调整分词过滤策略粒度来动态调整所述搜索分词策略。3.根据权利要求2所述的方法,其特征在于,所述分词过滤策略粒度包括第一过滤策略粒度、第二过滤策略粒度以及第三过滤策略粒度;所述第一过滤策略粒度表示原生搜索分词策略;第二过滤策略粒度表示在所述原生搜索分词策略的基础上,将重复的单字分词结果过滤掉;第三过滤策略粒度表示在所述原生搜索分词策略的基础上,将重复的单字分词结果及重复的双字分词结果过滤掉。4.根据权利要求1所述的方法,其特征在于,所述接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体包括:定期统计当前搜索结果是否符合用户的实际搜索期望;若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整。5.根据权利要求4所述的方法,其特征在于,所述若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体包括:若统计出当前搜索结果不符合用户的实际搜索期望,则通过调整分词过滤策略粒度重新配置所述搜索分词策略。6.根据权利要求5所述的方法,其特征在于,所述若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体还包括:将重新配置...

【专利技术属性】
技术研发人员:邹炜
申请(专利权)人:努比亚技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1