The invention discloses a method, device and computer-readable storage medium for searching word segmentation, which belongs to the technical field of data searching and processing. The method comprises the following steps: dynamically adjusting the search word segmentation strategy in the background of accepting the search strategy management; and searching sent by the client according to the currently adjusted search word segmentation strategy. The request is segmented and the search results are returned to the client. The search segmentation method, device and computer readable storage medium of the invention can optimize the segmentation effect, improve the search performance, enhance the matching degree of the search results, and finally make the search results more in line with the search expectations of the users and enhance the users by dynamically adjusting the search segmentation strategy in the management background. User's experience.
【技术实现步骤摘要】
一种搜索分词的方法、装置及计算机可读存储介质
本专利技术涉及数据搜索处理
,尤其涉及一种搜索分词的方法、装置及计算机可读存储介质。
技术介绍
搜索功能几乎是每个APP或WEB网站必备的功能,作为搜索功能的实现支撑技术,现今主流的全文搜索技术库主要是Lucene(高性能的、可扩展的信息检索工具库),而ElasticSearch(一个基于Lucene的搜索服务器)与Solr(独立的企业级搜索应用服务器)等软件在Lucene的基础上进行了封装,屏蔽了Lucene复杂的技术细节,对外提供简单的API,从而使得全文搜索的应用变得极其简单,只要部署好ElasticSearch集群服务,在业务程序中调用相应的API即可对用户端提供搜索效果较好的搜索功能。然而,在搜索功能的实际应用中,几乎很少会有直接根据搜索的匹配度高低返回结果给用户端,多数情况下,会把匹配结果结合其他维度因素进行最终得分排序计算处理,然后根据最终得分的高低,将排名前几位的搜索结果返回给用户端。如应用搜索中的匹配度+下载量模式,用户在应用商店中输入关键词进行搜索应用,应用商店的服务端会先使用关键词进行应用匹配搜索,然后把搜索出来的应用列表结合各个应用的下载量,按照一定的得分计算公式进行最终得分计算,并根据最后得分排序返回排名前几位的应用。在这样的场景下,会存在一类情况,某个应用对于关键词的匹配度不高,但因下载量极大,使得最终得分排在最前面,返回给用户端,然而这并非是用户所期望的搜索结果,使得用户的使用体验很差。
技术实现思路
本专利技术的主要目的在于提出搜索分词的方法、装置及计算机可读存储介质,旨在通过 ...
【技术保护点】
1.一种搜索分词的方法,其特征在于,所述方法包括以下步骤:接受搜索策略管理后台对搜索分词策略进行动态调整;根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端。
【技术特征摘要】
1.一种搜索分词的方法,其特征在于,所述方法包括以下步骤:接受搜索策略管理后台对搜索分词策略进行动态调整;根据当前调整的搜索分词策略对客户端发送过来的搜索请求进行分词搜索,并将搜索结果返回给所述客户端。2.根据权利要求1所述的方法,其特征在于,所述搜索策略管理后台通过调整分词过滤策略粒度来动态调整所述搜索分词策略。3.根据权利要求2所述的方法,其特征在于,所述分词过滤策略粒度包括第一过滤策略粒度、第二过滤策略粒度以及第三过滤策略粒度;所述第一过滤策略粒度表示原生搜索分词策略;第二过滤策略粒度表示在所述原生搜索分词策略的基础上,将重复的单字分词结果过滤掉;第三过滤策略粒度表示在所述原生搜索分词策略的基础上,将重复的单字分词结果及重复的双字分词结果过滤掉。4.根据权利要求1所述的方法,其特征在于,所述接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体包括:定期统计当前搜索结果是否符合用户的实际搜索期望;若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整。5.根据权利要求4所述的方法,其特征在于,所述若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体包括:若统计出当前搜索结果不符合用户的实际搜索期望,则通过调整分词过滤策略粒度重新配置所述搜索分词策略。6.根据权利要求5所述的方法,其特征在于,所述若统计出当前搜索结果不符合用户的实际搜索期望,则接受搜索策略管理后台对搜索分词策略进行动态调整的步骤具体还包括:将重新配置...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。