The present application provides a search method belonging to the field of search technology for solving the problem that accurate search results cannot be obtained for information with multi-text indexing fields in the prior art. The method comprises determining at least one first search strategy matching the query text, wherein each first search strategy corresponds to a search weight matching at least one text index field and the text index field, and executing separately in each of the corresponding text index fields based on each of the first search strategies. The search operation of the query text is carried out, and the search results of all the search operations are merged and output. The method disclosed in this application avoids the false recall caused by literal hits in unrelated text index fields, and effectively improves the relevance of the results; and through matching the corresponding search weights of different text index fields, the ranking of search results is optimized, and the accuracy of search results is effectively improved.
【技术实现步骤摘要】
一种搜索方法及装置,电子设备
本申请涉及计算机
,特别是涉及一种搜索方法及装置,电子设备。
技术介绍
随着互联网技术的发展,互联网上的信息呈爆炸式的增长,越来越多的用户通过互联网的信息搜索沟通从海量信息中获取自己关注的内容。而现有技术中,基于用户输入的文本进行信息搜索的搜索引擎,通常是基于文本相关性执行搜索服务。搜索引擎发展伊始,网页也是传统互联网的主要信息载体,因而,现有技术中的搜索方法主要针对网页搜索,基本能够获得用户关注的内容。然而,随着移动互联网的发展,O2O(Online-to-Offline)平台提供的本地生活化服务,极大的方便了人们的生活,在O2O平台上的搜索需求也逐渐增多。与网页不同,O2O平台的信息描述载体往往都具有多个文本索引域,用于从不同的角度对平台服务进行具体的描述。比如:我们描述一个提供具体餐饮服务商家POI(PointofInterest),可能会从商家名称、商家注册公司名称、品牌名称、商家所处商圈、商家地址、商家主营菜品、商家营业时间等等角度来进行描述。通常,O2O平台上的描述性文本索引域有时多达五十个以上,并且,这些文本索引域描述的信息往往并不相关,利用传统网页搜索方法对所有文本索引域进行信息检索很难获得全面的、准确的用户关注的内容。可见,现有技术中的搜索方法至少存在以下缺陷:对于具有多文本索引域的信息,无法获得准确的搜索结果的问题。
技术实现思路
本申请提供一种搜索方法,解决现有技术中对于具有多文本索引域的信息,无法获得准确的搜索结果的问题。为了解决上述问题,第一方面,本申请实施例提供了一种搜索方法,包括:确定与查询文本 ...
【技术保护点】
1.一种搜索方法,其特征在于,包括:确定与查询文本匹配的至少一个第一搜索策略,其中,每个所述第一搜索策略对应至少一个文本索引域及所述文本索引域匹配的搜索权重;基于每个所述第一搜索策略,在其对应的每个所述文本索引域分别执行所述查询文本的搜索操作;将上述所有搜索操作的搜索结果进行归并输出。
【技术特征摘要】
1.一种搜索方法,其特征在于,包括:确定与查询文本匹配的至少一个第一搜索策略,其中,每个所述第一搜索策略对应至少一个文本索引域及所述文本索引域匹配的搜索权重;基于每个所述第一搜索策略,在其对应的每个所述文本索引域分别执行所述查询文本的搜索操作;将上述所有搜索操作的搜索结果进行归并输出。2.根据权利要求1所述的方法,其特征在于,所述确定与查询文本匹配的至少一个第一搜索策略的步骤,包括:根据预先设置的第一搜索策略和查询文本的对应关系,确定与查询文本匹配的至少一个第一搜索策略;或,通过预先训练的每个第一搜索策略的分类器对查询文本分别进行识别,确定与所述查询文本匹配的至少一个第一搜索策略。3.根据权利要求2所述的方法,其特征在于,若通过预先训练的每个第一搜索策略的分类器对查询文本分别进行识别,确定与所述查询文本匹配的至少一个第一搜索策略,则所述确定与查询文本匹配的至少一个第一搜索策略的步骤之前,还包括:基于搜索日志训练第一搜索策略的分类器。4.根据权利要求3所述的方法,其特征在于,所述基于搜索日志训练第一搜索策略的分类器的步骤,包括:对搜索日志进行聚类,生成搜索策略空间定义,所述搜索策略空间定义用于表示不同第一搜索策略和查询文本的映射关系;基于每个所述第一搜索策略对应的搜索日志,分别训练相应的第一搜索策略的分类器。5.根据权利要求2所述的方法,其特征在于,若通过预先训练的每个第一搜索策略的分类器对查询文本分别进行识别,确定与所述查询文本匹配的至少一个第一搜索策略,则所述确定与查询文本匹配的至少一个第一搜索策略的步骤之前,还包括:确定每个第一搜索策略对应的文本索引域,及每个文本索引域匹配的搜索权重。6.根据权利要求5所述的方法,其特征在于,所述确定每个第一搜索策略对应的文本索引域,及每个文本索引域匹配的搜索权重的步骤,包括:对于每个第一搜索策略,获取基于该第一搜索策略对应的查询文本执行所有文本索引域的搜索操作的搜索日志;根据所述搜索日志中查询文本在各文本索引域的命中得分,迭代计算各文本索引域的平均权重;根据各文本索引域的平均权重确定该第一搜索策略匹配的文本索引域以及各文本索引域匹配的搜索权重。7.根据权利要求1所述的方法,其特征在于,所述基于每个所述第一搜索策略,在其对应的每个所述文本索引域分别执行所述查询文本的搜索操作的步骤,包括:根据搜索物料的相应文本索引域与所述查询文本的相关性执行物料召回;其中,所述相关性基于相应文本索引域的搜索权重确定。8.根据权利要求1所述的方法,其特征在于,所述基于每个所述第一搜索策略,在其对应的每个所述文本索引域分别执行所述查询文本的搜索操作的步骤之后,还包括:基于第二搜索策略对应的每个所述文本索引域,分别执行所述查询文本的搜索操作;其中,所述第二搜索策略对应搜索物料的全部文本索引域,且每个所述文本索引域的搜索权重相同。9.根据权利要求8所述的方法,其特征在于,所述将上述所有搜索操作的搜索结果进行归并输出的步骤之后,还包括:当满足预设条件时,基于所述第二搜索策略对应的搜索日志训练并更新所述第一搜索策略的分类器。10.根据权利要求9所述的方法,其特征在于,所述预设条件包括以下至少一项:达到预设更新周期、第一点击率与第二点击率的比值大于预设阈值;其中,所述第一点击率为对基于所述第二搜索策略执行搜索操作的搜索结果的点击率,所述第二点击率为对基于第一搜索策略执行搜索操作的搜索结果的点击率。11.一种搜索装置,其特征在于,包括:第一搜索策略确定模块,用于确定与查...
【专利技术属性】
技术研发人员:刘铭,陈达遥,庞盟盟,冯涛,曾之肇,魏永超,潘文彬,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。