一种搜索方法和服务器技术

技术编号:21477775 阅读:29 留言:0更新日期:2019-06-29 04:51
本申请提供了一种搜索方法和服务器,其中,该方法包括:获取用户搜索词;确定与用户搜索词相似的改写搜索词,其中,改写搜索词是基于多个用户的历史搜索点击行为确定的与用户搜索词对应相似搜索点击行为的搜索词;基于用户搜索词进行搜索匹配,得到第一搜索匹配结果;基于改写搜索词进行搜索匹配,得到第二搜索匹配结果;将第一搜索匹配结果和第二搜索匹配结果一起作为基于用户搜索词的搜索结果进行返回。通过本申请的方案解决了现有的搜索方法中所存在的因为语义表述的差别导致一些符合用户搜索意图的一些产品无法被召回的技术问题,达到了有效提高产品的召回率,提高搜索效率和准确度的技术效果。

【技术实现步骤摘要】
一种搜索方法和服务器
本申请属于互联网
,尤其涉及一种搜索方法和服务器。
技术介绍
在电子商务领域,搜索一直是人们极为关注的话题。对于电商平台而言,希望用户输入一个搜索词(Query)之后,可以得到很多的搜索结果供用户选择,以便于用户可以挑选到自己感兴趣的东西,以提高平台的流量和成交率。现有的搜索匹配方式一般是对用户输入的搜索词进行分词,然后进行匹配,只有产品的产品标题中存在与用户搜索词分词后得到的分词片段完全吻合的片段,这些产品才可能作为该用户搜索词的搜索结果进行展现。然而,有时会存在一些用户搜索词与产品标题之间的描述语言存在差异,例如:Query:nike运动鞋,产品标题:nike跑步鞋。在用户搜索词为nike运动鞋的情况下,产品标题中存在nike跑步鞋但是不存在nike运动鞋的产品就不会作为匹配的搜索结果进行展示。这样就会导致一些满足用户搜索意图的产品,由于描述语言的差异导致不会作为搜索结果被展示。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本申请目的在于提供一种搜索方法和服务器,可以使得更多的满足用户搜索意图的产品作为搜索结果被召回。本申请提供一种搜索方法和服务器是这样实现的:一种搜索方法,所述方法包括:获取用户搜索词;确定与所述用户搜索词相似的改写搜索词,其中,所述改写搜索词是基于多个用户的历史搜索点击行为确定的与所述用户搜索词对应相似搜索点击行为的搜索词;基于所述用户搜索词进行搜索匹配,得到第一搜索匹配结果;基于所述改写搜索词进行搜索匹配,得到第二搜索匹配结果;将所述第一搜索匹配结果和所述第二搜索匹配结果一起作为基于所述用户搜索词的搜索结果进行返回。一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行如下步骤:获取用户搜索词;确定与所述用户搜索词相似的改写搜索词,其中,所述改写搜索词是基于多个用户的历史搜索点击行为确定的与所述用户搜索词对应相似搜索点击行为的搜索词;基于所述用户搜索词进行搜索匹配,得到第一搜索匹配结果;基于所述改写搜索词进行搜索匹配,得到第二搜索匹配结果;将所述第一搜索匹配结果和所述第二搜索匹配结果一起作为基于所述用户搜索词的搜索结果进行返回。一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述方法的步骤。本申请提供的搜索方法和服务器,在获取到用户搜索词后,不是直接以用户搜索词进行搜索结果召回,而是确定与该用户搜索词相似的改写搜索词,然后将基于用户搜索词的搜索结果和基于改写搜索词的搜索结果一起作为搜索结果被返回,从而解决了现有的搜索方法中所存在的因为语义表述的差别导致一些符合用户搜索意图的一些产品无法被召回的技术问题,达到了有效提高产品的召回率,提高搜索效率,使得更多的满足用户搜索意图的产品作为搜索结果被召回,有效提高了用户的搜索体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请提供的搜索方法一种实施例的方法流程图;图2是本申请提供的确定出相似搜索词的示意图;图3是本申请提供的基于模型训练的相似搜索词确定流程图;图4是现有的搜索方法流程图;图5是本申请提供的搜索方法流程示意图;图6是本申请提供的服务器一种实施例的模块结构示意图;图7是本申请提供的搜索装置一种实施例的模块结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。为了使得可以尽可能多地匹配出搜索结果,在匹配搜索结果的时候,现有主要有以下几种方式:1)基于同义词的搜索匹配即,可以预先建立一个同义词词典,在获取到用户搜索词之后,从该同义词词典中匹配出用户搜索词的同义词。然后将基于用户搜索词得到的搜索结果和基于同义词得到的搜索结果一起作为搜索结果返回。2)翻译学习的方式即,对用户搜索词进行切分和翻译,得到多个切分和翻译的候选结果,然后通过机器学些的方式从多个切分和翻译结果中选择最优的搜索词作为同义搜索词进行搜索。然而,上述第一种方式需要预先建立一个同义词词典,且字典中收录的一般就是一些正常词典中的近义词,无法从搜索的角度反映是否相似,而仅是语义上的近似。第二种方式需要进行文档翻译,精确度不高。针对现有的扩展搜索中所窜在的,在本例中,考虑到如果用户在输入不同的用户搜索词之后,有相似的点击行为,那么这两个用户搜索词可以认为是互为相似的搜索词,如果可以通过相似的搜索词对用户搜索词进行改写,那么可以避免因语义差异而导致一些本该出现在搜索结果的产品无法出现在搜索结果中。例如,搜索请求为“欧美凉鞋平底”,那么可以考虑到如果希望将与搜索请求相吻合的产品都作为搜索结果推荐,而按照现有的匹配搜索方式会导致产品标题中存在“罗马鞋夹角”而不存在“欧美凉鞋平底”的产品不存在搜索结果中。但是在实际的搜索行为中,“欧美凉鞋平底”和“罗马鞋夹角”这两个搜索词,所对应的用户点击行为是相似的。为此,考虑到如果可以将“罗马鞋夹角”作为“欧美凉鞋平底”相似的搜索词也作为搜索词进行搜索匹配,从而将基于“罗马鞋夹角”得到的搜索结果,和基于“欧美凉鞋平底”得到的搜索结果,都作为输入用户搜索词“欧美凉鞋平底”时产生的搜索结果进行显示,那么就可以避免上述因为匹配搜索结果所存在的限制导致有些符合要求的产品无法作为搜索结果进行展示。基于上述目的,在本例中提供了一种搜索方法,图1是本申请所述一种搜索方法一个实施例的方法流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本申请实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。如图1所示,可以包括如下步骤:步骤101:获取用户搜索词;该用户搜索词可以是用户通过类似手机、计算机等智能设备输入的。例如,用户在电商平台的搜索框中输入“欧美凉鞋平底”,在点击触发搜索功能之后,“欧美凉鞋平底”就被作为用户搜索词。在实际实现的时候,该用户搜索词不仅可以是通过文字输入的,也可以是采用语音输入,或者图标识别输入、二维码扫描输入等等。这些输入和获取用户搜索词的方式都是可以被构想的。步骤102:确定与所述用户搜索词相似的改写搜索词,其中,所述改写搜索词是基于多个用户的历史搜索点击行为确定的与所述用户搜索词对应相似搜索点击行为的搜索词;该相似可以理解为表达近似的搜索意图,例如,“欧美凉鞋平底”与“罗马本文档来自技高网
...

【技术保护点】
1.一种搜索方法,其特征在于,所述方法包括:获取用户搜索词;确定与所述用户搜索词相似的改写搜索词,其中,所述改写搜索词是基于多个用户的历史搜索点击行为确定的与所述用户搜索词对应相似搜索点击行为的搜索词;基于所述用户搜索词进行搜索匹配,得到第一搜索匹配结果;基于所述改写搜索词进行搜索匹配,得到第二搜索匹配结果;将所述第一搜索匹配结果和所述第二搜索匹配结果一起作为基于所述用户搜索词的搜索结果进行返回。

【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括:获取用户搜索词;确定与所述用户搜索词相似的改写搜索词,其中,所述改写搜索词是基于多个用户的历史搜索点击行为确定的与所述用户搜索词对应相似搜索点击行为的搜索词;基于所述用户搜索词进行搜索匹配,得到第一搜索匹配结果;基于所述改写搜索词进行搜索匹配,得到第二搜索匹配结果;将所述第一搜索匹配结果和所述第二搜索匹配结果一起作为基于所述用户搜索词的搜索结果进行返回。2.根据权利要求1所述的方法,其特征在于,确定与所述用户搜索词相似的改写搜索词,包括:获取所述用户搜索词的相似度特征;将相似度特征与所述用户搜索词的相似度特征之间的相似度最高的一个或多个改写搜索词作为与所述用户搜索词相似的改写搜索词。3.根据权利要求1所述的方法,其特征在于,确定与所述用户搜索词相似的改写搜索词,包括:获取所述用户搜索词的相似度特征;将相似度特征与所述用户搜索词的相似度特征之间的相似度超出预设阈值的一个或多个改写搜索词作为与所述用户搜索词相似的改写搜索词。4.根据权利要求2或3所述的方法,其特征在于,所述相似度特征包括以下维度特征至少之一:点击行为数据、语义。5.根据权利要求1所述的方法,其特征在于,根据所述用户搜索词和所述改写搜索词进行搜索,返回搜索结果,包括:对所述用户搜索词和所述改写搜索词分别进行分词处理得到分词片段;基于所述分词片段进行搜索匹配,得到产品标题中存在所述分词片段的产品;将匹配得到的产品作为搜索结果。6.根据权利要求1所述的方法,其特征在于,将所述第一搜索匹配结果和所述第二搜索匹配结果一起作为基于所述用户搜索词的搜索结果进行返回,包括:对所述第一搜索匹配结果和第二搜索匹配结果进行去重处理;将去重处理后得到的搜索匹配结果,作为搜索结果返回。7.一种服务器,其特征在于,包括处理器以及用于...

【专利技术属性】
技术研发人员:肖荣姬建辉
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1