一种相关搜索推荐方法、装置及电子设备制造方法及图纸

技术编号:32804709 阅读:15 留言:0更新日期:2022-03-26 19:56
本发明专利技术公开了一种相关搜索推荐方法、装置及电子设备,该方法包括:获取查询词对应的相关搜索结果项集合;基于用户输入的目标查询词和预先训练好的点击预估模型,对相关搜索结果项集合中的相关搜索结果项进行排序,其中,点击预估模型通过将相关搜索结果项作为查询词时的第一特征参数作为模型输入参数训练获得,第一特征参数包括搜索结果的分享参数和/或下载参数;基于排序结果,获取目标查询词的目标相关搜索结果项,并在目标查询词的搜索结果页中推荐目标相关搜索结果项。通过上述技术方案,解决了现有技术中相关搜索推荐质量较差的技术问题,提高了相关搜索推荐的质量。提高了相关搜索推荐的质量。提高了相关搜索推荐的质量。

【技术实现步骤摘要】
一种相关搜索推荐方法、装置及电子设备


[0001]本专利技术涉及软件
,特别涉及一种相关搜索推荐方法、装置及电子设备。

技术介绍

[0002]在搜索场景下,搜索结果页中除了展现查询词对应的搜索结果,还依据查询词进行相关搜索推荐。相关搜索推荐中通常提供与查询词相关的、搜索结果较好的相关搜索结果项即相关搜索推荐词,若用户点击某一相关搜索结果项,搜索引擎会将该相关搜索结果项作为查询词进行搜索,并展示搜索结果。
[0003]现有技术中,通常会根据用户的查询日志,选取查询词PV(一段时间内某一查询词被所有用户查询的总次数)最高的一定数量的查询词作为候选集合,使用候选集合建立倒排索引,每天对数据进行更新。当用户输入查询词后,通过倒排索引召回相关搜索结果项,并根据相关搜索结果项的PV值以及相关搜索结果项与查询词之间的文本相似度对召回的相关搜索结果项排序进行调整,并将最终结果推荐给用户。但基于查询词PV无法很好的反映查询词质量,据此进行的相关搜索推荐存在质量较差的技术问题。

技术实现思路

[0004]本专利技术实施例提供一种相关搜索推荐方法、装置及电子设备,用于解决现有技术中相关搜索推荐质量较差的技术问题,提高相关搜索结果项的质量。
[0005]本专利技术实施例提供一种相关搜索推荐方法,包括:
[0006]获取查询词对应的相关搜索结果项集合;
[0007]基于用户输入的目标查询词和预先训练好的点击预估模型,对所述相关搜索结果项集合中的相关搜索结果项进行排序;
[0008]基于排序结果,获取所述目标查询词的目标相关搜索结果项,并在所述目标查询词的搜索结果页中推荐所述目标相关搜索结果项;
[0009]其中,所述点击预估模型通过将相关搜索结果项作为查询词时的第一特征参数作为模型输入参数训练获得,所述第一特征参数包括搜索结果的分享参数和/或下载参数。
[0010]可选的,所述获取查询词对应的相关搜索结果项集合,包括:
[0011]基于历史查询日志,建立用户输入的查询词与用户对应点击的相关搜索结果项之间的倒排序索引;
[0012]根据所述倒排序索引结果获得查询词对应的候选词集合;
[0013]基于所述候选词集合获得所述相关搜索结果项集合。
[0014]可选的,所述获取查询词对应的相关搜索结果项集合,包括:
[0015]基于历史查询日志,建立用户输入的查询词之间的共现词集合,其中,所述共现词集合中包含如下一种或多种查询词:同一用户在预设时间范围内搜索的查询词、被打开过的同一搜索结果对应的不同查询词、语义相似度大于相似阈值的查询词;
[0016]基于所述共现词集合,获得查询词对应的相关搜索结果项集合。
[0017]可选的,所述基于历史查询日志,建立用户输入的查询词之间的共现词集合,包括:
[0018]基于历史查询日志,对同一用户的历史查询日志进行会话重建,将所述预设时间范围内进行搜索的查询日志合并为同一会话;
[0019]将同一会话内出现的查询词作为会话共现词写入所述共现词集合。
[0020]可选的,所述基于历史查询日志,建立用户输入的查询词之间的共现词集合,包括:
[0021]基于对搜索结果执行过分享和/或下载操作的历史查询日志,获得同一搜索结果对应的多个查询词及每个查询词的出现次数;
[0022]基于所述多个查询词及每个查询词的出现次数,获得结果共现词集合;
[0023]将所述结果共现词集合写入所述共现词集合。
[0024]可选的,所述基于历史查询日志,建立用户输入的查询词之间的共现词集合,包括:
[0025]获取候选词集合中每个候选词的语义向量,其中,所述语义向量基于候选词的分词和候选词对应的目标图片获得,相似的所述语义向量对应的目标图片相似;
[0026]基于所述语义向量之间的相似度对所述第一相关搜索候选词集合进行语义召回;
[0027]将语义召回的候选词写入所述共现词集合。
[0028]可选的,所述点击预估模型的模型输入参数还包括:
[0029]所述相关搜索结果项作为搜索结果页中相关搜索推荐词时的第二特征参数。
[0030]可选的,所述点击预估模型的训练方法包括:
[0031]基于历史查询日志,获得用户输入的查询词和用户对应点击的相关搜索结果项;
[0032]获得所述查询词与所述相关搜索结果项之间的文本匹配特征;
[0033]基于所述查询词、所述相关搜索结果项、所述文本匹配特征、所述第一特征参数以及所述第二特征参数构建训练样本;
[0034]基于多个所述训练样本对所述点击预估模型进行训练。
[0035]可选的,所述基于所述查询词、所述相关搜索结果项、所述文本匹配特征、所述第一特征参数以及所述第二特征参数构建训练样本,进一步包括:
[0036]获得所述相关搜索结果项作为查询词时,搜索结果页中广告位的第三特征参数;
[0037]基于所述查询词、所述相关搜索结果项、所述文本匹配特征以、所述第一特征参数、所述第二特征参数以及所述第三特征参数构建训练样本。
[0038]可选的,所述相关搜索结果包括图片和/或视频的相关搜索。
[0039]可选的,所述基于用户输入的目标查询词和预先训练好的点击预估模型,对所述相关搜索结果项集合中的相关搜索结果项进行排序,包括:
[0040]将所述目标查询词和相关搜索结果项集合中的每个相关搜索结果项输入所述点击预估模型,通过所述点击预估模型预估获得每个相关搜索结果项的点击率;
[0041]根据所述点击率的大小对所有相关搜索结果项进行排序,获得排序结果。
[0042]本专利技术实施例还提供一种相关搜索推荐装置,包括:
[0043]获取单元,用于获取查询词对应的相关搜索结果项集合;
[0044]排序单元,用于基于用户输入的目标查询词和预先训练好的点击预估模型,对所
述相关搜索结果项集合中的相关搜索结果项进行排序;
[0045]推荐单元,用于基于排序结果,获取所述目标查询词的目标相关搜索结果项,并在所述目标查询词的搜索结果页中推荐所述目标相关搜索结果项;
[0046]其中,所述点击预估模型通过将相关搜索结果项作为查询词时的第一特征参数作为模型输入参数训练获得,所述第一特征参数包括搜索结果的分享参数和/或下载参数。
[0047]可选的,所述获取单元用于:
[0048]基于历史查询日志,建立用户输入的查询词与用户对应点击的相关搜索结果项之间的倒排序索引;
[0049]根据所述倒排序索引结果获得查询词对应的候选词集合;
[0050]基于所述候选词集合获得所述相关搜索结果项集合。
[0051]可选的,所述获取单元还用于:
[0052]基于历史查询日志,建立用户输入的查询词之间的共现词集合,其中,所述共现词集合中包含如下一种或多种查询词:同一用户在预设时间范围内搜索的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相关搜索推荐方法,其特征在于,包括:获取查询词对应的相关搜索结果项集合;基于用户输入的目标查询词和预先训练好的点击预估模型,对所述相关搜索结果项集合中的相关搜索结果项进行排序;基于排序结果,获取所述目标查询词的目标相关搜索结果项,并在所述目标查询词的搜索结果页中推荐所述目标相关搜索结果项;其中,所述点击预估模型通过将相关搜索结果项作为查询词时的第一特征参数作为模型输入参数训练获得,所述第一特征参数包括搜索结果的分享参数和/或下载参数。2.如权利要求1所述的方法,其特征在于,所述获取查询词对应的相关搜索结果项集合,包括:基于历史查询日志,建立用户输入的查询词与用户对应点击的相关搜索结果项之间的倒排序索引;根据所述倒排序索引结果获得查询词对应的候选词集合;基于所述候选词集合获得所述相关搜索结果项集合。3.如权利要求1所述的方法,其特征在于,所述获取查询词对应的相关搜索结果项集合,包括:基于历史查询日志,建立用户输入的查询词之间的共现词集合,其中,所述共现词集合中包含如下一种或多种查询词:同一用户在预设时间范围内搜索的查询词、被打开过的同一搜索结果对应的不同查询词、语义相似度大于相似阈值的查询词;基于所述共现词集合,获得查询词对应的相关搜索结果项集合。4.如权利要求3所述的方法,其特征在于,所述基于历史查询日志,建立用户输入的查询词之间的共现词集合,包括:基于历史查询日志,对同一用户的历史查询日志进行会话重建,将所述预设时间范围内进行搜索的查询日志合并为同一会话;将同一会话内出现的查询词作为会话共现词写入所述共现词集合。5.如权利要求3所述的方法,其特征在于,所述基于历史查询日志,建立用户输入的查询词之间的共现词集合,包括:基于对搜索结果执行过分享和/或下载操作的历史查询日志,获得同一搜索结...

【专利技术属性】
技术研发人员:常庆丰刘慧慧周泽南陈炜鹏许静芳
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1