目标人群搜索意图的识别方法、装置、电子设备及介质制造方法及图纸

技术编号:30079846 阅读:10 留言:0更新日期:2021-09-18 08:36
本公开关于一种目标人群搜索意图的识别方法、装置、电子设备和存储介质,其中,该方法包括:在获取到搜索请求时,获取搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,统计特征用于表征搜索词在预设时间段之内的分布情况;根据每个搜索词的搜索特征,从各搜索词中确定出候选搜索词;根据候选搜索词的统计特征,判定候选搜索词是否具有搜索目标人群意图。由此,通过根据搜索词在预设时间段之内的搜索特征和统计特征,确定搜索词是否具有搜索目标人群意图,提高了搜索准确性。性。性。

【技术实现步骤摘要】
目标人群搜索意图的识别方法、装置、电子设备及介质


[0001]本公开涉及搜索
,尤其涉及一种目标人群搜索意图的识别方法、装置、电子设备和存储介质。

技术介绍

[0002]在搜索领域,准确的搜索意图可以辅助进行召回结果的过滤,可见,搜索意图识别具有重要作用。在一些搜索场景下,存在对目标人群进行搜索的搜索行为,比如,在社交平台搜索粉丝数量较多的用户,因此需要对目标人群搜索意图进行识别。
[0003]相关技术中,常见的识别用户搜索意图的方法有基于机器学习的搜索意图识别,主要是基于已有搜索词进行搜索意图的标注,利用标注样本训练机器学习模型,利用训练好的模型预测搜索词的搜索意图。
[0004]但是,基于机器学习的搜索意图识别,是通过学习文本的语义信息识别搜索意图,而通常目标人群的用户名蕴含的语义信息较少,识别准确性低。

技术实现思路

[0005]根据本公开实施例的第一方面,提供一种目标人群搜索意图的识别方法,包括:
[0006]在获取到搜索请求时,获取所述搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,所述统计特征用于表征所述搜索词在所述预设时间段之内的分布情况;
[0007]根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词;
[0008]根据所述候选搜索词的统计特征,判定所述候选搜索词是否具有搜索目标人群意图。
[0009]在本公开第一方面实施例一种可能的实现方式中,在所述根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词之后,所述方法还包括:
[0010]在所述搜索词非候选搜索词时,基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,其中,所述目标用户列表中的用户属于所述目标人群。
[0011]在本公开第一方面实施例一种可能的实现方式中,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:
[0012]基于各搜索词与改写词之间的映射关系,确定所述搜索词对应的改写词,其中,所述改写词为用于替换所述搜索词的分词;
[0013]在所述改写词具有搜索目标人群意图时,确定所述搜索词具有搜索目标人群意图。
[0014]在本公开第一方面实施例一种可能的实现方式中,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:
[0015]获取所述目标用户列表;
[0016]计算所述搜索词与所述目标用户列表中每个用户标识之间的第一文本相似度;
[0017]根据所述第一文本相似度,判定所述搜索词是否具有搜索目标人群意图。
[0018]在本公开第一方面实施例一种可能的实现方式中,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:
[0019]从具有搜索目标人群意图的历史搜索词中,确定出与所述搜索词的相关度大于相关度阈值的目标搜索词;
[0020]计算所述搜索词与所述目标搜索词之间的第二文本相似度;
[0021]根据所述第二文本相似度,判定所述搜索词是否具有搜索目标人群意图。
[0022]在本公开第一方面实施例一种可能的实现方式中,所述计算所述搜索词与所述目标搜索词之间的第二文本相似度,包括:
[0023]确定所述搜索词与所述目标搜索词之间的编辑距离,其中,所述编辑距离为对所述搜索词进行编辑操作得到所述目标搜索词所需的最少操作次数;
[0024]根据所述编辑距离、所述搜索词的字符数量及所述目标搜索词的字符数量,计算所述第二文本相似度。
[0025]在本公开第一方面实施例一种可能的实现方式中,所述根据所述候选搜索词的统计特征,判定所述候选搜索词是否具有搜索目标人群意图,包括:
[0026]在所述候选搜索词的统计特征满足预设条件时,确定所述候选搜索词具有搜索目标人群意图。
[0027]在本公开第一方面实施例一种可能的实现方式中,所述搜索特征包括搜索次数和搜索结果的点击量,所述根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词,包括:
[0028]将所述搜索次数和所述点击量均大于对应的阈值的搜索词作为所述候选搜索词。
[0029]根据本公开实施例的第二方面,提供一种目标人群搜索意图的识别装置,包括:
[0030]获取模块,被配置为在获取到搜索请求时,获取所述搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,所述统计特征用于表征所述搜索词在所述预设时间段之内的分布情况;
[0031]确定模块,被配置为根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词;
[0032]判定模块,被配置为根据所述候选搜索词的统计特征,判定所述候选搜索词是否具有搜索目标人群意图。
[0033]在本公开第二方面实施例一种可能的实现方式中,所述判定模块,还被配置为在所述搜索词非候选搜索词时,基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,其中,所述目标用户列表中的用户属于所述目标人群。
[0034]在本公开第二方面实施例一种可能的实现方式中,所述判定模块,被配置为:
[0035]基于各搜索词与改写词之间的映射关系,确定所述搜索词对应的改写词,其中,所述改写词为用于替换所述搜索词的分词;
[0036]在所述改写词具有搜索目标人群意图时,确定所述搜索词具有搜索目标人群意图。
[0037]在本公开第二方面实施例一种可能的实现方式中,所述判定模块,被配置为:
[0038]获取所述目标用户列表;
[0039]计算所述搜索词与所述目标用户列表中每个用户标识之间的第一文本相似度;
[0040]根据所述第一文本相似度,判定所述搜索词是否具有搜索目标人群意图。
[0041]在本公开第二方面实施例一种可能的实现方式中,所述判定模块,被配置为:
[0042]从具有搜索目标人群意图的历史搜索词中,确定出与所述搜索词的相关度大于相关度阈值的目标搜索词;
[0043]计算所述搜索词与所述目标搜索词之间的第二文本相似度;
[0044]根据所述第二文本相似度,判定所述搜索词是否具有搜索目标人群意图。
[0045]在本公开第二方面实施例一种可能的实现方式中,所述判定模块,被配置为:
[0046]确定所述搜索词与所述目标搜索词之间的编辑距离,其中,所述编辑距离为对所述搜索词进行编辑操作得到所述目标搜索词所需的最少操作次数;
[0047]根据所述编辑距离、所述搜索词的字符数量及所述目标搜索词的字符数量,计算所述第二文本相似度。
[0048]在本公开第二方面实施例一种可能的实现方式中,所述判定模块,被配置为:
[0049]在所述候选搜索词的统计特征满足预设条件时,确定所述候选搜索词具有搜索目标人群意图。
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标人群搜索意图的识别方法,其特征在于,包括:在获取到搜索请求时,获取所述搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,所述统计特征用于表征所述搜索词在所述预设时间段之内的分布情况;根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词;根据所述候选搜索词的统计特征,判定所述候选搜索词是否具有搜索目标人群意图。2.如权利要求1所述的方法,其特征在于,在所述根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词之后,所述方法还包括:在所述搜索词非候选搜索词时,基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,其中,所述目标用户列表中的用户属于所述目标人群。3.如权利要求2所述的方法,其特征在于,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:基于各搜索词与改写词之间的映射关系,确定所述搜索词对应的改写词,其中,所述改写词为用于替换所述搜索词的分词;在所述改写词具有搜索目标人群意图时,确定所述搜索词具有搜索目标人群意图。4.如权利要求2所述的方法,其特征在于,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:获取所述目标用户列表;计算所述搜索词与所述目标用户列表中每个用户标识之间的第一文本相似度;根据所述第一文本相似度,判定所述搜索词是否具有搜索目标人群意图。5.如权利要求2所述的方法,其特征在于,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:从具有搜索目标人群意图的历史搜索词中,确定出与所述搜索词的相关度大于相关度阈值的目标搜索词;计算所...

【专利技术属性】
技术研发人员:黎晓东冯翔
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1