一种基于键入搜索词推荐用户搜索词的方法技术

技术编号:37773167 阅读:13 留言:0更新日期:2023-06-06 13:39
本发明专利技术涉及电数字数据处理技术领域,具体涉及一种基于键入搜索词推荐用户搜索词的方法,该方法包括:获取待推荐用户对应的目标键入信息,并确定目标键入信息对应的目标类别;根据目标键入信息对应的目标类别,获取候选搜索词集合中的每个候选搜索词对应的目标预测评分,其中,候选搜索词集合包括:待推荐用户对应的相似用户集合中的各个相似用户和待推荐用户在目标键入信息对应的目标类别下的搜索词;根据候选搜索词对应的目标预测评分,从候选搜索词集合中筛选出待推荐搜索词集合;将待推荐搜索词集合推荐给待推荐用户。本发明专利技术通过对目标键入信息进行数据处理,提高了对用户进行搜索词推荐的准确度,应用于对用户进行搜索词推荐。词推荐。词推荐。

【技术实现步骤摘要】
一种基于键入搜索词推荐用户搜索词的方法


[0001]本专利技术涉及电数字数据处理
,具体涉及一种基于键入搜索词推荐用户搜索词的方法。

技术介绍

[0002]随着科学技术的发展,各种类型的电子设备走入人们的日常生活,为了提高电子设备使用的智能化体验,现阶段大多数电子设备往往会根据用户的搜索词来推荐相关内容,其中,搜索词是指用户在搜索引擎中搜索想要了解内容时所输入的词条。为了提高用户体验,往往在用户输入搜索词部分内容时,进行搜索词推荐,当推荐的搜索词中含有用户需要的搜索词,可以使用户不需进行后续的输入,从而提高用户体验。目前,对用户进行搜索词推荐时,通常采用的方式为:基于用户的历史搜索词,确定推荐搜索词。
[0003]然而,当采用上述方式时,经常会存在如下技术问题:当用户想要搜索的内容是用户历史未曾搜索过的类型方面的内容时,基于用户的历史搜索词,往往难以准确的对用户进行搜索词推荐,从而导致对用户进行搜索词推荐的准确度低下。

技术实现思路

[0004]本专利技术的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本专利技术的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]为了解决对用户进行搜索词推荐的准确度低下的技术问题,本专利技术提出了一种基于键入搜索词推荐用户搜索词的方法。
[0006]本专利技术提供了一种基于键入搜索词推荐用户搜索词的方法,该方法包括:获取待推荐用户对应的目标键入信息,并确定所述目标键入信息对应的目标类别;根据所述目标键入信息对应的目标类别,获取候选搜索词集合中的每个候选搜索词对应的目标预测评分,其中,所述候选搜索词集合包括:所述待推荐用户对应的相似用户集合中的各个相似用户和所述待推荐用户在所述目标键入信息对应的目标类别下的搜索词;根据候选搜索词对应的目标预测评分,从所述候选搜索词集合中筛选出待推荐搜索词集合;将所述待推荐搜索词集合推荐给所述待推荐用户;确定所述相似用户集合包括以下步骤:获取待推荐用户对应的历史搜索信息集合和参考用户集合中每个参考用户对应的历史搜索信息集合;对得到的所有历史搜索信息集合包括的搜索词进行分类,得到目标类别集合;
确定得到的所有历史搜索信息集合包括的每两个搜索词之间的目标关联度;根据得到的所有历史搜索信息集合、所述目标类别集合和搜索词之间的目标关联度,确定每个目标用户在每个目标类别下的目标评估指标,得到目标评估矩阵,其中,目标用户是待推荐用户或参考用户;根据得到的所有历史搜索信息集合和所述目标评估矩阵,从所述参考用户集合中筛选出相似用户集合。
[0007]进一步地,所述对得到的所有历史搜索信息集合包括的搜索词进行分类,得到目标类别集合,包括:将得到的所有历史搜索信息集合包括的每个搜索词输入到预先训练完成的目标分类网络,得到所述搜索词属于预设类别集合中的每个预设类别的概率,作为所述搜索词在所述预设类别下的类别概率,得到所述搜索词对应的类别概率集合;对于得到的所有历史搜索信息集合包括的每个搜索词,从所述搜索词对应的类别概率集合中筛选出最大的类别概率,作为所述搜索词对应的目标概率,将所述搜索词对应的目标概率对应的预设类别,确定为所述搜索词对应的目标类别;将得到的所有历史搜索信息集合包括的所有搜索词对应的目标类别,组合为目标类别集合。
[0008]进一步地,所述确定得到的所有历史搜索信息集合包括的每两个搜索词之间的目标关联度,包括:根据这两个搜索词对应的目标概率,将这两个搜索词分别确定为第一搜索词和第二搜索词;根据第一数量、第二数量和第三数量,确定第一搜索词和第二搜索词之间的第一差异,其中,第一数量是所有历史搜索信息集合中包括第一搜索词不包括第二搜索词的历史搜索信息的数量,第二数量是所有历史搜索信息集合中包括第二搜索词不包括第一搜索词的历史搜索信息的数量,第三数量是所有历史搜索信息集合中既包括第一搜索词又包括第二搜索词的历史搜索信息的数量,第一数量和第二数量均与第一差异呈正相关,第三数量与第一差异呈负相关;将第二概率与第一搜索词对应的目标概率的差值的绝对值,确定为第一搜索词和第二搜索词之间的第二差异,其中,第二概率是第二搜索词在第一搜索词对应的目标类别下的类别概率;根据第一搜索词和第二搜索词之间的第一差异与第二差异,确定第一搜索词和第二搜索词之间的第三差异,其中,第一差异和第二差异均与第三差异呈正相关;对第一搜索词和第二搜索词进行编码,得到第一搜索词对应的第一编码数据和第二搜索词对应的第二编码数据;确定第一编码数据和第二编码数据之间的编辑距离,作为第一搜索词和第二搜索词之间的第四差异;根据第一搜索词和第二搜索词之间的第四差异与第三差异,确定第一搜索词和第二搜索词之间的目标关联度,其中,第四差异和第三差异均与目标关联度呈负相关。
[0009]进一步地,所述根据得到的所有历史搜索信息集合、所述目标类别集合和搜索词之间的目标关联度,确定每个目标用户在每个目标类别下的目标评估指标,包括:
将第四数量在第五数量中的占比,确定为所述目标用户在所述目标类别下的初始评估指标,其中,第四数量是所有历史搜索信息集合包括的所述目标用户在所述目标类别中键入搜索词的数量,第五数量是所有历史搜索信息集合包括的所述目标用户键入搜索词的数量;根据所有历史搜索信息集合包括的所述目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度,确定所述目标用户在所述目标类别下的第一关联度,其中,所述目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度均与第一关联度呈正相关;根据所有历史搜索信息集合包括的所有目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度,确定所述目标类别对应的第二关联度,其中,所有目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度均与第二关联度呈正相关;将所述目标用户在所述目标类别下的第一关联度,在所述目标类别对应的第二关联度中的占比,确定为所述目标用户在所述目标类别下的第三关联度;根据所述目标用户在所述目标类别集合中的目标类别下的初始评估指标,确定所述目标用户对应的参考评估指标,其中,所述目标用户在所述目标类别集合中的目标类别下的初始评估指标与参考评估指标呈正相关;根据所述目标用户对应的参考评估指标和所述目标用户在所述目标类别下的第三关联度,确定所述目标用户在所述目标类别下的目标评估指标,其中,参考评估指标和第三关联度均与目标评估指标呈正相关。
[0010]进一步地,所述根据得到的所有历史搜索信息集合和所述目标评估矩阵,从所述参考用户集合中筛选出相似用户集合,包括:根据得到的所有历史搜索信息集合,确定每个目标用户在每个目标类别下的语义契合度,得到语义契合度矩阵;根据所述目标评估矩阵和所述语义契合度矩阵,从所述参考用户集合中筛选出相似用户集合。
[0011]进一步地,所述根据得到的所有历史搜索信息集合,确定每个目标用户在每个目标类别下的语义契合度,包括:根据所有历史搜索信息集合包括的搜索词对应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于键入搜索词推荐用户搜索词的方法,其特征在于,包括以下步骤:获取待推荐用户对应的目标键入信息,并确定所述目标键入信息对应的目标类别;根据所述目标键入信息对应的目标类别,获取候选搜索词集合中的每个候选搜索词对应的目标预测评分,其中,所述候选搜索词集合包括:所述待推荐用户对应的相似用户集合中的各个相似用户和所述待推荐用户在所述目标键入信息对应的目标类别下的搜索词;根据候选搜索词对应的目标预测评分,从所述候选搜索词集合中筛选出待推荐搜索词集合;将所述待推荐搜索词集合推荐给所述待推荐用户;确定所述相似用户集合包括以下步骤:获取待推荐用户对应的历史搜索信息集合和参考用户集合中每个参考用户对应的历史搜索信息集合;对得到的所有历史搜索信息集合包括的搜索词进行分类,得到目标类别集合;确定得到的所有历史搜索信息集合包括的每两个搜索词之间的目标关联度;根据得到的所有历史搜索信息集合、所述目标类别集合和搜索词之间的目标关联度,确定每个目标用户在每个目标类别下的目标评估指标,得到目标评估矩阵,其中,目标用户是待推荐用户或参考用户;根据得到的所有历史搜索信息集合和所述目标评估矩阵,从所述参考用户集合中筛选出相似用户集合。2.根据权利要求1所述的一种基于键入搜索词推荐用户搜索词的方法,其特征在于,所述对得到的所有历史搜索信息集合包括的搜索词进行分类,得到目标类别集合,包括:将得到的所有历史搜索信息集合包括的每个搜索词输入到预先训练完成的目标分类网络,得到所述搜索词属于预设类别集合中的每个预设类别的概率,作为所述搜索词在所述预设类别下的类别概率,得到所述搜索词对应的类别概率集合;对于得到的所有历史搜索信息集合包括的每个搜索词,从所述搜索词对应的类别概率集合中筛选出最大的类别概率,作为所述搜索词对应的目标概率,将所述搜索词对应的目标概率对应的预设类别,确定为所述搜索词对应的目标类别;将得到的所有历史搜索信息集合包括的所有搜索词对应的目标类别,组合为目标类别集合。3.根据权利要求2所述的一种基于键入搜索词推荐用户搜索词的方法,其特征在于,所述确定得到的所有历史搜索信息集合包括的每两个搜索词之间的目标关联度,包括:根据这两个搜索词对应的目标概率,将这两个搜索词分别确定为第一搜索词和第二搜索词;根据第一数量、第二数量和第三数量,确定第一搜索词和第二搜索词之间的第一差异,其中,第一数量是所有历史搜索信息集合中包括第一搜索词不包括第二搜索词的历史搜索信息的数量,第二数量是所有历史搜索信息集合中包括第二搜索词不包括第一搜索词的历史搜索信息的数量,第三数量是所有历史搜索信息集合中既包括第一搜索词又包括第二搜索词的历史搜索信息的数量,第一数量和第二数量均与第一差异呈正相关,第三数量与第一差异呈负相关;将第二概率与第一搜索词对应的目标概率的差值的绝对值,确定为第一搜索词和第二
搜索词之间的第二差异,其中,第二概率是第二搜索词在第一搜索词对应的目标类别下的类别概率;根据第一搜索词和第二搜索词之间的第一差异与第二差异,确定第一搜索词和第二搜索词之间的第三差异,其中,第一差异和第二差异均与第三差异呈正相关;对第一搜索词和第二搜索词进行编码,得到第一搜索词对应的第一编码数据和第二搜索词对应的第二编码数据;确定第一编码数据和第二编码数据之间的编辑距离,作为第一搜索词和第二搜索词之间的第四差异;根据第一搜索词和第二搜索词之间的第四差异与第三差异,确定第一搜索词和第二搜索词之间的目标关联度,其中,第四差异和第三差异均与目标关联度呈负相关。4.根据权利要求1所述的一种基于键入搜索词推荐用户搜索词的方法,其特征在于,所述根据得到的所有历史搜索信息集合、所述目标类别集合和搜索词之间的目标关联度,确定每个目标用户在每个目标类别下的目标评估指标,包括:将第四数量在第五数量中的占比,确定为所述目标用户在所述目标类别下的初始评估指标,其中,第四数量是所有历史搜索信息集合包括的所述目标用户在所述目标类别中键入搜索词的数量,第五数量是所有历史搜索信息集合包括的所述目标用户键入搜索词的数量;根据所有历史搜索信息集合包括的所述目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度,确定所述目标用户在所述目标类别下的第一关联度,其中,所述目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度均与第一关联度呈正相关;根据所有历史搜索信息集合包括的所有目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度,确定所述目标类别对应的第二关联度,其中,所有目标用户键入的各个搜索词和所述目标类别中的各个搜索词之间的目标关联度均与第二关联度呈正相关;将所述目标用户在所述目标类别下的第一关联度,在所述目标类别对应的第二关联度中的占比,确定为所述目标用户在所述目标类别下的第三关联度;根据所述目标用户在所述目标类别集合中的目标类别下的初始评估指标,确定所述目标用户对应的参考评估指标,其中,所述目标用户在所述目标类别集合中的目标类别下的初始评估指标与参考评估指标呈正相关;根据所述目标用户对应的参考评估指标和所述目标用户在所述目标类别下的第三关联度,确定所述目标用户在所述目标类别下的目标评估指标,其中,参考评估指标和第三关联度均与目标评估指标呈正相关。5.根据权利要求2所述的一种基于键入搜索词推荐用户搜索词的方法,其特征在于,所述根据得到的所有历史搜索信息集合和所述目标评估矩阵,从所述参考用户集合中筛选出相似用户集合,包括:根据得到的所有历史搜索信息集合,确定每个目标用户在每个目标类别下的语义契合度,得到语义契合度矩阵;根据所述目标评估矩阵和所述语义契合度矩阵,从所述参考用户集合中筛选出相似用
户集合...

【专利技术属性】
技术研发人员:李志洁王鹏陈拉拉
申请(专利权)人:量子数科科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1