搜索词生成方法、模型训练方法、介质、装置和设备制造方法及图纸

技术编号:35105101 阅读:22 留言:0更新日期:2022-10-01 17:14
本公开的实施方式提供了一种搜索词生成方法、模型训练方法、介质、装置和设备。该方法包括:根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;根据所述兴趣资源确认候选搜索词;将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。以上方法,通过预测模型预测候选搜索词会被用户点击的概率值,筛选概率值高的候选搜索词推荐给用户,从而推荐符合用户兴趣的搜索词,提升用户的使用体验。提升用户的使用体验。提升用户的使用体验。

【技术实现步骤摘要】
搜索词生成方法、模型训练方法、介质、装置和设备


[0001]本公开的实施方式涉及计算机视觉领域,更具体地,本公开的实施方式涉及一种搜索词生成方法、模型训练方法、介质、装置和设备。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]当前,为了方便用户查找需求的音乐资源,音乐网站或者音乐软件中会设置搜索框,用户可以在搜索框输入关键词,搜索与关键词相关的音乐资源。
[0004]为了进一步提高用户的使用体验,搜索框中会有浅色底纹样式搜索词向用户推荐用户可能感兴趣的音乐资源,用户可以直接选择“搜索”选项来搜索与搜索词相关的音乐资源。因此,如何提高搜索词与用户兴趣的匹配度,是提高用户对搜索词的点击率的关键,对提高用户的使用体验有重大意义。

技术实现思路

[0005]本公开提供一种搜索词生成方法、模型训练方法、介质、装置和设备,用于推荐符合用户兴趣的搜索词。
[0006]在本公开实施方式的第一方面中,提供了一种搜索词生成方法,包括:根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;根据所述兴趣资源确认候选搜索词;将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。
[0007]在本公开的一个实施例中,所述将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值,包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述候选搜索词特征分别进行拼接,得到多个第一合并特征;将各第一合并特征输入预测模型,得到各候选搜索词的预测值。
[0008]在本公开的另一个实施例中,所述方法还包括:将各第一合并特征、用户属性特征以及当前环境特征进行拼接,得到多个第二合并特征;将各第二合并特征输入预测模型,得到各候选搜索词的预测值。
[0009]在本公开的又一个实施例中,所述根据所述兴趣资源确认候选搜索词,包括:提取所述兴趣资源的标题信息;将所述标题信息作为候选搜索词;或者,将所述标题信息对应的用户历史搜索词作为候选搜索词;或者,将所述标题信息输入策略模板,以将所述标题信息
与各类型下资源进行匹配,获得所述策略模板输出的所述兴趣资源对应的候选搜索词。
[0010]在本公开的又一个实施例中,所述历史行为包括历史操作记录以及实时操作记录;所述根据用户历史行为召回兴趣资源,包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分;根据所述第一召回评分,确定第一兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分;根据所述第二召回评分,确定第二兴趣资源;将所述第一兴趣资源和所述第二兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三兴趣资源;将第一兴趣资源、第二兴趣资源以及第三兴趣资源作为兴趣资源。
[0011]在本公开的又一个实施例中,所述根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分,包括:针对历史操作记录,根据预设的资源类型的权重和操作类型的权重以及时间衰减系数,加权计算得到历史操作记录下的每个历史资源的第一召回评分。
[0012]在本公开的又一个实施例中,所述根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分,包括:针对实时操作记录,根据预设的资源类型的权重和操作类型的权重,加权计算得到实时操作记录下的每个历史资源的第二召回评分。
[0013]在本公开的一个实施例中,所述对所述候选搜索词进行筛选后推荐展示包括:根据所述预测值对所述候选搜索词进行排序筛选;将筛选后的候选搜索词按照预设停留时长轮播展示。
[0014]在本公开实施方式的第二方面中,提供一种预测模型训练方法,包括:根据用户历史行为召回样本兴趣资源;所述历史行为针对多种历史资源;根据所述样本兴趣资源确认样本搜索词;获取样本搜索词特征以及样本搜索词的操作标签;所述操作标签包括样本搜索词被点击或样本搜索词未被点击;将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型。
[0015]在本公开的一个实施例中,所述将用户历史行为对应的历史资源的资源特征以及样本搜索词特征作为输入,将所述样本搜索词的操作标签作为标签,训练得到预测模型,包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述样本搜索词特征进行拼接,得到多个第三合并特征;将各第三合并特征作为输入,将第三合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
[0016]在本公开的另一个实施例中,所述方法还包括:将各第三合并特征、用户属性特征以及历史环境特征进行拼接,得到第四合并特征;将各第四合并特征作为输入,将第四合并特征对应的样本搜索词的操作标签作为标签,训练得到预测模型。
[0017]在本公开的又一个实施例中,根据所述样本兴趣资源确认样本搜索词,包括:提取所述样本兴趣资源的标题信息;将所述样本兴趣资源的标题信息作为样本搜索词;或者,将所述样本兴趣资源的标题信息对应的用户历史搜索词作为样本搜索词;或者,将所述样本兴趣资源的标题信息输入策略模板,以将所述样本兴趣资源的标题信息与各类型下资源进
行匹配,获得所述策略模板输出的所述样本兴趣资源对应的样本搜索词。
[0018]在本公开的又一个实施例中,所述历史行为包括历史操作记录以及实时操作记录;所述根据用户历史行为召回样本兴趣资源,包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第三召回评分;根据所述第三召回评分,确定第一样本兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第四召回评分;根据所述第四召回评分,确定第二样本兴趣资源;将所述第一样本兴趣资源和所述第二样本兴趣资源按照资源类型进行分类;根据预先配置的各类型下资源间相似度,构建相似度矩阵;计算各类型下资源的召回评分与所述相似度矩阵的乘积结果,将各类型下资源的乘积结果排序靠前的预设数量个资源作为第三样本兴趣资源;将第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索词生成方法,包括:根据用户历史行为召回兴趣资源;所述历史行为针对多种历史资源;根据所述兴趣资源确认候选搜索词;将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值;其中,所述预测值表征预测模型预测的候选搜索词被用户点击的概率值;根据所述各个所述候选搜索词对应的预测值,对所述候选搜索词进行筛选后推荐展示。2.根据权利要求1所述的方法,所述将用户历史行为对应的历史资源的资源特征和所述候选搜索词特征输入预测模型,输出各个所述候选搜索词对应的预测值,包括:将用户历史行为对应的历史资源按照资源类型进行分类,得到各个类型下的基础特征,将各类历史资源下的基础特征分别进行拼接,得到各类历史资源的拼接特征;基于注意力机制,输入所述拼接特征,输出每类历史资源的序列特征;将所述序列特征进行拼接,得到用户历史行为特征;将所述用户历史行为特征以及所述候选搜索词特征分别进行拼接,得到多个第一合并特征;将各第一合并特征输入预测模型,得到各候选搜索词的预测值。3.根据权利要求2所述的方法,所述方法还包括:将各第一合并特征、用户属性特征以及当前环境特征进行拼接,得到多个第二合并特征;将各第二合并特征输入预测模型,得到各候选搜索词的预测值。4.根据权利要求1所述的方法,所述根据所述兴趣资源确认候选搜索词,包括:提取所述兴趣资源的标题信息;将所述标题信息作为候选搜索词;或者,将所述标题信息对应的用户历史搜索词作为候选搜索词;或者,将所述标题信息输入策略模板,以将所述标题信息与各类型下资源进行匹配,获得所述策略模板输出的所述兴趣资源对应的候选搜索词。5.根据权利要求1所述的方法,所述历史行为包括历史操作记录以及实时操作记录;所述根据用户历史行为召回兴趣资源,包括:根据用户历史操作记录,计算历史操作记录对应的历史资源的第一召回评分;根据所述第一召回评分,确定第一兴趣资源;根据用户实时操作记录,计算实时操作记录对应的历史资源的第二召回评分;根据所述第二召回评分,确定第二兴趣资源;将所述第一兴趣资源和所述第二兴趣资源按照资源类型进行分类;根据预先配置的各类型...

【专利技术属性】
技术研发人员:刘卉芸解忠乾罗川江
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1