歌曲搜索方法、装置、存储介质和计算设备制造方法及图纸

技术编号:39163924 阅读:15 留言:0更新日期:2023-10-23 15:03
本公开的实施方式提供了一种歌曲搜索方法、装置、存储介质和计算设备。包括:响应于歌曲搜索请求,获取所述歌曲搜索请求包含的搜索文本;确定所述搜索文本中具有情感语义的搜索关键词,并计算所述搜索关键词的第一词向量;将所述第一词向量与歌曲库中的各个第二词向量进行匹配,确定与所述第一词向量匹配的目标第二词向量;其中,所述第二词向量基于所述歌曲库中歌曲的评论文本中具有情感语义的评论关键词所计算的词向量;将所述目标第二词向量对应的目标歌曲确定为搜索到的歌曲。对应的目标歌曲确定为搜索到的歌曲。对应的目标歌曲确定为搜索到的歌曲。

【技术实现步骤摘要】
歌曲搜索方法、装置、存储介质和计算设备


[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及一种歌曲搜索方法、装置、存储介质和计算设备。

技术介绍

[0002]本部分旨在为说明书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]在相关技术中,歌曲搜索一般是根据搜索方提供的搜索文本,从字面粒度上进行歌曲匹配。
[0004]通过这种方式搜索到的歌曲主要体现为:歌曲名称与搜索文本在字面上一致。然而,某些歌曲的歌曲名称虽然与搜索文本不一致、但其歌曲主题或者表达的情感恰好符合搜索文本的搜索需求,这样的歌曲无法被搜索到,导致相关技术提供的歌曲搜索存在搜搜结果不全面的问题。

技术实现思路

[0005]在本公开实施方式的第一方面中,提供了一种歌曲搜索方法。该方法包括:
[0006]响应于歌曲搜索请求,获取所述歌曲搜索请求包含的搜索文本;
[0007]确定所述搜索文本中具有情感语义的搜索关键词,并计算所述搜索关键词的第一词向量;
[0008]将所述第一词向量与歌曲库中的各个第二词向量进行匹配,确定与所述第一词向量匹配的目标第二词向量;其中,所述第二词向量基于所述歌曲库中歌曲的评论文本中具有情感语义的评论关键词所计算的词向量;
[0009]将所述目标第二词向量对应的目标歌曲确定为搜索到的歌曲。
[0010]可选的,所述第一词向量和第二词向量通过相同的词向量模型计算得到,并且所述词向量模型通过以下方式训练:
[0011]获取不同用户的历史搜索行为构建的若干消费序列,和不同歌曲的历史评论文本构建的若干评论序列;其中,每个消费序列由对应的历史搜索行为中的若干搜索关键词构成,每个评论序列由对应的历史评论文本中的若干评论关键词构成;
[0012]将所述消费序列和所述评论序列合并为样本序列后输入到词向量模型进行训练,以使所述词向量模型学习所述样本序列中各个关键词的上下文中其他词汇的出现概率,并基于所述关键词的上下文中其他词汇的出现概率生成所述关键词的词向量。
[0013]可选的,在所述学习所述样本序列中各个关键词的上下文中其他词汇的出现概率之前,还包括:
[0014]针对每个样本序列的每个关键词,确定负例词和正例词;其中,正例词包括该关键词的上下文中出现的关键词,负例词包括该关键词的上下文中没有出现的关键词;
[0015]将所述正例词和负例词作为训练标签随样本序列输入到词向量模型。
[0016]可选的,所述确定负例词,包括:
[0017]随机获取若干待校验的负例词;
[0018]从第三方的词向量库中获取每个待校验的负例词的词向量,以及该关键词的词向量;
[0019]计算待校验的负例词的词向量与该关键词的词向量之间的语义相关程度;
[0020]筛选语义相关程度低于预设程度的待校验的负例词作为该关键词的负例词。
[0021]可选的,所述评论序列中还插入有对应歌曲的歌曲唯一标识。
[0022]可选的,所述将所述第一词向量与歌曲库中的各个第二词向量进行匹配,包括:
[0023]计算所述第一词向量与歌曲库中的各个第二词向量的余弦相似度;
[0024]将余弦相似度大于阈值的第二词向量确定为与所述第一词向量匹配的目标第二词向量。
[0025]可选的,所述歌曲库中歌曲的评论文本包括优质评论文本。
[0026]可选的,还包括:
[0027]基于自然语言处理技术,生成与所述目标歌曲对应的可解释性的引导文案;其中,所述引导文案包括与所述目标歌曲的评论关键词相关的引导语。
[0028]可选的,所述生成与所述目标歌曲对应的可解释性的引导文案,包括:
[0029]响应于所述目标歌曲的评论关键词的数量超过第一阈值,计算每个评论关键词与所述搜索文本之间的余弦相似度;
[0030]基于余弦相似度确定最佳关键词,生成与所述最佳关键词对应的可解释性的引导文案。
[0031]可选的,还包括:
[0032]响应于所述引导文案的数量超过第二阈值,计算每个引导文案与所述搜索文本之间的余弦相似度;
[0033]基于余弦相似度确定最佳引导文案,将所述最佳引导文案确定为最终用于展示的引导文案。
[0034]可选的,所述自然语言处理技术包括预训练生成式转换器模型;
[0035]所述基于自然语言处理技术,生成与所述目标歌曲对应的可解释性的引导文案,包括:
[0036]将所述目标歌曲的评论关键词与预设模版组装为任务指令;
[0037]将所述任务指令发送给所述预训练生成式转换器模型,获取所述预训练生成式转换器模型生成与所述目标歌曲对应的可解释性的引导文案。
[0038]可选的,所述生成与所述目标歌曲对应的可解释性的引导文案,包括:
[0039]获取所述歌曲搜索请求的发起方的个性化信息;其中,所述个性化信息基于所述发起方的历史行为数据确定;
[0040]生成与所述目标歌曲对应的可解释性的、且符合所述个性化信息的引导文案。
[0041]可选的,所述词向量模型包括基于神经网络的跳字模型。
[0042]在本公开实施方式的第二方面中,提供了一种歌曲搜索装置,所述装置包括:
[0043]获取单元,响应于歌曲搜索请求,获取所述歌曲搜索请求包含的搜索文本;
[0044]计算单元,确定所述搜索文本中具有情感语义的搜索关键词,并计算所述搜索关
键词的第一词向量;
[0045]匹配单元,将所述第一词向量与歌曲库中的各个第二词向量进行匹配,确定与所述第一词向量匹配的目标第二词向量;其中,所述第二词向量基于所述歌曲库中歌曲的评论文本中具有情感语义的评论关键词所计算的词向量;
[0046]确定单元,将所述目标第二词向量对应的目标歌曲确定为搜索到的歌曲。
[0047]可选的,所述第一词向量和第二词向量通过相同的词向量模型计算得到,并且所述词向量模型通过训练单元训练得到;
[0048]所述训练单元,进一步包括:
[0049]序列获取子单元,获取不同用户的历史搜索行为构建的若干消费序列,和不同歌曲的历史评论文本构建的若干评论序列;其中,每个消费序列由对应的历史搜索行为中的若干搜索关键词构成,每个评论序列由对应的历史评论文本中的若干评论关键词构成;
[0050]模型训练子单元,将所述消费序列和所述评论序列合并为样本序列后输入到词向量模型进行训练,以使所述词向量模型学习所述样本序列中各个关键词的上下文中其他词汇的出现概率,并基于所述关键词的上下文中其他词汇的出现概率生成所述关键词的词向量。
[0051]可选的,所述模型训练子单元在所述学习所述样本序列中各个关键词的上下文中其他词汇的出现概率之前,还包括:
[0052]负采样子单元,针对每个样本序列的每个关键词,确定负例词和正例词;其中,正例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种歌曲搜索方法,包括:响应于歌曲搜索请求,获取所述歌曲搜索请求包含的搜索文本;确定所述搜索文本中具有情感语义的搜索关键词,并计算所述搜索关键词的第一词向量;将所述第一词向量与歌曲库中的各个第二词向量进行匹配,确定与所述第一词向量匹配的目标第二词向量;其中,所述第二词向量基于所述歌曲库中歌曲的评论文本中具有情感语义的评论关键词所计算的词向量;将所述目标第二词向量对应的目标歌曲确定为搜索到的歌曲。2.根据权利要求1所述的方法,所述第一词向量和第二词向量通过相同的词向量模型计算得到,并且所述词向量模型通过以下方式训练:获取不同用户的历史搜索行为构建的若干消费序列,和不同歌曲的历史评论文本构建的若干评论序列;其中,每个消费序列由对应的历史搜索行为中的若干搜索关键词构成,每个评论序列由对应的历史评论文本中的若干评论关键词构成;将所述消费序列和所述评论序列合并为样本序列后输入到词向量模型进行训练,以使所述词向量模型学习所述样本序列中各个关键词的上下文中其他词汇的出现概率,并基于所述关键词的上下文中其他词汇的出现概率生成所述关键词的词向量。3.根据权利要求2所述的方法,在所述学习所述样本序列中各个关键词的上下文中其他词汇的出现概率之前,还包括:针对每个样本序列的每个关键词,确定负例词和正例词;其中,正例词包括该关键词的上下文中出现的关键词,负例词包括该关键词的上下文中没有出现的关键词;将所述正例词和负例词作为训练标签随样本序列输入到词向量模型。4.根据权利要求3所述的方法,所述确定负例词,包括:随机获取若干待校验的负例词;从第三方的词向量库中获取每个待校验的负例词的词向量...

【专利技术属性】
技术研发人员:刘卉芸王寒蕊宋羽珩王炜解忠乾罗川江侯梦晗
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1