歌曲推荐方法、装置、终端设备以及存储介质制造方法及图纸

技术编号:23890911 阅读:15 留言:0更新日期:2020-04-22 06:25
本申请实施例公开了一种歌曲推荐方法、装置、终端设备以及存储介质,该方法包括:获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,获取搜索对象内容文本对应的内容文本特征向量,其中内容文本特征向量包括组成搜索对象内容文本的多个词对应的多个词向量;获取歌曲库中包括的每首歌曲对应的歌曲文本特征向量,其中歌曲文本特征向量包括组成歌曲信息的多个词对应的多个词向量;基于内容文本特征向量,以及歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,根据文本相似度从歌曲库中确定出至少一首歌曲推荐给目标用户。采用本申请实施例,可提高为新用户推荐歌曲的准确性。

Song recommendation method, device, terminal equipment and storage medium

【技术实现步骤摘要】
歌曲推荐方法、装置、终端设备以及存储介质
本申请涉及计算机
,尤其涉及一种歌曲推荐方法、装置、终端设备以及存储介质。
技术介绍
冷启动在推荐系统中主要是指对于没有交互行为的新用户或新物品做相关推荐,其常用于产品的拉新、增加日活、增加留存,在推荐系统初期具有重大意义。但因为场景、用户、环境、产品设计、数据源等等因素的不同,冷启动技术也千差万别。其中,在搜索场景下,如何为新用户推荐歌曲,成为当前亟待解决的问题。
技术实现思路
本申请实施例提供一种歌曲推荐方法、装置、终端设备以及存储介质,可提高为新用户推荐歌曲的准确性,适用性高。第一方面,本申请实施例提供了一种歌曲推荐方法,该方法包括:获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,获取所述搜索对象内容文本对应的内容文本特征向量,其中所述内容文本特征向量包括组成所述搜索对象内容文本的多个词对应的多个词向量;获取歌曲库中包括的每首歌曲对应的歌曲文本特征向量,其中歌曲文本特征向量包括组成歌曲信息的多个词对应的多个词向量;基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,根据所述文本相似度从所述歌曲库中确定出至少一首歌曲推荐给所述目标用户。结合第一方面,在一种可能的实施方式中,所述获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,包括:获取所述目标用户所使用的搜索引擎对应的日志文件,其中所述日志文件中包括所述目标用户的搜索记录,所述搜索记录包括所述目标用户用于检索的检索字符串以及检索时间;获取预设时间段内目标用户的搜索记录中出现次数最多的检索字符串,并基于所述检索字符串确定出多个检索结果内容文本,获取各检索结果内容文本对应的网页属性特征向量;获取所述检索字符串对应的检索字符文本特征向量,以及获取所述目标用户的用户基本属性特征向量,基于所述检索字符文本特征向量、所述用户基本属性特征向量以及每个检索结果内容文本对应的网页属性特征向量生成每个检索结果内容文本对应的联合特征向量;获取文本排序模型,将各联合特征向量输入所述文本排序模型,以得到所述文本排序模型输出的各检索结果内容文本的排序结果,其中所述文本排序模型根据多个样本文本对应的多个样本联合特征向量以及所述多个样本文本的排序结果训练得到;将所述排序结果中的前n个检索结果内容文本确定为搜索对象内容文本。结合第一方面,在一种可能的实施方式中,所述搜索记录包括所述目标用户的浏览记录和浏览时间;所述获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,包括:获取预设时间段内的浏览记录中包括的统一资源定位符URL,访问所述URL以获取对应的内容文本作为搜索对象内容文本。结合第一方面,在一种可能的实施方式中,所述方法还包括:将所述搜索对象内容文本进行分词处理以得到组成所述搜索对象内容文本的多个词;获取预设的词向量查询表,所述词向量查询表中包括多个词对应的多个词向量,其中一个词对应一个词向量;从所述词向量查询表中确定出组成所述搜索对象内容文本的多个词中各个词对应的词向量。结合第一方面,在一种可能的实施方式中,所述基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,包括:获取文本相似度分类模型,将所述内容文本特征向量和任一首歌曲对应的歌曲文本特征向量输入所述文本相似度分类模型,其中所述文本相似度分类模型根据样本搜索对象内容文本对应的内容文本特征向量、样本歌曲对应的歌曲文本特征向量以及文本相似度分类结果标识训练得到;获取所述文本相似度分类模型所输出的文本相似度分类结果标识,根据所述文本相似度分类结果标识确定所述任一首歌曲对应的歌曲文本信息与所述搜索对象内容文本间的文本相似度。结合第一方面,在一种可能的实施方式中,所述基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,包括:计算所述内容文本特征向量分别与所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量间的欧氏距离;将所述欧式距离转换为相似度值,以作为所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度。结合第一方面,在一种可能的实施方式中,所述根据所述文本相似度从所述曲库中确定出至少一首歌曲推荐给用户,包括:获取预设相似度阈值,从所述歌曲库中,获取文本相似度不小于所述预设相似度阈值的歌曲推荐给所述目标用户;或者将所述文本相似度进行降序排列,获取降序排列后的前k个文本相似度对应的k首歌曲以推荐给所述目标用户,其中k为大于0的整数。第二方面,本申请实施例提供了一种歌曲推荐装置,该装置包括:第一特征向量获取模块,用于获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,获取所述搜索对象内容文本对应的内容文本特征向量,其中所述内容文本特征向量包括组成所述搜索对象内容文本的多个词对应的多个词向量;第二特征向量获取模块,用于获取歌曲库中包括的每首歌曲对应的歌曲文本特征向量,其中歌曲文本特征向量包括组成歌曲信息的多个词对应的多个词向量;歌曲推荐模块,用于基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,根据所述文本相似度从所述歌曲库中确定出至少一首歌曲推荐给所述目标用户。结合第二方面,在一种可能的实施方式中,所述第一特征向量获取模块包括第一搜索对象内容文本获取单元、内容文本特征向量获取单元,所述第一搜索对象内容文本获取单元包括:日志文件获取子单元,用于获取所述目标用户所使用的搜索引擎对应的日志文件,其中所述日志文件中包括所述目标用户的搜索记录,所述搜索记录包括所述目标用户用于检索的检索字符串以及检索时间;检索结果内容文本获取子单元,用于获取预设时间段内目标用户的搜索记录中出现次数最多的检索字符串,并基于所述检索字符串确定出多个检索结果内容文本,获取各检索结果内容文本对应的网页属性特征向量;联合特征向量获取子单元,用于获取所述检索字符串对应的检索字符文本特征向量,以及获取所述目标用户的用户基本属性特征向量,基于所述检索字符文本特征向量、所述用户基本属性特征向量以及每个检索结果内容文本对应的网页属性特征向量生成每个检索结果内容文本对应的联合特征向量;检索结果内容文本排序子单元,用于获取文本排序模型,将各联合特征向量输入所述文本排序模型,以得到所述文本排序模型输出的各检索结果内容文本的排序结果,其中所述文本排序模型根据多个样本文本对应的多个样本联合特征向量以及所述多个样本文本的排序结果训练得到;排序结果处理子单元,用于将所述排序结果中的前n个检索结果内容文本确定为搜索对象内容文本。结合本文档来自技高网...

【技术保护点】
1.一种歌曲推荐方法,其特征在于,所述方法包括:/n获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,获取所述搜索对象内容文本对应的内容文本特征向量,其中所述内容文本特征向量包括组成所述搜索对象内容文本的多个词对应的多个词向量;/n获取歌曲库中包括的每首歌曲对应的歌曲文本特征向量,其中歌曲文本特征向量包括组成歌曲信息的多个词对应的多个词向量;/n基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,根据所述文本相似度从所述歌曲库中确定出至少一首歌曲推荐给所述目标用户。/n

【技术特征摘要】
1.一种歌曲推荐方法,其特征在于,所述方法包括:
获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,获取所述搜索对象内容文本对应的内容文本特征向量,其中所述内容文本特征向量包括组成所述搜索对象内容文本的多个词对应的多个词向量;
获取歌曲库中包括的每首歌曲对应的歌曲文本特征向量,其中歌曲文本特征向量包括组成歌曲信息的多个词对应的多个词向量;
基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所述搜索对象内容文本与每首歌曲的歌曲信息的文本相似度,根据所述文本相似度从所述歌曲库中确定出至少一首歌曲推荐给所述目标用户。


2.根据权利要求1所述方法,其特征在于,所述获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,包括:
获取所述目标用户所使用的搜索引擎对应的日志文件,其中所述日志文件中包括所述目标用户的搜索记录,所述搜索记录包括所述目标用户用于检索的检索字符串以及检索时间;
获取预设时间段内目标用户的搜索记录中出现次数最多的检索字符串,并基于所述检索字符串确定出多个检索结果内容文本,获取各检索结果内容文本对应的网页属性特征向量;
获取所述检索字符串对应的检索字符文本特征向量,以及获取所述目标用户的用户基本属性特征向量,基于所述检索字符文本特征向量、所述用户基本属性特征向量以及每个检索结果内容文本对应的网页属性特征向量生成每个检索结果内容文本对应的联合特征向量;
获取文本排序模型,将各联合特征向量输入所述文本排序模型,以得到所述文本排序模型输出的各检索结果内容文本的排序结果,其中所述文本排序模型根据多个样本文本对应的多个样本联合特征向量以及所述多个样本文本的排序结果训练得到;
将所述排序结果中的前n个检索结果内容文本确定为搜索对象内容文本。


3.根据权利要求1所述方法,其特征在于,所述搜索记录包括所述目标用户的浏览记录和浏览时间;所述获取预设时间段内目标用户的搜索记录对应的搜索对象内容文本,包括:
获取预设时间段内的浏览记录中包括的统一资源定位符URL,访问所述URL以获取对应的内容文本作为搜索对象内容文本。


4.根据权利要求1-3任一项所述方法,其特征在于,所述方法还包括:
将所述搜索对象内容文本进行分词处理以得到组成所述搜索对象内容文本的多个词;
获取预设的词向量查询表,所述词向量查询表中包括多个词对应的多个词向量,其中一个词对应一个词向量;
从所述词向量查询表中确定出组成所述搜索对象内容文本的多个词中各个词对应的词向量。


5.根据权利要求1-3任一项所述方法,其特征在于,所述基于所述内容文本特征向量,以及所述歌曲库中包括的每首歌曲对应的歌曲文本特征向量确定所...

【专利技术属性】
技术研发人员:缪畅宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1