音乐搜索排序方法、装置、设备和存储介质制造方法及图纸

技术编号：24996210 阅读：32 留言：0更新日期：2020-07-24 17:58

本申请公开了一种音乐搜索排序方法、装置、设备和存储介质，属于搜索技术领域。该方法包括：获取多个搜索返回作品，及每个搜索返回作品的发布时间；基于每个搜索返回作品的发布时间，确定搜索返回作品为第一类作品或第二类作品，第二类作品的发布时间早于第一类作品的发布时间；分别获取每个搜索返回作品的文本匹配度和数值特征；确定第一类作品的时新性加权特征，时新性加权特征是采用发布时间计算出的时新性加权值；利用每个搜索返回作品的文本匹配度和数值特征、以及第二类作品的播放时长特征和第一类作品的时新性加权特征作为排序模型的输入，对多个搜索返回作品进行排序；输出排序后的搜索返回作品。

全部详细技术资料下载

【技术实现步骤摘要】
音乐搜索排序方法、装置、设备和存储介质
本申请涉及搜索
，尤其涉及一种音乐搜索排序方法、装置、设备和存储介质。
技术介绍
随着移动终端的普及，移动终端已经取代原来的动态图像专家组音频层3(MovingPictureExpertsGroupAudioLayer3，MP3)播放器等设备，成为人们日常听音乐的首选。用户在使用移动终端中的音乐软件听音乐时，除了可以听软件推荐、或者已经收藏的歌曲外，还可以通过音乐软件的搜索功能搜索相应的歌曲，然后播放欣赏。在实现本专利技术过程中，专利技术人发现现有技术存在如下问题，相比于网页检索，音乐领域中的检索排序有明显的特殊性，在音乐领域，每天更新的新作品数量巨大，在检索结果中需要平衡新作品与经典作品曝光量。利用向量空间模型等的经典排序模型，或是基于机器学习的排序模型，排序结果均存在新作品曝光量不够的问题。
技术实现思路
本申请实施例提供了一种音乐搜索排序方法、装置、设备和存储介质，保证排序方案对新作品更加公平，提高新作品的曝光量。所述技术方案如下：一方面，提供了一种音乐搜索排序方法，所述方法包括：获取多个搜索返回作品，及每个所述搜索返回作品的发布时间；基于每个所述搜索返回作品的发布时间，确定所述搜索返回作品为第一类作品或第二类作品，所述第二类作品的发布时间早于所述第一类作品的发布时间；分别获取每个所述搜索返回作品的文本匹配度和数值特征，所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度，所述数值特征为...

【技术保护点】
1.一种音乐搜索排序方法，其特征在于，所述方法包括：/n获取多个搜索返回作品，及每个所述搜索返回作品的发布时间；/n基于每个所述搜索返回作品的发布时间，确定所述搜索返回作品为第一类作品或第二类作品，所述第二类作品的发布时间早于所述第一类作品的发布时间；/n分别获取每个所述搜索返回作品的文本匹配度和数值特征，所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度，所述数值特征为所述搜索返回作品的特征中除播放时长特征外的数值项；/n确定所述第二类作品的播放时长特征，所述播放时长特征用于指示最近一段时间内的播放情况；/n确定所述第一类作品的时新性加权特征，所述时新性加权特征是采用发布时间计算出的时新性加权值；/n利用每个所述搜索返回作品的文本匹配度和数值特征、以及所述第二类作品的播放时长特征和所述第一类作品的时新性加权特征作为排序模型的输入，对所述多个搜索返回作品进行排序；/n输出排序后的所述搜索返回作品。/n

【技术特征摘要】
1.一种音乐搜索排序方法，其特征在于，所述方法包括：
获取多个搜索返回作品，及每个所述搜索返回作品的发布时间；
基于每个所述搜索返回作品的发布时间，确定所述搜索返回作品为第一类作品或第二类作品，所述第二类作品的发布时间早于所述第一类作品的发布时间；
分别获取每个所述搜索返回作品的文本匹配度和数值特征，所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度，所述数值特征为所述搜索返回作品的特征中除播放时长特征外的数值项；
确定所述第二类作品的播放时长特征，所述播放时长特征用于指示最近一段时间内的播放情况；
确定所述第一类作品的时新性加权特征，所述时新性加权特征是采用发布时间计算出的时新性加权值；
利用每个所述搜索返回作品的文本匹配度和数值特征、以及所述第二类作品的播放时长特征和所述第一类作品的时新性加权特征作为排序模型的输入，对所述多个搜索返回作品进行排序；
输出排序后的所述搜索返回作品。

2.根据权利要求1所述的方法，其特征在于，确定所述第一类作品的时新性加权特征，包括：
基于所述第一类作品的发布时间确定对应的发布时间分数；
基于所述第一类作品的类型确定对应的类型分数；
基于所述发布时间分数和所述类型分数确定所述时新性加权特征。

3.根据权利要求2所述的方法，其特征在于，基于所述发布时间分数和所述类型分数确定所述时新性加权特征，包括：
采用计算第二类作品播放时长特征的方式计算所有第一类作品的播放时长特征；
确定所述所有第一类作品的播放时长特征的目标分位数；
采用所述目标分位数、所述发布时间分数和所述类型分数的乘积作为所述时新性加权特征。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：
当计算出的所述第一类作品的播放时长特征，大于所述时新性加权特征，采用所述播放时长特征替代所述时新性加权特征。

5.根据权利要求3所述的方法，其特征在于，所述方法还包括：
基于搜索词确定搜索意图，所述搜索意图用于指示搜索类型；
基于所述搜索意图和所述搜索返回作品中与所述搜索意图对应的搜索类型中第一类作品的比例，确定加权值；
采用加权值乘以所述时新性加权特征再加所述时新性加权特征，得到最终的时新性加权特征。

6.根据权利要求1所述的方法，其特征在于，确定所述第二类作品的播放时长特征，包括：
基于所述第二类作品的每日播放数，确定平滑指数；
基于所述平滑指数对所述第二类作品的平均播放时长进行平滑处理；
基于平滑处理后的所述平均播放时长、所述每日播放数和所述第二类作品的作品时长，计算所述第二类作品的播放时长特征。

7.根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：
获取训练样本；
采用所述训练样本训练神经网络模型，所述神经网络模型的损失函数包括soft_zero_one损失函数和approx_ndcg损失函数，所述神经网络模型用于基于每个所述搜索返回作品的分数对所述搜索返回作品进行排序。

8.根据权利要求7所述的方法，其特征在于，所述获取训练样本，包括：
获取搜索产生的样本；
基于每个样本的被点击情况和平均播放时长，生成对应档的标签，采用具有所述标签的样本作为所述训练样本。

9.一种音乐搜索排序装置，其特征在于，所述装置包括：
第一获取模块，被配置为获取多个搜索返回作品，及每个所述搜索返回作品的发布时间；
第一确定模块，被配置为基于每个所述搜索返回作品的发布时间，确定所述搜索返回作品为第一类作品或第二类作品，所述第二类作品的发布时间早于所述第一类作品的发布时间；<...

【专利技术属性】
技术研发人员：陈刚保，周蓝珺，潘树燊，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人