音乐搜索排序方法、装置、设备和存储介质制造方法及图纸

技术编号:24996210 阅读:26 留言:0更新日期:2020-07-24 17:58
本申请公开了一种音乐搜索排序方法、装置、设备和存储介质,属于搜索技术领域。该方法包括:获取多个搜索返回作品,及每个搜索返回作品的发布时间;基于每个搜索返回作品的发布时间,确定搜索返回作品为第一类作品或第二类作品,第二类作品的发布时间早于第一类作品的发布时间;分别获取每个搜索返回作品的文本匹配度和数值特征;确定第一类作品的时新性加权特征,时新性加权特征是采用发布时间计算出的时新性加权值;利用每个搜索返回作品的文本匹配度和数值特征、以及第二类作品的播放时长特征和第一类作品的时新性加权特征作为排序模型的输入,对多个搜索返回作品进行排序;输出排序后的搜索返回作品。

【技术实现步骤摘要】
音乐搜索排序方法、装置、设备和存储介质
本申请涉及搜索
,尤其涉及一种音乐搜索排序方法、装置、设备和存储介质。
技术介绍
随着移动终端的普及,移动终端已经取代原来的动态图像专家组音频层3(MovingPictureExpertsGroupAudioLayer3,MP3)播放器等设备,成为人们日常听音乐的首选。用户在使用移动终端中的音乐软件听音乐时,除了可以听软件推荐、或者已经收藏的歌曲外,还可以通过音乐软件的搜索功能搜索相应的歌曲,然后播放欣赏。在实现本专利技术过程中,专利技术人发现现有技术存在如下问题,相比于网页检索,音乐领域中的检索排序有明显的特殊性,在音乐领域,每天更新的新作品数量巨大,在检索结果中需要平衡新作品与经典作品曝光量。利用向量空间模型等的经典排序模型,或是基于机器学习的排序模型,排序结果均存在新作品曝光量不够的问题。
技术实现思路
本申请实施例提供了一种音乐搜索排序方法、装置、设备和存储介质,保证排序方案对新作品更加公平,提高新作品的曝光量。所述技术方案如下:一方面,提供了一种音乐搜索排序方法,所述方法包括:获取多个搜索返回作品,及每个所述搜索返回作品的发布时间;基于每个所述搜索返回作品的发布时间,确定所述搜索返回作品为第一类作品或第二类作品,所述第二类作品的发布时间早于所述第一类作品的发布时间;分别获取每个所述搜索返回作品的文本匹配度和数值特征,所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度,所述数值特征为所述搜索返回作品的特征中除播放时长特征外的数值项;确定所述第二类作品的播放时长特征,所述播放时长特征用于指示最近一段时间内的播放情况;确定所述第一类作品的时新性加权特征,所述时新性加权特征是采用发布时间计算出的时新性加权值;利用每个所述搜索返回作品的文本匹配度和数值特征、以及所述第二类作品的播放时长特征和所述第一类作品的时新性加权特征作为排序模型的输入,对所述多个搜索返回作品进行排序;输出排序后的所述搜索返回作品。一方面,提供了一种音乐搜索排序装置,所述装置包括:第一获取模块,被配置为获取多个搜索返回作品,及每个所述搜索返回作品的发布时间;第一确定模块,被配置为基于每个所述搜索返回作品的发布时间,确定所述搜索返回作品为第一类作品或第二类作品,所述第二类作品的发布时间早于所述第一类作品的发布时间;第二获取模块,被配置为分别获取每个所述搜索返回作品的文本匹配度和数值特征,所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度,所述数值特征为所述搜索返回作品的特征中除播放时长特征外的数值项;第二确定模块,被配置为确定所述第二类作品的播放时长特征,所述播放时长特征用于指示最近一段时间内的播放情况;第三确定模块,被配置为确定所述第一类作品的时新性加权特征,所述时新性加权特征是采用发布时间计算出的时新性加权值;排序模块,被配置为利用每个所述搜索返回作品的文本匹配度和数值特征、以及所述第二类作品的播放时长特征和所述第一类作品的时新性加权特征作为排序模型的输入,对所述多个搜索返回作品进行排序;输出模块,被配置为输出排序后的所述搜索返回作品。一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现前述音乐搜索排序方法。一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现前述音乐搜索排序方法。本申请实施例提供的技术方案带来的有益效果至少包括:在本申请实施例中,通过对第一类作品(也即新作品)采用和第二类作品(也即老作品)不同的方式进行分数计算。对于新作品和老作品,除了都会考虑文本匹配度和数值特征来保证搜索的匹配性外,对于老作品考虑的是播放时长特征,而在新作品计算分数时,考虑的不是播放时长而是发布时间,因为新作品上架时间短,播放时长必然较少,如果采用播放时长计算分数和老作品一起排序,十分不公平。而基于发布时间对新作品的特征进行提取,使得新作品可以以相对公平的方式进行排序,保证了新作品的排序最终也可以较为靠前,从而提高新作品的曝光量,进而提高点击率和平均播放时长。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请一个示意性实施例的音乐搜索排序方法的流程示意图;图2为本申请另一个示意性实施例的音乐搜索排序方法的流程示意图;图3示出了本申请的音乐搜索过程示意图;图4为本申请实施例的音乐搜索排序装置的结构框图;图5是本申请实施例提供的一种服务器的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。用户在终端设备运行的音乐软件搜索框中输入搜索关键词(Query),例如歌曲名称或歌手名字;该搜索关键词被发送给服务器,服务器基于该搜索关键词,搜索到相关的作品,也即搜索返回作品。搜索返回作品可以是歌曲、视频、歌单等的信息。对于搜索返回作品,服务器需要先对其进行排序,然后将排序后的搜索返回作品发送给用户的终端设备进行展示。在本公开实施例中,上述音乐搜索排序方法由服务器执行,该服务器可以为云端服务器或本地服务器。在前述说明中,针对的是音乐软件中的搜索,本申请的搜索方案也适用于,音乐网站页面搜索,或者其他方式的音乐搜索。图1为本申请一个示意性实施例的音乐搜索排序方法的流程示意图。该方法可以由前述终端或服务器执行。如图2所示,该方法可以包括:在步骤101中:获取多个搜索返回作品,及每个所述搜索返回作品的发布时间。这里的搜索返回作品也即前文所述的用户在搜索过程中,服务器基于搜索关键词得到的作品。作品的发布时间可以基于这些作品的名称从数据库中获取到。在步骤102中:基于每个所述搜索返回作品的发布时间,确定所述搜索返回作品为第一类作品或第二类作品。多个搜索返回作品包括第一类作品和第二类作品,第二类作品的发布时间早于所述第一类作品的发布时间。在本公开实施例中,对于搜索返回作品可以按照每个作品的发布时间,将其划分为第一类作品(也即新作品)和第二类作品(也即老作品)。例如,小于或等于发布时间阈值的为新作品,大于发布时间阈值的为老作品。例如,发布时间阈值可以为2天,发布时间小于或等于2的为新作品,反之,大于2天的为老作品。在步骤103中:分别获本文档来自技高网...

【技术保护点】
1.一种音乐搜索排序方法,其特征在于,所述方法包括:/n获取多个搜索返回作品,及每个所述搜索返回作品的发布时间;/n基于每个所述搜索返回作品的发布时间,确定所述搜索返回作品为第一类作品或第二类作品,所述第二类作品的发布时间早于所述第一类作品的发布时间;/n分别获取每个所述搜索返回作品的文本匹配度和数值特征,所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度,所述数值特征为所述搜索返回作品的特征中除播放时长特征外的数值项;/n确定所述第二类作品的播放时长特征,所述播放时长特征用于指示最近一段时间内的播放情况;/n确定所述第一类作品的时新性加权特征,所述时新性加权特征是采用发布时间计算出的时新性加权值;/n利用每个所述搜索返回作品的文本匹配度和数值特征、以及所述第二类作品的播放时长特征和所述第一类作品的时新性加权特征作为排序模型的输入,对所述多个搜索返回作品进行排序;/n输出排序后的所述搜索返回作品。/n

【技术特征摘要】
1.一种音乐搜索排序方法,其特征在于,所述方法包括:
获取多个搜索返回作品,及每个所述搜索返回作品的发布时间;
基于每个所述搜索返回作品的发布时间,确定所述搜索返回作品为第一类作品或第二类作品,所述第二类作品的发布时间早于所述第一类作品的发布时间;
分别获取每个所述搜索返回作品的文本匹配度和数值特征,所述文本匹配度是指搜索时使用的关键词与所述搜索返回作品的文本特征的匹配度,所述数值特征为所述搜索返回作品的特征中除播放时长特征外的数值项;
确定所述第二类作品的播放时长特征,所述播放时长特征用于指示最近一段时间内的播放情况;
确定所述第一类作品的时新性加权特征,所述时新性加权特征是采用发布时间计算出的时新性加权值;
利用每个所述搜索返回作品的文本匹配度和数值特征、以及所述第二类作品的播放时长特征和所述第一类作品的时新性加权特征作为排序模型的输入,对所述多个搜索返回作品进行排序;
输出排序后的所述搜索返回作品。


2.根据权利要求1所述的方法,其特征在于,确定所述第一类作品的时新性加权特征,包括:
基于所述第一类作品的发布时间确定对应的发布时间分数;
基于所述第一类作品的类型确定对应的类型分数;
基于所述发布时间分数和所述类型分数确定所述时新性加权特征。


3.根据权利要求2所述的方法,其特征在于,基于所述发布时间分数和所述类型分数确定所述时新性加权特征,包括:
采用计算第二类作品播放时长特征的方式计算所有第一类作品的播放时长特征;
确定所述所有第一类作品的播放时长特征的目标分位数;
采用所述目标分位数、所述发布时间分数和所述类型分数的乘积作为所述时新性加权特征。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当计算出的所述第一类作品的播放时长特征,大于所述时新性加权特征,采用所述播放时长特征替代所述时新性加权特征。


5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于搜索词确定搜索意图,所述搜索意图用于指示搜索类型;
基于所述搜索意图和所述搜索返回作品中与所述搜索意图对应的搜索类型中第一类作品的比例,确定加权值;
采用加权值乘以所述时新性加权特征再加所述时新性加权特征,得到最终的时新性加权特征。


6.根据权利要求1所述的方法,其特征在于,确定所述第二类作品的播放时长特征,包括:
基于所述第二类作品的每日播放数,确定平滑指数;
基于所述平滑指数对所述第二类作品的平均播放时长进行平滑处理;
基于平滑处理后的所述平均播放时长、所述每日播放数和所述第二类作品的作品时长,计算所述第二类作品的播放时长特征。


7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
获取训练样本;
采用所述训练样本训练神经网络模型,所述神经网络模型的损失函数包括soft_zero_one损失函数和approx_ndcg损失函数,所述神经网络模型用于基于每个所述搜索返回作品的分数对所述搜索返回作品进行排序。


8.根据权利要求7所述的方法,其特征在于,所述获取训练样本,包括:
获取搜索产生的样本;
基于每个样本的被点击情况和平均播放时长,生成对应档的标签,采用具有所述标签的样本作为所述训练样本。


9.一种音乐搜索排序装置,其特征在于,所述装置包括:
第一获取模块,被配置为获取多个搜索返回作品,及每个所述搜索返回作品的发布时间;
第一确定模块,被配置为基于每个所述搜索返回作品的发布时间,确定所述搜索返回作品为第一类作品或第二类作品,所述第二类作品的发布时间早于所述第一类作品的发布时间;<...

【专利技术属性】
技术研发人员:陈刚保周蓝珺潘树燊
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1