一种音频数据的排序方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27204259 阅读:15 留言:0更新日期:2021-01-31 12:22
本发明专利技术实施例提供了一种音频数据的排序方法、装置、计算机设备和存储介质,该方法包括:对用户播放的音频数据生成播放列表,音频数据中具有实体,对播放列表进行编码,获得表征音频数据的第一向量、表征实体的第二向量,根据第一向量生成表征用户的第三向量,根据第一向量生成表征用户对音频数据偏好的第四向量,根据第二向量生成表征用户对音频数据偏好的第五向量,至少将第一向量、第二向量、第三向量、第四向量与第五向量输入提升树模型进行训练,以对音频数据进行排序,自动抽取特征,避免了人工特征工程,大大降低了技术门槛,降低了成本,再者,引入用户播放音频数据的播放列表可以捕捉用户的兴趣变化。可以捕捉用户的兴趣变化。可以捕捉用户的兴趣变化。

【技术实现步骤摘要】
一种音频数据的排序方法、装置、计算机设备和存储介质


[0001]本专利技术实施例涉及计算机处理的
,尤其涉及一种音频数据的排序方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着媒体娱乐的快速发展,尤其是移动终端的普及使得音频数据的制作成本大幅下降,用户可以随时随地制作音频数据并大量上传至媒体平台进行公开,使得各个媒体平台中聚合了大量的音频数据。
[0003]对于海量的音频数据,媒体平台会筛选用户用户可能感兴趣的音频数据,按照一定的方式排序并推送给用户,使得用户更加便捷地获取到可能感兴趣的音频数据。
[0004]目前,对音频数据排序的方式主要包括如下三种:
[0005]1、LR(Logistic Regression,逻辑回归)模型
[0006]在此方式中,通过人工特征工程抽取大量特征,将这些特征输入LR模型中对媒体节目进行排序。
[0007]但是,LR模型抽取特征需要依赖较多的业务知识,技术门槛高,成本高,并且,LR模型是一个线性模型,学习能力弱,处理高维特征的能力较低,导致排序的精确度较低。
[0008]2、Wide&Deep(宽度和深度)模型
[0009]Wide&Deep模型的核心思想是结合广义线性模型的记忆能力(memorization)和深度前馈神经网络模型的泛化能力(generalization)。利用广义线性模型从历史数据中学习特征相关性,利用深度前馈神经网络揭示隐式特征之间的相互作用。
[0010]但是,Wide模型的输入,依旧依赖人工特征工程,需要依赖较多的业务知识,技术门槛高,成本高。

技术实现思路

[0011]本专利技术实施例提出了一种音频数据的排序方法、装置、计算机设备和存储介质,以解决如何降低对音频数据排序的成本的问题。
[0012]第一方面,本专利技术实施例提供了一种音频数据的排序方法,包括:
[0013]对用户播放的音频数据生成播放列表,所述音频数据中具有实体;
[0014]对所述播放列表进行编码,获得表征所述音频数据的第一向量、表征所述实体的第二向量;
[0015]根据所述第一向量生成表征所述用户的第三向量;
[0016]根据所述第一向量生成表征所述用户对音频数据偏好的第四向量;
[0017]根据所述第二向量生成表征所述用户对音频数据偏好的第五向量;
[0018]至少将所述第一向量、所述第二向量、所述第三向量、所述第四向量与所述第五向量输入提升树模型进行训练,以对所述音频数据进行排序。
[0019]可选地,所述对用户播放的音频数据生成播放列表,包括:
[0020]若用户播放音频数据,则记录播放所述音频数据的时间戳、播放所述音频数据的时长;
[0021]依次将所述音频数据按照所述时间戳排列,形成播放列表;
[0022]若播放所述音频数据的时长小于预设的第一阈值,则在所述播放列表中滤除所述音频数据;
[0023]若相邻两个所述音频数据的所述时间戳之间的差值大于预设的第二阈值,则在相邻两个所述音频数据之间切断所述播放列表。
[0024]可选地,所述对所述播放列表进行编码,获得表征所述音频数据的第一向量、表征所述实体的第二向量,包括:
[0025]将所述实体写入所述播放列表中、所述音频数据的信息之前;
[0026]若写入完成,则将所述播放列表输入词向量模型进行训练,以输出表征所述音频数据的第一向量、表征所述实体的第二向量。
[0027]可选地,所述根据所述第一向量生成表征所述用户的第三向量,包括:
[0028]提取所述用户最新的所述播放列表,作为目标列表;
[0029]对所述目标列表中的各个所述第一向量配置权重;
[0030]对已配置所述权重的所述第一向量计算平均值,作为表征所述用户的第三向量。
[0031]可选地,所述根据所述第一向量生成表征所述用户对音频数据偏好的第四向量,包括:
[0032]提取所述用户最新的所述播放列表,作为目标列表;
[0033]在所述目标列表中提取最新的多个所述第一向量,作为目标向量;
[0034]计算所述目标向量与属于所述用户的其他所述第一向量计算相似度,作为表征所述用户对音频数据偏好的第四向量。
[0035]可选地,所述根据所述第二向量生成表征所述用户对音频数据偏好的第五向量,包括:
[0036]查找所述用户的实体画像,所述实体画像中具有实体、所述用户对所述实体画像中实体的偏好度;
[0037]计算第一候选向量与所述第一候选向量对应的偏好度之间的乘积,作为第一参考向量,所述第一候选向量为所述实体画像中与所述音频数据均具有的实体对应的第二向量;
[0038]从第二候选向量与第三候选向量的乘积、所述第一候选向量与所述第三候选向量的乘积中取最大值,作为第二参考向量,所述第二候选向量为所述实体画像中除所述第一候选向量之外的其他实体对应的第二向量,所述第三候选向量为所述音频数据中除所述第一候选向量之外的其他实体对应的第二向量;
[0039]计算所述第二参考向量与所述第三候选向量之间的乘积,作为第四参考向量;
[0040]计算所述第一参考向量与所述第四参考向量之间的和值,作为表征所述用户对音频数据偏好的第五向量。
[0041]可选地,在所述对用户播放的音频数据生成播放列表之后,还包括:
[0042]从所有所述用户的所述播放列表中挖掘频繁子图;
[0043]将所述频繁子图中的所述音频数据随机打乱,以针对所有所述用户生成新的播放
列表。
[0044]第二方面,本专利技术实施例还提供了一种音频数据的排序装置,包括:
[0045]播放列表生成模块,用于对用户播放的音频数据生成播放列表,所述音频数据中具有实体;
[0046]播放列表编码模块,用于对所述播放列表进行编码,获得表征所述音频数据的第一向量、表征所述实体的第二向量;
[0047]用户向量生成模块,用于根据所述第一向量生成表征所述用户的第三向量;
[0048]音频偏好向量生成模块,用于根据所述第一向量生成表征所述用户对音频数据偏好的第四向量;
[0049]实体偏好向量生成模块,用于根据所述第二向量生成表征所述用户对音频数据偏好的第五向量;
[0050]音频排序模块,用于至少将所述第一向量、所述第二向量、所述第三向量、所述第四向量与所述第五向量输入提升树模型进行训练,以对所述音频数据进行排序。
[0051]可选地,所述播放列表生成模块还用于:
[0052]若用户播放音频数据,则记录播放所述音频数据的时间戳、播放所述音频数据的时长;
[0053]依次将所述音频数据按照所述时间戳排列,形成播放列表;
[0054]若播放所述音频数据的时长小于预设的第一阈值,则在所述播放列表中滤除所述音频数据;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据的排序方法,其特征在于,包括:对用户播放的音频数据生成播放列表,所述音频数据中具有实体;对所述播放列表进行编码,获得表征所述音频数据的第一向量、表征所述实体的第二向量;根据所述第一向量生成表征所述用户的第三向量;根据所述第一向量生成表征所述用户对音频数据偏好的第四向量;根据所述第二向量生成表征所述用户对音频数据偏好的第五向量;至少将所述第一向量、所述第二向量、所述第三向量、所述第四向量与所述第五向量输入提升树模型进行训练,以对所述音频数据进行排序。2.根据权利要求1所述的方法,其特征在于,所述对用户播放的音频数据生成播放列表,包括:若用户播放音频数据,则记录播放所述音频数据的时间戳、播放所述音频数据的时长;依次将所述音频数据按照所述时间戳排列,形成播放列表;若播放所述音频数据的时长小于预设的第一阈值,则在所述播放列表中滤除所述音频数据;若相邻两个所述音频数据的所述时间戳之间的差值大于预设的第二阈值,则在相邻两个所述音频数据之间切断所述播放列表。3.根据权利要求1所述的方法,其特征在于,所述对所述播放列表进行编码,获得表征所述音频数据的第一向量、表征所述实体的第二向量,包括:将所述实体写入所述播放列表中、所述音频数据的信息之前;若写入完成,则将所述播放列表输入词向量模型进行训练,以输出表征所述音频数据的第一向量、表征所述实体的第二向量。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一向量生成表征所述用户的第三向量,包括:提取所述用户最新的所述播放列表,作为目标列表;对所述目标列表中的各个所述第一向量配置权重;对已配置所述权重的所述第一向量计算平均值,作为表征所述用户的第三向量。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一向量生成表征所述用户对音频数据偏好的第四向量,包括:提取所述用户最新的所述播放列表,作为目标列表;在所述目标列表中提取最新的多个所述第一向量,作为目标向量;计算所述目标向量与属于所述用户的其他所述第一向量计算相似度,作为表征所述用户对音频数据偏好的第四向量。6.根据权利要求1所述的方法,其特征在于,所述根据所述第二向量生成表征所述用户对音频数据偏好的第五向量,包括:查找所述用户的实体画像,所述...

【专利技术属性】
技术研发人员:谭又伟李泽隆
申请(专利权)人:广州欢聊网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利