推荐模型训练方法技术

技术编号:39588071 阅读:11 留言:0更新日期:2023-12-03 19:39
本公开涉及计算机技术领域,公开了一种模型训练方法

【技术实现步骤摘要】
推荐模型训练方法、歌单推荐方法、装置、介质及设备


[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及推荐模型训练方法

歌单推荐方法

装置

存储介质及电子设备


技术介绍

[0002]本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术

[0003]歌单是歌曲的集合,可以根据歌曲的歌词

歌手

编曲风格

发行时间等因素对歌曲进行划分获得

在音乐平台中,可以由用户基于歌曲偏好

播放场景等自身需求创建歌单,也可以通过算法对不同因素的歌曲进行归类

聚合等,进而获得对应的歌单

在此基础上,可以基于用户对歌曲

歌单的历史点击

播放

收藏等行为,对用户进行个性化歌单推荐

[0004]但是,在目前向用户针对性推荐歌单时,推荐结果的准确性

转化率等还有待进一步提高


技术实现思路

[0005]在本上下文中,本公开的实施方式期望提供一种推荐模型训练方法

歌单推荐方法

装置

存储介质及电子设备

[0006]根据本公开实施方式的第一方面,提供一种推荐模型训练方法,该方法可以包括:对样本用户采集第一歌单评分特征,第一歌单评分特征包括样本用户的第一用户行为特征

第一用户属性特征;构建样本用户对应的样本歌单;将第一歌单评分特征

样本歌单输入推荐模型,以通过推荐模型确定第一用户行为特征

第一用户属性特征分别与每一样本歌单的匹配分,并对各样本歌单的匹配分分别进行融合,获得推荐模型输出的样本歌单对应的第一目标匹配分;基于第一目标匹配分对推荐模型进行参数更新,直至推荐模型符合收敛条件

[0007]可选地,第一用户行为特征包括用户长期行为特征

用户短期行为特征,对样本用户采集第一歌单评分特征,包括:根据样本用户在第一时间段内交互的第一对象,获得用户长期行为特征;根据样本用户在第二时间段内交互的第一对象,获得用户短期行为特征,第一时间段长于第二时间段,第一对象包括样本用户交互的歌曲

歌单中的至少一种

[0008]可选地,对样本用户采集第一歌单评分特征,还包括:根据样本用户在第三时间段内与第一对象的交互总次数,获得样本用户对应的第一用户属性特征

[0009]可选地,样本歌单包括正样本与负样本,构建样本用户对应的样本歌单包括:确定样本用户在第四时间段内与第二对象的交互次数,第二对象包括样本用户交互的歌单;在交互次数大于或等于分类阈值的情况下,确定第二对象为正样本;在交互次数小于分类阈值的情况下,确定第二对象为负样本

[0010]可选地,推荐模型包括动态权要网络

行为特征匹配网络

属性特征匹配网络,将
第一歌单评分特征

样本歌单输入推荐模型,以通过推荐模型确定第一用户行为特征

第一用户属性特征分别与每一样本歌单的匹配分,并对各样本歌单的匹配分进行融合,获得推荐模型输出的样本歌单对应的第一目标匹配分,包括:将第一歌单评分特征

样本歌单输入推荐模型,以通过推荐模型的动态权重网络确定第一用户行为特征

第一用户属性特征分别对应的融合权重,行为特征匹配网络确定第一用户行为特征与每一样本歌单分别对应的匹配分,属性特征匹配网络确定第一用户属性特征与每一样本歌单分别对应的匹配分,再基于融合权重对各样本歌单对应的匹配分进行加权融合,获得推荐模型输出的样本歌单对应的第一目标匹配分

[0011]可选地,第一用户行为特征包括用户长期行为特征

用户短期行为特征,行为特征匹配网络包括长期行为特征匹配网络

短期行为特征匹配网络,行为特征匹配网络确定第一用户行为特征对样本歌单的匹配分,包括:长期行为特征匹配网络通过
Transformer
结构对用户长期行为特征进行信息提取,再通过多层感知器分别融合每一样本歌单,获得用户长期行为特征分别与各样本歌单对应的匹配分;短期行为特征匹配网络通过
Self

Attention
结构对用户短期行为特征进行信息提取,再通过多层感知器分别融合每一样本歌单,获得用户短期行为特征分别与各样本歌单对应的匹配分

[0012]根据本公开实施方式的第二方面,提供一种歌单推荐方法,该方法可以包括:对目标用户采集第二歌单评分特征,并获得目标用户对应的至少一个候选歌单,第二歌单评分特征包括第二用户行为特征

第二用户属性特征;将第二歌单评分特征

候选歌单输入推荐模型,以通过推荐模型确定第二用户行为特征

第二用户属性特征分别对每一候选歌单的匹配分,并对各候选歌单的匹配分分别进行融合,获得推荐模型输出的候选歌单对应的第二目标匹配分,推荐模型通过前述第一方面所述的方法训练获得;根据第二目标匹配分对目标用户进行候选歌单的推荐

[0013]可选地,获得目标用户对应的至少一个候选歌单,包括:
[0014]基于第三对象通过协同过滤从第四对象中获取至少一个候选歌单,第三对象包括目标用户交互的歌曲

歌单中的至少一种,第四对象包括目标用户未交互的歌单

[0015]根据本公开实施方式的第四方面,提供一种推荐模型训练装置,该装置可以包括:第一特征采集模块,用于对样本用户采集第一歌单评分特征,第一歌单评分特征包括样本用户的第一用户行为特征

第一用户属性特征;样本歌单构建模块,用于构建样本用户对应的样本歌单;推荐模型训练模块,用于将第一歌单评分特征

样本歌单输入推荐模型,以通过推荐模型确定第一用户行为特征

第一用户属性特征分别与每一样本歌单的匹配分,并对各样本歌单的匹配分分别进行融合,获得推荐模型输出的样本歌单对应的第一目标匹配分;推荐模型训练模块,还用于基于第一目标匹配分对推荐模型进行参数更新,直至推荐模型符合收敛条件

[0016]可选地,第一特征采集模块,包括:长期特征采集子模块,用于根据样本用户在第一时间段内交互的第一对象,获得用户长期行为特征;短期特征采集子模块,用于根据样本用户在第二时间段内交互的第一对象,获得用户短期行为特征,第一时间段长于第二时间段,第一对象包括样本用户交互的歌曲...

【技术保护点】

【技术特征摘要】
1.
一种推荐模型训练方法,其特征在于,包括:对样本用户采集第一歌单评分特征,所述第一歌单评分特征包括样本用户的第一用户行为特征

第一用户属性特征;构建所述样本用户对应的样本歌单;将所述第一歌单评分特征

所述样本歌单输入推荐模型,以通过所述推荐模型确定所述第一用户行为特征

第一用户属性特征分别与每一所述样本歌单的匹配分,并对各所述样本歌单的所述匹配分分别进行融合,获得所述推荐模型输出的所述样本歌单对应的第一目标匹配分;基于第一目标匹配分对所述推荐模型进行参数更新,直至所述推荐模型符合收敛条件
。2.
根据权利要求1所述的方法,其特征在于,所述第一用户行为特征包括用户长期行为特征

用户短期行为特征,所述对样本用户采集第一歌单评分特征,包括:根据所述样本用户在第一时间段内交互的第一对象,获得所述用户长期行为特征;根据所述样本用户在第二时间段内交互的所述第一对象,获得所述用户短期行为特征,所述第一时间段长于所述第二时间段,所述第一对象包括所述样本用户交互的歌曲

歌单中的至少一种
。3.
根据权利要求2所述的方法,其特征在于,所述对样本用户采集第一歌单评分特征,还包括:根据所述样本用户在第三时间段内与所述第一对象的交互总次数,获得所述样本用户对应的所述第一用户属性特征
。4.
根据权利要求1所述的方法,其特征在于,所述样本歌单包括正样本与负样本,所述构建所述样本用户对应的样本歌单包括:确定所述样本用户在第四时间段内与第二对象的交互次数,所述第二对象包括所述样本用户交互的歌单;在所述交互次数大于或等于分类阈值的情况下,确定所述第二对象为正样本;在所述交互次数小于所述分类阈值的情况下,确定所述第二对象为负样本
。5.
一种歌单推荐方法,其特征在于,所述方法包括:对目标用户采集第二歌单评分特征,并获得所述目标用户对应的至少一个候选歌单,所述第二歌单评分特征包括第二用户行为特征

第二用户属性特征;将所述第二歌单评分特征

所述候选歌单输入推荐模型,以通过所述推荐模型确定所述第二用户行为特征

所述第二用户属性特征分别对每一所述候选歌单的匹配分,并对各所述候选歌单的所述匹配分分别进行融合,获得所述推荐模型输出的所述候选歌单对应的第二目标匹配分,所述推荐模型通过前述权利要求1至4中任一项方法训练获得;根据所述第二目...

【专利技术属性】
技术研发人员:吕旸肖强李勇
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1