自适应加权的短视频推荐方法、电子设备和存储介质技术

技术编号:37454453 阅读:9 留言:0更新日期:2023-05-06 09:26
本发明专利技术公开了一种自适应加权的短视频推荐方法、电子设备和存储介质,该短视频推荐方法步骤包括:1)提取用户和短视频的向量特征,并用于预训练双塔模型;2)自适应地为大众用户和小众用户中容易出错的样本赋予更高的权重,并基于加权后的损失函数更新模型参数;3)重复步骤2,直至样本权重和模型参数收敛为止,并得到更新后的双塔模型;4)利用更新后的双塔模型为用户生成最终的短视频推荐列表。本发明专利技术通过自适应加权在保证总体推荐准确率的情况下改善了小众用户的推荐准确率,可以应用在短视频推荐领域。推荐领域。推荐领域。

【技术实现步骤摘要】
自适应加权的短视频推荐方法、电子设备和存储介质


[0001]本专利技术属于短视频推荐领域,具体的说是一种自适应加权的短视频推荐方法、电子设备和存储介质。

技术介绍

[0002]由于用户时间碎片化、移动互联网和智能手机的快速普及、制作门槛低等原因,短视频最近几年引起广泛关注。短视频能够抢占用户注意力和流量的关键是短视频平台可以根据用户的喜好进行精准的视频推荐。然而推荐系统对于小众用户的推荐准确率却并不理想,这导致了短视频平台的活跃用户数下降和用户流失等问题。因此,提升小众用户推荐准确率已经成为短视频平台关心的重要问题。

技术实现思路

[0003]本专利技术是为了解决上述现有技术存在的不足之处,提出一种自适应加权的短视频推荐方法、电子设备和存储介质,以期能通过自适应地给容易被错分的样本赋予更高的权重,从而在不影响整体推荐性能的情况下提升对小众用户的推荐准确率,进而能有效提升用户存留率和活跃度。
[0004]本专利技术为达到上述专利技术目的,采用如下技术方案:
[0005]本专利技术一种自适应加权的短视频推荐方法的特点在于,包括以下步骤:
[0006]S1、根据用户观看热门短视频的占比,将用户划分为大众用户和小众用户,并获取大众用户和小众用户分别与短视频的历史交互记录并输入预训练的全连接神经网络中进行特征提取,得到大众用户的样本特征集合以及小众用户的样本特征集合其中,u
i
表示第i条大众用户的样本(u
i
,c
i
)中的大众用户特征,c
i
表示第i条大众用户的样本(u
i
,c
i
)中的视频特征;i=1,2,

,N,N表示大众用户的样本总数;u

j
表示第j条小众用户的样本(u

j
,c

j
)中的小众用户特征,c

j
表示第j条小众用户的样本(u

j
,c

j
)中的视频特征,j=1,2,

,M,M表示小众用户的样本总数;
[0007]S2、构建两个三层的全连接神经网络组成的双塔模型,并将大众用户的样本特征集合以及小众用户的样本特征集合分别输入所述双塔模型中,并相应输出大众用户样本的高阶特征集合以及小众用户样本的高阶特征集合为其中,p
i
表示第i条大众用户的样本(p
i
,q
i
)中的大众用户高阶特征,q
i
表示第i条大众用户的样本(p
i
,q
i
)中的视频高阶特征,p

j
表示第j条小众用户的样本(p

j
,q

j
)中的小众用户高阶特征,q

j
表示第j条小众用户的样本(p

j
,q

j
)中的视频高阶特征。
[0008]S3、利用式(1)构建双塔模型的交叉熵损失L:
[0009][0010]式(1)中,表示p
i
的转置,表示p

j
的转置,y
i
表示第i条大众用户的样本(u
i
,c
i
)的标签,y

j
表示第i条大众用户的样本(u
i
,c
i
)的标签;
[0011]S4、利用梯度下降法对所述双塔模型进行预训练,并计算所述交叉熵损失L以更新模型参数,直到交叉熵损失L收敛为止,从而得到预训练后的双塔模型;
[0012]S5、对预训练后的双塔模型的更新:
[0013]S5.1、定义当前迭代次数为t,并初始化t=1;将预训练后的双塔模型作为第t次迭代的双塔模型;
[0014]利用式(2)计算第t次迭代中第i条大众用户的样本(u
i
,c
i
)的权重
[0015][0016]式(2)中,α是一个取值范围在[1,10]之间的参数,表示第t次迭代中第i条大众用户的样本(u
i
,c
i
)的交叉熵损失,并由式(3)得到;
[0017][0018]式(3)中,β是一个取值在[0.1,0.2]的参数;表示第t次迭代中第i条大众用户的样本(p
i
,q
i
)中的大众用户高阶特征,表示第t次迭代中第i条大众用户的样本(p
i
,q
i
)中的视频高阶特征,表示的转置,当t=1时,令第t

1次迭代中第i条大众用户的样本(u
i
,c
i
)的交叉熵损失)的交叉熵损失
[0019]利用式(4)计算第t次迭代中第j条小众用户的样本(u

j
,c

j
)的权重
[0020][0021]式(4)中,表示第t次迭代中第j条小众用户的样本(u

j
,c

j
)的交叉熵损失,并由式(5)得到;
[0022][0023]式(5)中,表示第t次迭代中第j条小众用户的样本(p

j
,q

j
)中的小众用户高阶特征,表示第t次迭代中第j条小众用户的样本(p

j
,q

j
)中的视频高阶特征,表示的转置,当t=1时,令第t

1次迭代中第第j条小众用户的样本(u

j
,c

j
)的交叉熵损失)的交叉熵损失
[0024]利用式(7)构建第t次迭代的加权损失函数L
t

[0025][0026]S5.4、利用梯度下降法对第t次迭代的双塔模型进行训练,并最小化加权损失函数L
t
以更新第t次迭代的双塔模型的参数;
[0027]S5.5、将t+1赋值给t后,返回步骤S5.2顺序执行,直至t达到最大迭代次数t
max
为止,从而得到更新后的双塔模型;
[0028]S7、将任一用户的高阶特征集合和所有视频的高阶特征集合输入更新后的双塔网
络中进行处理,并输出用户对所有视频的评分,从而选取评分最高的前top个视频推荐给相应用户。
[0029]本专利技术一种电子设备,包括存储器以及处理器的特点在于,所述存储器用于存储支持处理器执行所述短视频推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
[0030]本专利技术一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序的特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应加权的短视频推荐方法,其特征在于,包括以下步骤:S1、根据用户观看热门短视频的占比,将用户划分为大众用户和小众用户,并获取大众用户和小众用户分别与短视频的历史交互记录并输入预训练的全连接神经网络中进行特征提取,得到大众用户的样本特征集合以及小众用户的样本特征集合其中,u
i
表示第i条大众用户的样本(u
i
,c
i
)中的大众用户特征,c
i
表示第i条大众用户的样本(u
i
,c
i
)中的视频特征;i=1,2,

,N,N表示大众用户的样本总数;u

j
表示第j条小众用户的样本(u

j
,c

j
)中的小众用户特征,c

j
表示第j条小众用户的样本(u

j
,c

j
)中的视频特征,j=1,2,

,M,M表示小众用户的样本总数;S2、构建两个三层的全连接神经网络组成的双塔模型,并将大众用户的样本特征集合以及小众用户的样本特征集合分别输入所述双塔模型中,并相应输出大众用户样本的高阶特征集合以及小众用户样本的高阶特征集合为其中,p
i
表示第i条大众用户的样本(p
i
,q
i
)中的大众用户高阶特征,q
i
表示第i条大众用户的样本(p
i
,q
i
)中的视频高阶特征,p

j
表示第j条小众用户的样本(p

j
,q

j
)中的小众用户高阶特征,q

j
表示第j条小众用户的样本(p

j
,q

j
)中的视频高阶特征。S3、利用式(1)构建双塔模型的交叉熵损失L:式(1)中,表示p
i
的转置,表示p

j
的转置,y
i
表示第i条大众用户的样本(u
i
,c
i
)的标签,y

j
表示第i条大众用户的样本(u
i
,c
i
)的标签;S4、利用梯度下降法对所述双塔模型进行预训练,并计算所述交叉熵损失L以更新模型参数,直到交叉熵损失L收敛为止,从而得到预训练后的双塔模型;S5、对预训练后的双塔模型的更新:S5.1、定义当前迭代次数为t,并初...

【专利技术属性】
技术研发人员:胡郅昊田新梅
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1