用于获取视频推荐模型的方法及装置、电子设备、存储介质制造方法及图纸

技术编号：36530522 阅读：18 留言：0更新日期：2023-02-01 16:12

本申请涉及视频推荐技术领域，公开一种用于获取视频推荐模型的方法，包括：获取多个历史视频观看数据；按照预设格式对各历史视频观看数据进行整理，获得离线训练数据集；根据离线训练数据集对预设的强化学习模型进行训练，获得备选推荐模型；利用备选推荐模型对用户进行视频推荐；在利用备选推荐模型对用户进行视频推荐达到预设次数后，对预设次数的视频推荐产生的数据进行采集，获得在线训练数据集；根据在线训练数据集对备选推荐模型进行更新，获得目标推荐模型。通过对预设的强化学习模型分别进行离线训练和在线训练，这样获得的目标推荐模型在进行视频推荐时准确率更高。本申请还公开一种用于获取视频推荐模型的装置及电子设备、存储介质。存储介质。存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
用于获取视频推荐模型的方法及装置、电子设备、存储介质

[0001]本申请涉及视频推荐
，例如涉及一种用于获取视频推荐模型的方法及装置、电子设备、存储介质。

技术介绍

[0002]随着互联网技术的蓬勃发展，多媒体短视频成为当今最热的娱乐方式。当下有众多的短视频应用占据着互联网的半壁江山，如抖音、快手、西瓜等。这些短视频应用本身的核心业务是依靠超大的用户流量和用户留存实现用户变现，因此需要提高用户留存率，而提高用户留存率需要提高视频推荐的准确率，这样才能使得推荐给用户的视频更符合用户的喜好，从而使得用户尽可能留存较长的时间。
[0003]在实现本公开实施例的过程中，发现相关技术中至少存在如下问题：
[0004]相关技术中在对用户进行视频推荐时，由于没有考虑用户的喜好可能存在实时变化的情况，导致推荐的视频难以满足用户的喜好，使得视频推荐的准确率较低。

技术实现思路

[0005]为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。
[0006]本公开实施例提供了一种用于获取视频推荐模型的方法及装置、电子设备、存储介质，以能够提高视频推荐的准确率。
[0007]在一些实施例中，用于获取视频推荐模型的方法，包括：获取多个历史视频观看数据；历史视频观看数据为预设时间段内的视频推荐所产生的数据；按照预设格式对各历史视频观看数据进行整理，获得离线训练数据集；根据...

【技术保护点】

【技术特征摘要】
1.一种用于获取视频推荐模型的方法，其特征在于，包括：获取多个历史视频观看数据；所述历史视频观看数据为预设时间段内的视频推荐所产生的数据；按照预设格式对各所述历史视频观看数据进行整理，获得离线训练数据集；根据所述离线训练数据集对预设的强化学习模型进行训练，获得备选推荐模型；利用所述备选推荐模型对用户进行视频推荐；在利用所述备选推荐模型对用户进行视频推荐达到预设次数后，对所述预设次数的视频推荐产生的数据进行采集，获得在线训练数据集；根据所述在线训练数据集对所述备选推荐模型进行更新，获得目标推荐模型。2.根据权利要求1所述的方法，其特征在于，所述历史视频观看数据包括第一状态和第二状态，所述第一状态用于表征用户观看的第一历史视频，所述第二状态用于表征用户观看的第二历史视频；获取多个历史视频观看数据，包括：对用户观看过的各历史视频进行特征向量提取，获得所述第一状态和所述第二状态。3.根据权利要求1所述的方法，其特征在于，所述历史视频观看数据包括动作，所述动作用于表征在所述第一状态下将预设类型的第二历史视频推送给用户；获取多个历史视频观看数据，包括：从预设的动作数据库中匹配出与各动作对应的编号；所述动作数据库中存储有动作与编号之间的对应关系，通过所述编号表征各所述动作。4.根据权利要求1所述的方法，其特征在于，所述历史视频观看数据包括奖励，所述奖励用于表征在所述动作完成后用户对推送的第二历史视频的喜爱程度；获取多个历史视频观看数据，包括：获取用户观看所述第二历史视频的时长和反馈信息；所述反馈信息包括用户对所述第二历史视频的转发行为信息、评论行为信息或点赞行为信息中的一种或多种；获取所述时长对应的第一奖励值和所述反馈信息对应的第二奖励值；对所述第一奖励值和所述第二奖励值进行求和处理，获得所述奖励。5.根据权利要求1至4任一项所述的方法，其特征在于，根据所述离线训练数据集对预设的强化学习模型进行训练，获得备选推荐模型，包括：将所...

【专利技术属性】
技术研发人员：王同乐，李霞，杨康，孙泽懿，李采彧，李莹莹，
申请(专利权)人：北京明略软件系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人