一种视频推荐模型自适应增量训练方法技术

技术编号：32854184 阅读：17 留言：0更新日期：2022-03-30 19:21

本发明专利技术公开了一种视频推荐模型自适应增量训练方法,基于基础模型，对新增内容进行强化训练，并对存量内容进行调优，取得最终训练结果，其具体步骤如下：提取并划分样本数据、初始化新增内容的相关模型参数、自适应增量训练。本发明专利技术设计了一种自适应调整的增量训练方法，可以有效减少训练数据量，兼顾新增内容和存量内容的预测效果，自动寻找最佳的训练结果，根据训练状态动态调整子训练重复次数，有效缩短了训练时长。本发明专利技术基于已经训练好的模型进行增量训练相比全量训练耗时更短、增量训练效率更高且效果相对更佳的优点。练效率更高且效果相对更佳的优点。练效率更高且效果相对更佳的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频推荐模型自适应增量训练方法

[0001]本专利技术涉及视频内容推荐
，特别是视频推荐模型自适应增量训练方法。

技术介绍

[0002]视频内容推荐技术通过挖掘用户的收视行为，发掘用户的兴趣偏好，为每个用户提供个性化的内容建议，帮助用户更快更好的寻找到喜爱的视频内容。近些年来，随着计算机计算能力和存储能力的大幅度提升，深度学习技术在视频推荐领域得到了越来越多的研究与应用。
[0003]相较传统的机器学习算法，深度学习基于海量的数据规模与复杂的模型结构，在推荐效果上优势明显。与此同时，深度学习模型的训练过程也需要耗费更多的硬件资源和时间成本。随着用户数据量的不断增加和算法模型的不断的演化，模型的训练成本越发沉重。所以，如何节约训练成本，如何有效的增量训练，开始得到更多的关注。
[0004]用户的历史收视行为充分反映了用户对视频内容的偏好，大部分视频推荐算法模型基于用户历史观看的内容集合，试图挖掘出内容特性和用户收视行为的规律性，进而得到用户的精准偏好，预测出用户下一个想看的内容。
[0005]专利公开号CN113268633A提取每位样本用户的视频点击序列，拆分为历史点击序列和目标视频，并计算每个用户对目标视频的观看深度。最终基于样本用户的目标视频、历史点击序列、用户属性特征、观看深度等特征数据构建视频推荐模型。
[0006]专利号CN113207010A从用户的历史长期播放记录中提取出用户偏好特征，从近期播放记录中提取出用户实时状态特征。根据用户特征数据与直播内容特征的匹配度...

【技术保护点】

【技术特征摘要】
1.一种视频推荐模型自适应增量训练方法，其特征在于：基于已经训练好的基础模型，对新增内容的相关模型参数进行强化训练，并对已在基础模型中训练完成的存量内容的相关参数进行调优，最后取得最终训练结果，其具体步骤如下：A、提取并划分样本数据：提取全量样本数据并将样本数据划分成多个不同功能的子集，供后续训练、测试使用；B、初始化新增内容的相关模型参数：利用至少包括内容标签的辅助信息对新增内容的相关模型参数进行初始化；C、自适应增量训练。2.根据权利要求1所述的一种视频推荐模型自适应增量训练方法，其特征在于,步骤A所述的提前并划分样本数据，其具体内容如下：A1、取得全量训练样本数据：提取T
‑
L至T
‑
1天内的全部用户播放视频内容信息，以用户粒度进行汇总；T为当前训练日期，L根据实际调节用于控制参与训练的数据量；A2、将全量训练样本数据划分：根据用户播放历史内容中是否包含新增内容，将全量样本数据划分为4个互斥的数据集合；4个互斥的数据集合为：TestSet1：从全部包含新增内容的样本数据中随机抽取一定比例P1作为1号验证集，用来验证模型对新增内容的预测效果，0<P1<1；TestSet2：从全部只包含存量内容的样本数据中随机抽取一定比例P2作为2号验证集，用来衡量模型在存量内容上的预测效果是否稳定，0<P2<1；TrainSet1：全部包含新增内容的样本数据中排除了TestSet1的其余数据的集合；TrainSet2：全部只包含存量内容的样本数据中排除了TestSet2的其余数据的集合。3.根据权利要求1所述的一种视频推荐模型自适应增量训练方法，其特征在于，步骤B所述的初始化新增内容的相关模型参数，其具体内容如下：B1、提取全部内容的标签：每个内容拥有一个大分类标签和多个题材标签；B2、筛选出每个新增内容的候选子集：针对每个新增内容，筛选出所有与其大分类标签值相同的存量内容作为候选子集；B3、计算候选子集中题材标签重合度：计算候选子集中每个内容与该新增内容的题材标签重合度，计算公式为same(x,y)代表两个内容题材标签重合的数量，|x|和|y|代表内容拥有的题材标签数量；B4、获取相似内容集合：选取题材标签重合度最大的K个存量内容，作为该新增内容的相似内容集合；B5、获取新增内容初始化参数：抽取B4求得的相似内容集合在基础模型中的对应参数，计算其平均值，以该平均值作为该新增内容的初始化参数。4.根据权利要求2所述的一种视频推荐模型自适应增量训练方法，其特征在于，步骤C所述的自适应增量训练，其具体内容如下：增量训练由多次重复的子训练过程组成，每轮子训练过程由训练样本提取模块、样本数据处理模块、模型训练模块、模型评估模块、训练控制模块5个部分配合完成；
子训练过程的执行流程如下：C1、训练样本提取模块：输入数据集TrainSet1、TrainSet2进行训练样本提取；C2、样本数据处理模块；C3、模型训练模块：所述模型训练模块为满足如下要求的算法模型，要求为：1.模型输入特征为用户历史收视内容，2.模型输出结果为预测目标内容；C4、模型评估模块：输入数据集TestSet1、TestSet2进行模型评估，输出模型评估结果；C5、训练控制模块：根据C4的模型评估结果执行后续流程，需要再次训练，执行步骤C1；无需再次训练，执行步骤C6；C6、输出模型并结束。5.根据权利要求4所述的一种视频推荐模型自适应增量训练方法，其特征在于，步骤C1所述的训练样本提取模块，其具体内容如下：将TrainSet1和TrainSet2均作为训练样本候选集输入训练样本提取模块；根据公式C
TrainSet2
＝α*|TrainSet2|对TrainSet2进行一定比例的采样，α是动态变化的采样比例系数，α初始值为0、最大值为将全部TrainSet1和部分采样的TrainSet2数据合并，并打乱重新排序，确保混合后的训练样本数据分布均衡。6.根据权利要求4所述的一种视频推荐模型自适应增量训练方法，其特征在于，步骤C2所述的样本数据处理模块，其具体内容如下：每一条样本数据包含了用户的收视内容历史序列，并按照播放时间先后排序，记为V＝{v1,v2,...,v
N
}，其中，N为用户观看内容总数；样本数据处理模块从每条样本数据中提取出收视特征和目标内容两个部分：收视特征为连续的内容序列V'＝{v1,v2,...,v
x
‑1}，其中1<＝x<＝N；目标内容为收视特征序列后的第一个内容v
x
；样本数据处理模块在处理每条样本数据时根据下述步骤提取更多新增内容作为目标内容：C2.1.计算获得随机值rand
x
，其中0<rand
x
<1；若rand
x
＞rand
filter
，则执行步骤2；反之，执行步骤5；0<rand
filter
<1；C2.2.计算获得V中所有新增内容所在的位置Pos＝{p1,p2,...,p
n
}；C2.3.从Pos中筛选出p
i
>p
min
的子集Pos
’
，其中p
min
是训练所需的最小收视序列长度；C2.4.从Pos
’
中随机选取一个p
x
，截取作为收视特征，作为目标内容；C2.5.针对只包含存量内容的样本数据以及不需要特殊处理的新增内容样本，计算获得随机整数值p
x
(p
min
<p
x
<＝N)，截取作为收视特征，作为目标内容。7.根据权利要求6所述的一种视频推荐模型自适应增量训练方法，其特征在于，C3所述的模型训练模块，采用BERT4Rec模型，其具体内容如下：
C3.1.将步骤C2中抽取合并后的训练样本数据以固定大小batch_size拆分为多个样本子集；C3.2.将第一个样本子集中的收视特征数据输入BERT4Rec模型，模型计算输出每一条样本对应用户在全部内容上的偏...

【专利技术属性】
技术研发人员：许鹭清，田泽康，邓卉，陈搏，
申请(专利权)人：易视腾科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人