一种视频推荐模型自适应增量训练方法技术

技术编号:32854184 阅读:17 留言:0更新日期:2022-03-30 19:21
本发明专利技术公开了一种视频推荐模型自适应增量训练方法,基于基础模型,对新增内容进行强化训练,并对存量内容进行调优,取得最终训练结果,其具体步骤如下:提取并划分样本数据、初始化新增内容的相关模型参数、自适应增量训练。本发明专利技术设计了一种自适应调整的增量训练方法,可以有效减少训练数据量,兼顾新增内容和存量内容的预测效果,自动寻找最佳的训练结果,根据训练状态动态调整子训练重复次数,有效缩短了训练时长。本发明专利技术基于已经训练好的模型进行增量训练相比全量训练耗时更短、增量训练效率更高且效果相对更佳的优点。练效率更高且效果相对更佳的优点。练效率更高且效果相对更佳的优点。

【技术实现步骤摘要】
一种视频推荐模型自适应增量训练方法


[0001]本专利技术涉及视频内容推荐
,特别是视频推荐模型自适应增量训练方法。

技术介绍

[0002]视频内容推荐技术通过挖掘用户的收视行为,发掘用户的兴趣偏好,为每个用户提供个性化的内容建议,帮助用户更快更好的寻找到喜爱的视频内容。近些年来,随着计算机计算能力和存储能力的大幅度提升,深度学习技术在视频推荐领域得到了越来越多的研究与应用。
[0003]相较传统的机器学习算法,深度学习基于海量的数据规模与复杂的模型结构,在推荐效果上优势明显。与此同时,深度学习模型的训练过程也需要耗费更多的硬件资源和时间成本。随着用户数据量的不断增加和算法模型的不断的演化,模型的训练成本越发沉重。所以,如何节约训练成本,如何有效的增量训练,开始得到更多的关注。
[0004]用户的历史收视行为充分反映了用户对视频内容的偏好,大部分视频推荐算法模型基于用户历史观看的内容集合,试图挖掘出内容特性和用户收视行为的规律性,进而得到用户的精准偏好,预测出用户下一个想看的内容。
[0005]专利公开号CN113268633A提取每位样本用户的视频点击序列,拆分为历史点击序列和目标视频,并计算每个用户对目标视频的观看深度。最终基于样本用户的目标视频、历史点击序列、用户属性特征、观看深度等特征数据构建视频推荐模型。
[0006]专利号CN113207010A从用户的历史长期播放记录中提取出用户偏好特征,从近期播放记录中提取出用户实时状态特征。根据用户特征数据与直播内容特征的匹配度确定推荐候选列表,再根据用户历史行为确定用户对推荐候选列表的反馈,进而构建出基于排序的有监督学习模型。
[0007]目前大部分推荐技术都专注在提取更多的用户数据、构建更复杂的模型以获得更好的推荐效果,模型训练通常采用简单的定期全量更新的方式。但在实际工业应用领域,面对百万甚至千万级别的用户数据,千万甚至上亿规模的模型参数,每一次全量的模型训练都需要耗费很长时间。增量训练作为基于已有模型进行小数据量快速训练的方案,具有很高的实用价值。
[0008]现有的增量训练相关专利大多是针对某种特定的推荐算法进行改进。
[0009]专利号CN112437349A针对矩阵分解算法,设计了一种基于二次矩阵抽样的增量计算方法:首先抽取与新增用户或物品相关的原始评分,形成稀疏性较低的子矩阵;再对热门项目进行第二次抽样,形成维度较低的子矩阵,降低算法时间复杂度和计算开销,加快模型训练速度。
[0010]专利号CN110807153A提出了一种通用的增量训练思路:复用前一次训练出现过的内容或者用户特征向量,只对于新增内容或用户数据随机初始化,并且训练时只使用近期的数据而非全部数据。这种方法虽然可以减少增量训练的计算量,但是效果却难以得到保证。
[0011]目前有关增量训练方法的研究并不多,大多推荐算法模型均采用全量训练的方式,即每次训练时初始化模型的全部参数,并使用全部的样本数据对模型参数进行训练更新。随着用户数据量的急速增长和模型复杂度的不断增加,每次训练都需要耗费数小时甚至数天,导致模型无法及时更新,新上线的内容或是用户新的兴趣点无法及时体现到模型中,从而影响到模型的推荐效果。
[0012]此外,样本数据的更新比例是有限的,例如在电视大屏场景下,每天新上线的内容大约只有几百个,大部分内容相关的模型参数都已经在之前的训练中完成。如果每次都重新初始化全部参数再训练,实际是浪费了大量的计算资源。
[0013]虽然有部分技术方案提出可以只对新增内容或新用户数据进行随机初始化,并只采用近期新增数据进行训练,但是该方案有以下两个缺点:
[0014]1.随机初始化的部分参数,可能与模型中其余已训练的参数拥有不同的分布特征,合并后二次训练过程中,模型需要耗费更多的训练成本来平衡新旧参数的分布差异,导致训练效率的降低;
[0015]2.只使用新增的样本数据进行训练,可以让新增内容相关的模型参数得到充分训练,但也可能导致模型更“偏向”于新的内容,“老”内容的相关参数反而会在增量训练时受到干扰,最终影响到整体的推荐效果,顾此失彼;
[0016]所以,现有的视频推荐模型存在全量训练耗时长、增量训练效率低且效果不佳的问题。

技术实现思路

[0017]本专利技术的目的在于,提供一种视频推荐模型自适应增量训练方法。本专利技术基于已经训练好的模型进行增量训练相比全量训练耗时更短、增量训练效率更高且效果相对更佳的优点。
[0018]本专利技术的技术方案:一种视频推荐模型自适应增量训练方法,基于已经训练好的基础模型,对新增内容的相关模型参数进行强化训练,并对已在基础模型中训练完成的存量内容的相关参数进行调优,最后取得最终训练结果,其具体步骤如下:
[0019]A、提取并划分样本数据:提取全量样本数据并将样本数据划分成多个不同功能的子集,供后续训练、测试使用;
[0020]B、初始化新增内容的相关模型参数:利用至少包括内容标签的辅助信息对新增内容的相关模型参数进行初始化;
[0021]C、自适应增量训练。
[0022]前述的视频推荐模型自适应增量训练方法中,步骤A所述的提前并划分样本数据,其具体内容如下:
[0023]A1、取得全量训练样本数据:提取T

L至T

1天内的全部用户播放视频内容信息,以用户粒度进行汇总;T为当前训练日期,L根据实际调节用于控制参与训练的数据量;
[0024]A2、将全量训练样本数据划分:根据用户播放历史内容中是否包含新增内容,将全量样本数据划分为4个互斥的数据集合;
[0025]4个互斥的数据集合为:
[0026]TestSet1:从全部包含新增内容的样本数据中随机抽取一定比例 P1作为1号验证
集,用来验证模型对新增内容的预测效果,0<P1<1,一般P1不高于0.2;
[0027]TestSet2:从全部只包含存量内容的样本数据中随机抽取一定比例P2作为2号验证集,用来衡量模型在存量内容上的预测效果是否稳定,0<P2<1,一般P2不高于0.2;
[0028]TrainSet1:全部包含新增内容的样本数据中排除了TestSet1 的其余数据的集合;
[0029]TrainSet2:全部只包含存量内容的样本数据中排除了TestSet2 的其余数据的集合。
[0030]前述的视频推荐模型自适应增量训练方法中,步骤B所述的初始化新增内容的相关模型参数,存量内容相关的模型参数已经在基础模型中训练完成,所以可直接抽取基础模型中的对应参数作为增量训练模型的初始化参数;
[0031]存量内容相关模型参数与特定模型结构相关,以BERT4Rec模型为例,内容相关的模型参数包括:1)内容ID的Embedding层参数、 2)用户对所有内容兴趣分布输出层的softmax参数;
[0032]初本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频推荐模型自适应增量训练方法,其特征在于:基于已经训练好的基础模型,对新增内容的相关模型参数进行强化训练,并对已在基础模型中训练完成的存量内容的相关参数进行调优,最后取得最终训练结果,其具体步骤如下:A、提取并划分样本数据:提取全量样本数据并将样本数据划分成多个不同功能的子集,供后续训练、测试使用;B、初始化新增内容的相关模型参数:利用至少包括内容标签的辅助信息对新增内容的相关模型参数进行初始化;C、自适应增量训练。2.根据权利要求1所述的一种视频推荐模型自适应增量训练方法,其特征在于,步骤A所述的提前并划分样本数据,其具体内容如下:A1、取得全量训练样本数据:提取T

L至T

1天内的全部用户播放视频内容信息,以用户粒度进行汇总;T为当前训练日期,L根据实际调节用于控制参与训练的数据量;A2、将全量训练样本数据划分:根据用户播放历史内容中是否包含新增内容,将全量样本数据划分为4个互斥的数据集合;4个互斥的数据集合为:TestSet1:从全部包含新增内容的样本数据中随机抽取一定比例P1作为1号验证集,用来验证模型对新增内容的预测效果,0<P1<1;TestSet2:从全部只包含存量内容的样本数据中随机抽取一定比例P2作为2号验证集,用来衡量模型在存量内容上的预测效果是否稳定,0<P2<1;TrainSet1:全部包含新增内容的样本数据中排除了TestSet1的其余数据的集合;TrainSet2:全部只包含存量内容的样本数据中排除了TestSet2的其余数据的集合。3.根据权利要求1所述的一种视频推荐模型自适应增量训练方法,其特征在于,步骤B所述的初始化新增内容的相关模型参数,其具体内容如下:B1、提取全部内容的标签:每个内容拥有一个大分类标签和多个题材标签;B2、筛选出每个新增内容的候选子集:针对每个新增内容,筛选出所有与其大分类标签值相同的存量内容作为候选子集;B3、计算候选子集中题材标签重合度:计算候选子集中每个内容与该新增内容的题材标签重合度,计算公式为same(x,y)代表两个内容题材标签重合的数量,|x|和|y|代表内容拥有的题材标签数量;B4、获取相似内容集合:选取题材标签重合度最大的K个存量内容,作为该新增内容的相似内容集合;B5、获取新增内容初始化参数:抽取B4求得的相似内容集合在基础模型中的对应参数,计算其平均值,以该平均值作为该新增内容的初始化参数。4.根据权利要求2所述的一种视频推荐模型自适应增量训练方法,其特征在于,步骤C所述的自适应增量训练,其具体内容如下:增量训练由多次重复的子训练过程组成,每轮子训练过程由训练样本提取模块、样本数据处理模块、模型训练模块、模型评估模块、训练控制模块5个部分配合完成;
子训练过程的执行流程如下:C1、训练样本提取模块:输入数据集TrainSet1、TrainSet2进行训练样本提取;C2、样本数据处理模块;C3、模型训练模块:所述模型训练模块为满足如下要求的算法模型,要求为:1.模型输入特征为用户历史收视内容,2.模型输出结果为预测目标内容;C4、模型评估模块:输入数据集TestSet1、TestSet2进行模型评估,输出模型评估结果;C5、训练控制模块:根据C4的模型评估结果执行后续流程,需要再次训练,执行步骤C1;无需再次训练,执行步骤C6;C6、输出模型并结束。5.根据权利要求4所述的一种视频推荐模型自适应增量训练方法,其特征在于,步骤C1所述的训练样本提取模块,其具体内容如下:将TrainSet1和TrainSet2均作为训练样本候选集输入训练样本提取模块;根据公式C
TrainSet2
=α*|TrainSet2|对TrainSet2进行一定比例的采样,α是动态变化的采样比例系数,α初始值为0、最大值为将全部TrainSet1和部分采样的TrainSet2数据合并,并打乱重新排序,确保混合后的训练样本数据分布均衡。6.根据权利要求4所述的一种视频推荐模型自适应增量训练方法,其特征在于,步骤C2所述的样本数据处理模块,其具体内容如下:每一条样本数据包含了用户的收视内容历史序列,并按照播放时间先后排序,记为V={v1,v2,...,v
N
},其中,N为用户观看内容总数;样本数据处理模块从每条样本数据中提取出收视特征和目标内容两个部分:收视特征为连续的内容序列V'={v1,v2,...,v
x
‑1},其中1<=x<=N;目标内容为收视特征序列后的第一个内容v
x
;样本数据处理模块在处理每条样本数据时根据下述步骤提取更多新增内容作为目标内容:C2.1.计算获得随机值rand
x
,其中0<rand
x
<1;若rand
x
>rand
filter
,则执行步骤2;反之,执行步骤5;0<rand
filter
<1;C2.2.计算获得V中所有新增内容所在的位置Pos={p1,p2,...,p
n
};C2.3.从Pos中筛选出p
i
>p
min
的子集Pos

,其中p
min
是训练所需的最小收视序列长度;C2.4.从Pos

中随机选取一个p
x
,截取作为收视特征,作为目标内容;C2.5.针对只包含存量内容的样本数据以及不需要特殊处理的新增内容样本,计算获得随机整数值p
x
(p
min
<p
x
<=N),截取作为收视特征,作为目标内容。7.根据权利要求6所述的一种视频推荐模型自适应增量训练方法,其特征在于,C3所述的模型训练模块,采用BERT4Rec模型,其具体内容如下:
C3.1.将步骤C2中抽取合并后的训练样本数据以固定大小batch_size拆分为多个样本子集;C3.2.将第一个样本子集中的收视特征数据输入BERT4Rec模型,模型计算输出每一条样本对应用户在全部内容上的偏...

【专利技术属性】
技术研发人员:许鹭清田泽康邓卉陈搏
申请(专利权)人:易视腾科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1