模型训练与视频主题预测的方法、装置及设备制造方法及图纸

技术编号:32896289 阅读:11 留言:0更新日期:2022-04-07 11:44
本申请实施例提供一种模型训练与视频主题预测的方法、装置及设备,该训练方法包括:将第一视频的标题和封面图输入预测模型中,使得预测模型学习第一视频的标题信息和封面图信息,以得到第一视频的封面图标题特征向量。接着,根据第一视频的封面图标题特征向量,确定第一视频的分类预测值,并根据第一视频的分类预测值和第一视频的分类真值,对预测模型进行训练,使得训练后的预测模型充分学习到了第一视频深层次的封面图和标题的融合特征信息。使用该预测模型进行后期的视频主题确定时,可以根据该预测模型输出的封面图标题特征向量,准确确定出视频的主题。确确定出视频的主题。确确定出视频的主题。

【技术实现步骤摘要】
模型训练与视频主题预测的方法、装置及设备


[0001]本申请实施例涉及计算机
,尤其涉及一种模型训练与视频主 题预测的方法、装置及设备。

技术介绍

[0002]随着短视频业务的发展,用户可以在各短视频播放平台上观看自己喜欢 的短视频。目前各短视频播放平台包括各种主题的短视频,一个用户通常对 某几类主题的短视频感兴趣。因此,为了精准向用户推荐短视频,则需要准 确确定短视频的主题。
[0003]目前较常见的视频主题的确定方法是,基于用户行为的主题确定方法, 具体是通过用户的点击消费记录确定视频间的相关性,例如一定数量的用户 都看某两个视频,可推断出这两个视频可能有相同的受众,即这两个视频内 容相关,进一步推断出这两个视频属于同一个聚类,具体相同的主题。
[0004]但是,由于用户喜好广泛,基于用户行为确定视频主题,会导致将内容 不相关的视频确定为同一个主题,因此,基于用户行为确定的视频主题的准 确性低。

技术实现思路

[0005]本申请实施例提供一种模型训练与视频主题预测的方法、装置及设备, 以通过训练后的模型来准确预测视频的主题。
[0006]一方面,本申请实施例提供一种模型训练方法,包括:
[0007]从视频训练集中获取第一视频的标题和封面图;
[0008]将所述第一视频的标题和封面图输入预测模型中,得到所述第一视频的 封面图标题特征向量;
[0009]根据所述第一视频的封面图标题特征向量,确定所述第一视频的分类预 测值;
[0010]根据所述第一视频的分类预测值和所述第一视频的分类真值,对所述预 测模型进行训练,得到训练后的所述预测模型,所述预测模型用于预测视频 的主题。
[0011]在一些实施例中,上述方法还包括:
[0012]对所述多任务学习模型中的输入层进行归一化处理;
[0013]所述将特征归一化处理后的所述第一视频的封面图标题特征向量,输入 所述多任务学习模型中,包括:
[0014]将特征归一化处理后的所述第一视频的封面图标题特征向量,输入所述 输入层归一化后的所述多任务学习模型中。
[0015]在一些实施例中,上述对所述多任务学习模型中的输入层进行归一化处 理,包括:
[0016]将所述多任务学习模型的输入层参数的欧几里得范数设定为1。
[0017]在一些实施例中,上述根据所述无向图,确定标签序列,包括:使用 node2vec方式,在所述无向图上进行游走,得到所述标签序列。
[0018]另一方面,本申请实施例提供一种视频主题预测方法,包括:
[0019]获取待处理的目标视频的标题和封面图;
[0020]将所述目标视频的标题和封面图输入训练后的预测模型中,得到所述目 标视频的封面图标题特征向量;
[0021]根据预测的所述目标视频的封面图标题特征向量,确定所述目标视频所 属的目标分类;
[0022]将所述目标分类对应的主题,确定为所述目标视频的主题。
[0023]在一些实施例中,预测模型包括文本识别模块和图像识别模块;其中, 文本识别模块用于对所述目标视频的标题进行标题特征提取,输出所述目标 视频的第一标题特征向量,所述图像识别模块用于对所述目标视频的封面图 进行图像特征提取,输出所述目标视频的第一封面图特征向量,所述目标视 频的封面图标题特征向量是根据所述目标视频的第一标题特征向量和第一封 面图特征向量确定的。
[0024]在一些实施例中,上述目标视频的封面图标题特征向量是通过将所述目 标视频的第一标题特征向量和第一封面图特征向量映射至同一个语义空间中, 进而得到特征维度相同的第二标题特征向量和第二封面图特征向量,并将所 述第二标题特征向量和所述第二封面图特征向量进行相加后得到的。
[0025]在一些实施例中,上述预测模型还包括第一MLP和第二MLP;
[0026]其中,第一MLP用于对所述目标视频的第一标题特征向量进行空间和维 度转换并输出所述目标视频的第二标题特征向量;第二MLP用于对所述目标 视频的第一封面图特征向量进行空间和维度转换并输出所述目标视频的第二 封面图特征向量。
[0027]在一些实施例中,上述目标视频的封面图标题特征向量是通过将所述第 一MLP输出的第二标题特征向量和所述第二MLP输出的第二封面图特征向 量进行相加后得到的。
[0028]在一些实施例中,上述根据所述无向图,确定标签序列,包括:使用 node2vec方式,在所述无向图上进行游走,得到所述标签序列。
[0029]在一些实施例中,上述根据所述目标视频的融合特征向量,确定所述目 标视频所属的目标分类,包括:根据所述目标视频的融合特征向量,确定所 述目标视频的融合特征向量与参考集中K个聚类中心中每个聚类中心的特征 向量之间的距离;将最小距离对应的聚类中心所属的类别,确定为所述目标 视频所属的目标分类。
[0030]另一方面,本申请实施例提供一种模型训练装置,包括:
[0031]获取单元,用于从视频训练集中获取第一视频的标题和封面图;
[0032]训练单元,用于将所述第一视频的标题和封面图输入预测模型中,得到 所述第一视频的封面图标题特征向量;根据所述第一视频的封面图标题特征 向量,确定所述第一视频的分类预测值;根据所述第一视频的分类预测值和 所述第一视频的分类真值,对所述预测模型进行训练,得到训练后的所述预 测模型,所述预测模型用于预测视频的主题。
[0033]另一方面,本申请实施例提供一种视频主题预测装置,包括:
[0034]获取单元,用于获取待处理的目标视频的标题和封面图;
[0035]第一确定单元,用于将所述目标视频的标题和封面图输入训练后的预测 模型中,得到所述目标视频的封面图标题特征向量;
[0036]分类单元,用于根据预测的所述目标视频的封面图标题特征向量,确定 所述目标
视频所属的目标分类;将所述目标分类对应的主题,确定为所述目 标视频的主题。
[0037]另一方面,本申请实施例提供一种计算设备,包括处理器和存储器;
[0038]所述存储器,用于存储计算机程序;
[0039]所述处理器,用于执行所述计算机程序以实现上述第一方面和/或第二方 面所述的方法。
[0040]另一方面,本申请实施例提供了一种计算机可读存储介质,所述存储介 质包括计算机程序,当所述计算机程序被计算设备执行时,使得所述计算设 备实现如第一方面和/或第二方面所述的方法。
[0041]另一方面,本申请实施例提供一种计算机程序产品,所述程序产品包括 计算机程序,所述计算机程序存储在可读存储介质中,计算设备的至少一个 处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器 执行所述计算机程序使得计算设备实施第一方面和/或第二方面所述的方法。
[0042]基于本申请实施例提供的技术方案,通过将第一视频的标题和封面图输 入预测模型中,使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:从视频训练集中获取第一视频的标题和封面图;将所述第一视频的标题和封面图输入预测模型中,得到所述第一视频的封面图标题特征向量;根据所述第一视频的封面图标题特征向量,确定所述第一视频的分类预测值;根据所述第一视频的分类预测值和所述第一视频的分类真值,对所述预测模型进行训练,得到训练后的所述预测模型,所述预测模型用于预测视频的主题。2.根据权利要求1所述的方法,其特征在于,根据所述第一视频的封面图标题特征向量,确定所述第一视频的分类预测值,包括:将所述第一视频的封面图标题特征向量输入多任务学习模型中,得到所述多任务学习模型输出的所述第一视频的分类预测值。3.根据权利要求1所述的方法,其特征在于,所述预测模型包括文本识别模块和图像识别模块,所述将所述第一视频的标题和封面图输入预测模型中,得到所述第一视频的封面图标题特征向量,包括:将所述第一视频的标题输入所述文本识别模块中进行标题特征提取,得到所述第一视频的第一标题特征向量;将所述第一视频的封面图输入所述图像识别模块中进行图像特征提取,得到所述第一视频的第一封面图特征向量;根据所述第一视频的第一标题特征向量和第一封面图特征向量,得到所述第一视频的封面图标题特征向量。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一视频的第一标题特征向量和第一封面图特征向量,得到所述第一视频的封面图标题特征向量,包括:将所述第一视频的第一标题特征向量和第一封面图特征向量映射至同一个语义空间中,得到特征维度相同的第二标题特征向量和第二封面图特征向量;将所述第二标题特征向量和所述第二封面图特征向量进行相加,得到所述第一视频的封面图标题特征向量。5.根据权利要求3所述的方法,其特征在于,所述预测模型还包括第一多层感知机MLP和第二MLP,所述根据所述第一视频的第一标题特征向量和第一封面图特征向量,得到所述第一视频的封面图标题特征向量,包括:将所述第一标题特征向量输入第一MLP进行空间和维度转换,得到所述第一视频的第二标题特征向量;将所述第一封面图特征向量输入第二MLP进行空间和维度转换,得到所述第一视频的第二封面图特征向量,其中所述第二封面图特征向量与所述第二标题特征向量的语义空间一致,且特征维度相同;将所述第二标题特征向量和所述第二封面图特征向量进行相加,得到所述第一视频的封面图标题特征向量。6.根据权利要求2所述的方法,其特征在于,所述将所述第一视频的封面图标题特征向量输入多任务学习模型中,得到所述多任务学习模型输出的所述第一视频的分类预测值,包括:
对所述第一视频的封面图标题特征向量进行特征归一化处理;将特征归一化处理后的所述第一视频的封面图标题特征向量,输入所述多任务学习模型中,得到所述多任务学习模型输出的所述第一视频的分类预测值。7.根据权利要求6所述的方法,其特征在于,所述对所述第一视频的封面图标题特征向量进行特征归一化处理,包括:将所述第一视频的封面图标题特征向量的欧几里得范数设定为1。8.根据权利要求1

7任一项所述的方法,其特征在于,所述预测模型还包括标签特征预测模块,所述方法还包括:从所述视频训练集中获取视频的多个标签;将标签作为无向图的一个节点,将任意两个标签同时出现在一个视频中的出现次数作为所述无向图的边,构建所述无向图,所述无向图包括至少两个标签;根据所述无向图,...

【专利技术属性】
技术研发人员:何奕江
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1