模型训练与视频主题预测的方法、装置及设备制造方法及图纸

技术编号：32896289 阅读：11 留言：0更新日期：2022-04-07 11:44

本申请实施例提供一种模型训练与视频主题预测的方法、装置及设备，该训练方法包括：将第一视频的标题和封面图输入预测模型中，使得预测模型学习第一视频的标题信息和封面图信息，以得到第一视频的封面图标题特征向量。接着，根据第一视频的封面图标题特征向量，确定第一视频的分类预测值，并根据第一视频的分类预测值和第一视频的分类真值，对预测模型进行训练，使得训练后的预测模型充分学习到了第一视频深层次的封面图和标题的融合特征信息。使用该预测模型进行后期的视频主题确定时，可以根据该预测模型输出的封面图标题特征向量，准确确定出视频的主题。确确定出视频的主题。确确定出视频的主题。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练与视频主题预测的方法、装置及设备

[0001]本申请实施例涉及计算机
，尤其涉及一种模型训练与视频主题预测的方法、装置及设备。

技术介绍

[0002]随着短视频业务的发展，用户可以在各短视频播放平台上观看自己喜欢的短视频。目前各短视频播放平台包括各种主题的短视频，一个用户通常对某几类主题的短视频感兴趣。因此，为了精准向用户推荐短视频，则需要准确确定短视频的主题。
[0003]目前较常见的视频主题的确定方法是，基于用户行为的主题确定方法，具体是通过用户的点击消费记录确定视频间的相关性，例如一定数量的用户都看某两个视频，可推断出这两个视频可能有相同的受众，即这两个视频内容相关，进一步推断出这两个视频属于同一个聚类，具体相同的主题。
[0004]但是，由于用户喜好广泛，基于用户行为确定视频主题，会导致将内容不相关的视频确定为同一个主题，因此，基于用户行为确定的视频主题的准确性低。

技术实现思路

[0005]本申请实施例提供一种模型训练与视频主题预测的方法、装置及设备，以通过训练后的模型来准确预测视频的主题。
[0006]一方面，本申请实施例提供一种模型训练方法，包括：
[0007]从视频训练集中获取第一视频的标题和封面图；
[0008]将所述第一视频的标题和封面图输入预测模型中，得到所述第一视频的封面图标题特征向量；
[0009]根据所述第一视频的封面图标题特征向量，确定所述第一视频的分类预测值；
[0010]根据...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：从视频训练集中获取第一视频的标题和封面图；将所述第一视频的标题和封面图输入预测模型中，得到所述第一视频的封面图标题特征向量；根据所述第一视频的封面图标题特征向量，确定所述第一视频的分类预测值；根据所述第一视频的分类预测值和所述第一视频的分类真值，对所述预测模型进行训练，得到训练后的所述预测模型，所述预测模型用于预测视频的主题。2.根据权利要求1所述的方法，其特征在于，根据所述第一视频的封面图标题特征向量，确定所述第一视频的分类预测值，包括：将所述第一视频的封面图标题特征向量输入多任务学习模型中，得到所述多任务学习模型输出的所述第一视频的分类预测值。3.根据权利要求1所述的方法，其特征在于，所述预测模型包括文本识别模块和图像识别模块，所述将所述第一视频的标题和封面图输入预测模型中，得到所述第一视频的封面图标题特征向量，包括：将所述第一视频的标题输入所述文本识别模块中进行标题特征提取，得到所述第一视频的第一标题特征向量；将所述第一视频的封面图输入所述图像识别模块中进行图像特征提取，得到所述第一视频的第一封面图特征向量；根据所述第一视频的第一标题特征向量和第一封面图特征向量，得到所述第一视频的封面图标题特征向量。4.根据权利要求3所述的方法，其特征在于，所述根据所述第一视频的第一标题特征向量和第一封面图特征向量，得到所述第一视频的封面图标题特征向量，包括：将所述第一视频的第一标题特征向量和第一封面图特征向量映射至同一个语义空间中，得到特征维度相同的第二标题特征向量和第二封面图特征向量；将所述第二标题特征向量和所述第二封面图特征向量进行相加，得到所述第一视频的封面图标题特征向量。5.根据权利要求3所述的方法，其特征在于，所述预测模型还包括第一多层感知机MLP和第二MLP，所述根据所述第一视频的第一标题特征向量和第一封面图特征向量，得到所述第一视频的封面图标题特征向量，包括：将所述第一标题特征向量输入第一MLP进行空间和维度转换，得到所述第一视频的第二标题特征向量；将所述第一封面图特征向量输入第二MLP进行空间和维度转换，得到所述第一视频的第二封面图特征向量，其中所述第二封面图特征向量与所述第二标题特征向量的语义空间一致，且特征维度相同；将所述第二标题特征向量和所述第二封面图特征向量进行相加，得到所述第一视频的封面图标题特征向量。6.根据权利要求2所述的方法，其特征在于，所述将所述第一视频的封面图标题特征向量输入多任务学习模型中，得到所述多任务学习模型输出的所述第一视频的分类预测值，包括：
对所述第一视频的封面图标题特征向量进行特征归一化处理；将特征归一化处理后的所述第一视频的封面图标题特征向量，输入所述多任务学习模型中，得到所述多任务学习模型输出的所述第一视频的分类预测值。7.根据权利要求6所述的方法，其特征在于，所述对所述第一视频的封面图标题特征向量进行特征归一化处理，包括：将所述第一视频的封面图标题特征向量的欧几里得范数设定为1。8.根据权利要求1
‑
7任一项所述的方法，其特征在于，所述预测模型还包括标签特征预测模块，所述方法还包括：从所述视频训练集中获取视频的多个标签；将标签作为无向图的一个节点，将任意两个标签同时出现在一个视频中的出现次数作为所述无向图的边，构建所述无向图，所述无向图包括至少两个标签；根据所述无向图，...

【专利技术属性】
技术研发人员：何奕江，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人