一种视频数据处理方法技术

技术编号:39678572 阅读:9 留言:0更新日期:2023-12-11 18:56
本申请实施例提供了一种视频数据处理方法

【技术实现步骤摘要】
一种视频数据处理方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种视频数据处理方法

装置

计算机设备及存储介质


技术介绍

[0002]随着计算机以及互联网技术的飞速发展,各类视频平台应运而生,特别是短视频平台已成为移动互联网应用中用户停留时间最长的应用类型

由于短视频的制作基本取决于视频博主,而推荐技术则由短视频平台提供,因此推荐技术对于短视频平台至关重要

通常,短视频平台的推荐系统针对留下了大量点击记录的短视频,能够根据短视频的标识特征

属性特征等视频特征数据正常地推断短视频的适用人群,从而准确地将短视频推荐给目标用户

然而,短视频平台上每天新发布的短视频越来越多,如何实现这些新加入的短视频的推荐,成为视频推荐中的重要问题

[0003]由于新加入的短视频缺少与用户的交互记录,导致标识特征缺失,这类短视频可以理解为冷启动视频,在进行冷启动视频的推荐时,现有的第一种方案通常是在训练推荐模型时用0掩码或随机掩码替换部分样本短视频的标识特征,以模拟实际遇到的新加入的短视频;第二种方案是学习从短视频的属性特征到标识特征的映射,也即是根据短视频的属性特征以及映射关系推导短视频的标识特征;然而,第一种方案会使得模型需要适应两种不同分布的输入,一种是短视频的标识特征的一般分布,另一种是0掩码或随机掩码的分布,难以得到准确的推荐效果;第二种方案中实际的标识特征本身也是通过学习得到的,存在一定的误差;从短视频的属性特征到标识特征的映射的学习,也会产生一定的误差,由于会发生误差叠加,削弱了映射的准确性,也难以得到准确的推荐效果

可见,如何提高冷启动视频的推荐效果已成为亟待解决的问题


技术实现思路

[0004]本申请实施例提供一种视频数据处理方法

装置

计算机设备及存储介质,可以有效提高冷启动视频的推荐准确度,从而提升视频推荐效果

[0005]第一方面,本申请实施例提供了一种视频数据处理方法,所述方法包括:
[0006]获取第一视频的视频特征数据以及至少一个对象的对象特征数据

[0007]调用视频匹配模型以及参考特征数据对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果;其中,所述视频匹配模型是基于训练样本以及第二神经网络对第一神经网络进行训练得到的,所述参考特征数据是基于多个第二视频的视频特征数据确定的

[0008]根据所述匹配结果从所述至少一个对象中确定目标对象,并向所述目标对象对应的终端设备发送所述第一视频

[0009]可选的,上述训练样本是通过如下方式获取的:
[0010]获取视频点击记录

[0011]基于所述视频点击记录从视频集合中获取存在点击记录的至少一个第二视频

[0012]基于所述视频点击记录从所述对象集合中获取每个第二视频对应的对象子集

[0013]基于所述对象集合以及所述每个第二视频对应的对象子集确定训练样本

[0014]第二方面,本申请实施例提供了一种视频数据处理装置,所述装置包括:
[0015]获取模块,用于获取第一视频的视频特征数据以及至少一个对象的对象特征数据

[0016]处理模块,用于调用视频匹配模型以及参考特征数据对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果;其中,所述视频匹配模型是基于训练样本以及第二神经网络对第一神经网络进行训练得到的,所述参考特征数据是基于多个第二视频的视频特征数据确定的

[0017]所述处理模块,还用于根据所述匹配结果从所述至少一个对象中确定目标对象

[0018]发送模块,用于向所述目标对象对应的终端设备发送所述第一视频

[0019]第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器

网络接口和存储装置,所述处理器

所述网络接口和所述存储装置相互连接,其中,所述网络接口受所述处理器的控制用于收发数据,所述存储装置用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,用于执行第一方面所述的视频数据处理方法

[0020]第四方面,本申请实施例提供了一种计算机存储介质,该计算机存储介质中存储有程序指令,该程序指令被执行时,用于实现第一方面所述的视频数据处理方法

[0021]第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序被计算机处理器执行时,用于实现第一方面所述的视频数据处理方法

[0022]本申请实施例可以获取第一视频的视频特征数据以及至少一个对象的对象特征数据;调用视频匹配模型以及参考特征数据对第一视频的视频特征数据以及该至少一个对象的对象特征数据进行处理,得到第一视频与每个对象之间的匹配结果;其中,视频匹配模型是基于训练样本以及第二神经网络对第一神经网络进行训练得到的,参考特征数据是基于多个第二视频的视频特征数据确定的;根据匹配结果即可从至少一个对象中确定目标对象,并向目标对象对应的终端设备发送该第一视频,本申请通过利用点击数据较为丰富的一般视频
(
例如上述第二视频
)
的视频特征数据生成一般化的参考特征数据,并将参考特征数据用于点击数据缺乏的冷启动视频
(
例如上述第一视频
)
的处理,由于参考特征数据的分布与第二视频的视频特征数据的分布是一致的,视频匹配模型不会因为维护两种不同分布的输入而削弱准确率,从而保证视频匹配的准确度;并且,本申请通过第二神经网络指导第一神经网络的学习,引入了知识蒸馏学习框架,可以将第二神经网络的知识融入到第一神经网络当中,为冷启动视频的推荐引入额外信息,可以看出,本申请基于一般视频的视频特征数据以及知识蒸馏学习框架可以有效提高冷启动视频的推荐准确度,从而提升视频推荐效果

附图说明
[0023]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0024]图1是本申请实施例提供的一种视频数据处理系统的架构示意图;
[0025]图2是本申请实施例提供的一种视频数据处理方法的流程示意图;...

【技术保护点】

【技术特征摘要】
1.
一种视频数据处理方法,其特征在于,所述方法包括:获取第一视频的视频特征数据以及至少一个对象的对象特征数据;调用视频匹配模型以及参考特征数据对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果;其中,所述视频匹配模型是基于训练样本以及第二神经网络对第一神经网络进行训练得到的,所述参考特征数据是基于多个第二视频的视频特征数据确定的;根据所述匹配结果从所述至少一个对象中确定目标对象,并向所述目标对象对应的终端设备发送所述第一视频
。2.
根据权利要求1所述的方法,其特征在于,所述视频特征数据包括标识特征以及属性特征集,所述调用视频匹配模型以及参考特征数据对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果,包括:将参考特征数据作为所述第一视频的视频特征数据中的标识特征,所述参考特征数据是基于所述多个第二视频的视频特征数据包括的标识特征确定的;调用所述视频匹配模型对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果
。3.
根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取视频集合中存在点击记录的多个第二视频;从每个第二视频的视频特征数据中获取所述每个第二视频的标识特征;对所述多个第二视频的标识特征进行全局平均池化处理,得到所述参考特征数据
。4.
根据权利要求1所述的方法,其特征在于,所述视频匹配模型模型是通过如下方式训练的:获取训练样本,所述训练样本包括所述第二视频

所述第二视频对应的对象子集中的第一对象以及对象集合中除所述对象子集之外的第二对象;基于所述训练样本以及第二神经网络对第一神经网络进行训练,得到视频匹配模型;其中,所述第二神经网络是基于所述第一神经网络以及业务知识数据构建的,所述业务知识数据是基于视频点击记录生成的
。5.
根据权利要求4所述的方法,其特征在于,所述方法还包括:从所述训练样本包括的至少一个第二视频中确定预设数量的第二视频;将所述预设数量的第二视频的视频特征数据中的标识特征替换为所述参考特征数据
。6.
根据权利要求4或5所述的方法,其特征在于,所述视频点击记录包括至少一个点击数据元组,每个点击数据元组包括对象和视频,所述方法还包括:针对所述每个点击数据元组包括的第三对象和第三视频,从所述第三对象的对象特征数据中获取所述第三对象的属性特征集,以及从所述第三视频的视频特征数据中获取所述第三视频的属性特征集;根据所述第三对象的属性特征集以及所述第三视频的属性特征集,确定至少一个属性数据元组;获取每个属性数据元组对应的频次,并根据所述每个属性数据元组对应的频次从所述
至少一个属性数据元组中确定业务知识数据
。7.
根据权利要求4或5所述的方法,其特征在于,所述基于所述训练样本以及第二神经网络对第一神经网络进行训练,得到视频匹配模型,包括:调用第一神经网络获取所述第一对象与所述第二视频之间的第一预测匹配结果

所述第二对象与所述第二视频之间的第二预测匹配结果;基于第二神经网络包括的业务知识数据获取所述第一对象与所述第二视频之间的第三预测匹配结果

所述第二对象与所述第二视频之间的第四预测匹配结果;基于所述第一预测匹配结果

所述第二预测匹配结果

所述第三预测匹配结果

所述第四预测匹配结果以及目标损失函数,对所述第一神经网络的网络参数进行调整,并将网络参数调整后的第一神经网络作为视频匹配模型
。8.
根据权利要求7所述的方法,其特征在于,所述基于第二神经网络包括的业务知识数据获取所述第一对象与所述第二视频之间的第三预测匹配结果

所述第二对象与所述第二视频之间的第四预测匹配结果,包括:基于第二神经网络包括的业务知识数据对所述第一预测匹配结果进行校准处理,得到所述第一对象与所述第二视频之间的第三预测匹配结果...

【专利技术属性】
技术研发人员:陈昊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1