【技术实现步骤摘要】
一种视频数据处理方法、装置、计算机设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种视频数据处理方法
、
装置
、
计算机设备及存储介质
。
技术介绍
[0002]随着计算机以及互联网技术的飞速发展,各类视频平台应运而生,特别是短视频平台已成为移动互联网应用中用户停留时间最长的应用类型
。
由于短视频的制作基本取决于视频博主,而推荐技术则由短视频平台提供,因此推荐技术对于短视频平台至关重要
。
通常,短视频平台的推荐系统针对留下了大量点击记录的短视频,能够根据短视频的标识特征
、
属性特征等视频特征数据正常地推断短视频的适用人群,从而准确地将短视频推荐给目标用户
。
然而,短视频平台上每天新发布的短视频越来越多,如何实现这些新加入的短视频的推荐,成为视频推荐中的重要问题
。
[0003]由于新加入的短视频缺少与用户的交互记录,导致标识特征缺失,这类短视频可以理解为冷启动视频,在进行冷启动视频的推荐时,现有的第一种方案通常是在训练推荐模型时用0掩码或随机掩码替换部分样本短视频的标识特征,以模拟实际遇到的新加入的短视频;第二种方案是学习从短视频的属性特征到标识特征的映射,也即是根据短视频的属性特征以及映射关系推导短视频的标识特征;然而,第一种方案会使得模型需要适应两种不同分布的输入,一种是短视频的标识特征的一般分布,另一种是0掩码或随机掩码的分布,难以得到准确的推荐效果;第二种方案中实际
【技术保护点】
【技术特征摘要】
1.
一种视频数据处理方法,其特征在于,所述方法包括:获取第一视频的视频特征数据以及至少一个对象的对象特征数据;调用视频匹配模型以及参考特征数据对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果;其中,所述视频匹配模型是基于训练样本以及第二神经网络对第一神经网络进行训练得到的,所述参考特征数据是基于多个第二视频的视频特征数据确定的;根据所述匹配结果从所述至少一个对象中确定目标对象,并向所述目标对象对应的终端设备发送所述第一视频
。2.
根据权利要求1所述的方法,其特征在于,所述视频特征数据包括标识特征以及属性特征集,所述调用视频匹配模型以及参考特征数据对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果,包括:将参考特征数据作为所述第一视频的视频特征数据中的标识特征,所述参考特征数据是基于所述多个第二视频的视频特征数据包括的标识特征确定的;调用所述视频匹配模型对所述第一视频的视频特征数据以及所述至少一个对象的对象特征数据进行处理,得到所述第一视频与所述至少一个对象中每个对象之间的匹配结果
。3.
根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取视频集合中存在点击记录的多个第二视频;从每个第二视频的视频特征数据中获取所述每个第二视频的标识特征;对所述多个第二视频的标识特征进行全局平均池化处理,得到所述参考特征数据
。4.
根据权利要求1所述的方法,其特征在于,所述视频匹配模型模型是通过如下方式训练的:获取训练样本,所述训练样本包括所述第二视频
、
所述第二视频对应的对象子集中的第一对象以及对象集合中除所述对象子集之外的第二对象;基于所述训练样本以及第二神经网络对第一神经网络进行训练,得到视频匹配模型;其中,所述第二神经网络是基于所述第一神经网络以及业务知识数据构建的,所述业务知识数据是基于视频点击记录生成的
。5.
根据权利要求4所述的方法,其特征在于,所述方法还包括:从所述训练样本包括的至少一个第二视频中确定预设数量的第二视频;将所述预设数量的第二视频的视频特征数据中的标识特征替换为所述参考特征数据
。6.
根据权利要求4或5所述的方法,其特征在于,所述视频点击记录包括至少一个点击数据元组,每个点击数据元组包括对象和视频,所述方法还包括:针对所述每个点击数据元组包括的第三对象和第三视频,从所述第三对象的对象特征数据中获取所述第三对象的属性特征集,以及从所述第三视频的视频特征数据中获取所述第三视频的属性特征集;根据所述第三对象的属性特征集以及所述第三视频的属性特征集,确定至少一个属性数据元组;获取每个属性数据元组对应的频次,并根据所述每个属性数据元组对应的频次从所述
至少一个属性数据元组中确定业务知识数据
。7.
根据权利要求4或5所述的方法,其特征在于,所述基于所述训练样本以及第二神经网络对第一神经网络进行训练,得到视频匹配模型,包括:调用第一神经网络获取所述第一对象与所述第二视频之间的第一预测匹配结果
、
所述第二对象与所述第二视频之间的第二预测匹配结果;基于第二神经网络包括的业务知识数据获取所述第一对象与所述第二视频之间的第三预测匹配结果
、
所述第二对象与所述第二视频之间的第四预测匹配结果;基于所述第一预测匹配结果
、
所述第二预测匹配结果
、
所述第三预测匹配结果
、
所述第四预测匹配结果以及目标损失函数,对所述第一神经网络的网络参数进行调整,并将网络参数调整后的第一神经网络作为视频匹配模型
。8.
根据权利要求7所述的方法,其特征在于,所述基于第二神经网络包括的业务知识数据获取所述第一对象与所述第二视频之间的第三预测匹配结果
、
所述第二对象与所述第二视频之间的第四预测匹配结果,包括:基于第二神经网络包括的业务知识数据对所述第一预测匹配结果进行校准处理,得到所述第一对象与所述第二视频之间的第三预测匹配结果...
【专利技术属性】
技术研发人员:陈昊,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。