视频推荐方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21917713 阅读:16 留言:0更新日期:2019-08-21 13:36
本发明专利技术公开了一种视频推荐方法、装置、计算机设备及存储介质,属于机器学习领域。该方法包括:将视频输入第一特征提取网络,对该视频中的至少一个连续视频帧进行特征提取,输出该视频的视频特征;将用户的用户数据输入第二特征提取网络,对离散的该用户数据进行特征提取,输出该用户的用户特征;基于该视频特征和该用户特征进行特征融合,得到对该用户推荐该视频的推荐概率;根据该推荐概率,确定是否对该用户推荐该视频。本发明专利技术对于用户特征和视频特征,采用不同的网络进行特征提取,避免了丢失用户特征和视频特征中的信息,提高了视频推荐的准确度。

Video recommendation methods, devices, computer equipment and storage media

【技术实现步骤摘要】
视频推荐方法、装置、计算机设备及存储介质
本专利技术涉及机器学习领域,特别涉及一种视频推荐方法、装置、计算机设备及存储介质。
技术介绍
随着网络技术的发展,越来越多的用户能够通过终端随时地观看视频,服务器可以从海量的视频数据库中为用户推荐一些用户可能感兴趣的视频,从而能够更好的满足用户的视频观看需求。在推荐过程中,服务器可以基于注意力协同(attentivecollaborativefiltering,ACT)模型提取视频库中任一视频与用户之间的联合特征,对视频库中的每个视频重复执行上述步骤,获取到与多个视频对应的多个联合特征,进一步根据多个联合特征在两两之间的欧几里得距离,得到所有联合特征的排序,从而将排序靠前的联合特征所对应的视频推荐给用户。然而,由于用户特征通常种类多、维度低,而视频特征通常种类少、维度高,可见用户特征与视频特征的性质差别巨大,而在上述ACT模型中,由于用户特征与视频特征的性质差别,会容易丢失用户特征和视频特征中的信息,还容易引发ACT模型的梯度弥散,影响了视频推荐的准确度。
技术实现思路
本专利技术实施例提供了一种视频推荐方法、装置、计算机设备及存储介质,能够解决ACT模型丢失用户特征和视频特征中的信息,导致视频推荐准确度低的问题。该技术方案如下:一方面,提供了一种视频推荐方法,该方法包括:将视频输入第一特征提取网络,通过该第一特征提取网络对该视频中的至少一个连续视频帧进行特征提取,输出该视频的视频特征;将用户的用户数据输入第二特征提取网络,通过该第二特征提取网络对离散的该用户数据进行特征提取,输出该用户的用户特征;基于该视频特征和该用户特征进行特征融合,得到对该用户推荐该视频的推荐概率;根据该推荐概率,确定是否对该用户推荐该视频。在一种可能实施方式中,对该文本的宽度特征和该文本的深度特征进行特征融合,得到与该视频对应的文本特征包括:通过全连接层对该文本的宽度特征和该文本的深度特征进行级联,得到该与该视频对应的文本特征。在一种可能实施方式中,根据该推荐概率,确定是否对该用户推荐该视频包括:当该推荐概率大于概率阈值时,确定为该用户推荐该视频;当该推荐概率小于或等于该概率阈值时,确定不为该用户推荐该视频。在一种可能实施方式中,根据该推荐概率,确定是否对该用户推荐该视频包括:对多个视频中的每个视频,重复执行生成推荐概率的操作,得到多个推荐概率;获取该推荐概率在该多个推荐概率中从大到小的概率排序,当该概率排序小于或等于目标阈值时,确定为该用户推荐该视频;当该概率排序大于该目标阈值时,确定不为该用户推荐该视频。一方面,提供了一种推荐视频展示方法,该方法包括:显示视频展示界面,该视频展示界面中包括至少一个第一推荐视频;当检测到用户对任一第一推荐视频的点击操作时,响应于该点击操作,将该第一推荐视频的观看记录发送至服务器,该观看记录用于该服务器对视频推荐模型进行优化训练,并实时返回至少一个第二推荐视频的视频信息;当接收到该至少一个第二推荐视频的视频信息时,基于该至少一个第二推荐视频的视频信息,在该视频展示界面中展示该至少一个第二推荐视频。一方面,提供了一种视频推荐装置,该装置包括:第一输出模块,用于将视频输入第一特征提取网络,通过该第一特征提取网络对该视频中的至少一个连续视频帧进行特征提取,输出该视频的视频特征;第二输出模块,用于将用户的用户数据输入第二特征提取网络,通过该第二特征提取网络对离散的该用户数据进行特征提取,输出该用户的用户特征;融合得到模块,用于基于该视频特征和该用户特征进行特征融合,得到对该用户推荐该视频的推荐概率;确定推荐模块,用于根据该推荐概率,确定是否对该用户推荐该视频。在一种可能实施方式中,该第一输出模块包括:卷积提取单元,用于将该视频中的该至少一个连续视频帧分别输入该第一特征提取网络中的时间卷积网络和卷积神经网络,通过该时间卷积网络和该卷积神经网络对该至少一个连续视频帧进行卷积处理,提取该视频的视频特征。在一种可能实施方式中,该卷积提取单元包括:因果卷积子单元,用于将该至少一个连续视频帧所包括的至少一个图像帧输入该时间卷积网络,通过该时间卷积网络对该至少一个图像帧进行因果卷积,得到该视频的图像特征;卷积处理子单元,用于将该至少一个连续视频帧所包括的至少一个音频帧输入该卷积神经网络,通过该卷积神经网络对该至少一个音频帧进行卷积处理,得到该视频的音频特征;融合子单元,用于将该视频的图像特征与该视频的音频特征进行特征融合,得到该视频的视频特征。在一种可能实施方式中,该融合子单元用于:将该视频的图像特征与该视频的音频特征进行双线性汇合处理,得到该视频的视频特征。在一种可能实施方式中,该第二输出模块包括:第一输入单元,用于将该用户的用户数据输入该第二特征提取网络;第一线性组合单元,用于通过该第二特征提取网络中的宽度部分,对离散的该用户数据进行广义线性组合,得到该用户的宽度特征;第一嵌入卷积单元,用于通过该第二特征提取网络中的深度部分,对离散的该用户数据进行嵌入处理和卷积处理,得到该用户的深度特征;第一融合单元,用于对该用户的宽度特征和该用户的深度特征进行特征融合,得到该用户的用户特征。在一种可能实施方式中,该第一融合单元用于:通过全连接层对该用户的宽度特征和该用户的深度特征进行级联,得到该用户的用户特征。在一种可能实施方式中,该融合得到模块用于:对该视频特征和该用户特征进行点乘处理,得到对该用户推荐该视频的推荐概率。在一种可能实施方式中,该装置还包括:第三输入模块,用于将与该视频对应的文本输入第三特征提取网络,通过该第三特征提取网络对离散的该文本进行特征提取,输出与该视频对应的文本特征。在一种可能实施方式中,该第三输入模块包括:第二输入单元,用于将该文本输入该第三特征提取网络;第二线性组合单元,用于通过该第三特征提取网络中的宽度部分,对离散的该文本进行广义线性组合,得到该文本的宽度特征;第二嵌入卷积单元,用于通过该第三特征提取网络中的深度部分,对离散的该文本进行嵌入处理和卷积处理,得到该文本的深度特征;第二融合单元,用于对该文本的宽度特征和该文本的深度特征进行特征融合,得到与该视频对应的文本特征。在一种可能实施方式中,该第二融合单元用于:通过全连接层对该文本的宽度特征和该文本的深度特征进行级联,得到该与该视频对应的文本特征。在一种可能实施方式中,该融合得到模块包括:第三融合单元,用于对该视频特征和该用户特征进行特征融合,得到该视频与该用户之间的第一关联特征;该第三融合单元,还用于对该文本特征和该用户特征进行特征融合,得到该文本与该用户之间的第二关联特征;点乘单元,用于对该第一关联特征和该第二关联特征进行点乘处理,得到对该用户推荐该视频的推荐概率。在一种可能实施方式中,该第三融合单元用于:将该视频特征与该用户特征进行双线性汇合处理,得到该第一关联特征;该第三融合单元还用于:将该文本特征与该用户特征进行双线性汇合处理,得到该第二关联特征。在一种可能实施方式中,该确定推荐模块用于:当该推荐概率大于概率阈值时,确定为该用户推荐该视频;当该推荐概率小于或等于该概率阈值时,确定不为该用户推荐该视频。在一种可能实施方式中,该确定推荐模块用于:对多个视频中的每个视频,重复执行生成推荐概率的操本文档来自技高网...

【技术保护点】
1.一种视频推荐方法,其特征在于,所述方法包括:将视频输入第一特征提取网络,通过所述第一特征提取网络对所述视频中的至少一个连续视频帧进行特征提取,输出所述视频的视频特征;将用户的用户数据输入第二特征提取网络,通过所述第二特征提取网络对离散的所述用户数据进行特征提取,输出所述用户的用户特征;基于所述视频特征和所述用户特征进行特征融合,得到对所述用户推荐所述视频的推荐概率;根据所述推荐概率,确定是否对所述用户推荐所述视频。

【技术特征摘要】
1.一种视频推荐方法,其特征在于,所述方法包括:将视频输入第一特征提取网络,通过所述第一特征提取网络对所述视频中的至少一个连续视频帧进行特征提取,输出所述视频的视频特征;将用户的用户数据输入第二特征提取网络,通过所述第二特征提取网络对离散的所述用户数据进行特征提取,输出所述用户的用户特征;基于所述视频特征和所述用户特征进行特征融合,得到对所述用户推荐所述视频的推荐概率;根据所述推荐概率,确定是否对所述用户推荐所述视频。2.根据权利要求1所述的方法,其特征在于,所述将视频输入第一特征提取网络,通过所述第一特征提取网络对所述视频中的至少一个连续视频帧进行特征提取,输出所述视频的视频特征包括:将所述视频中的所述至少一个连续视频帧分别输入所述第一特征提取网络中的时间卷积网络和卷积神经网络,通过所述时间卷积网络和所述卷积神经网络对所述至少一个连续视频帧进行卷积处理,提取所述视频的视频特征。3.根据权利要求2所述的方法,其特征在于,所述将所述视频中的所述至少一个连续视频帧分别输入所述第一特征提取网络中的时间卷积网络和卷积神经网络,通过所述时间卷积网络和所述卷积神经网络对所述至少一个连续视频帧进行卷积处理,提取所述视频的视频特征包括:将所述至少一个连续视频帧所包括的至少一个图像帧输入所述时间卷积网络,通过所述时间卷积网络对所述至少一个图像帧进行因果卷积,得到所述视频的图像特征;将所述至少一个连续视频帧所包括的至少一个音频帧输入所述卷积神经网络,通过所述卷积神经网络对所述至少一个音频帧进行卷积处理,得到所述视频的音频特征;将所述视频的图像特征与所述视频的音频特征进行特征融合,得到所述视频的视频特征。4.根据权利要求3所述的方法,其特征在于,所述将所述视频的图像特征与所述视频的音频特征进行特征融合,得到所述视频的视频特征包括:将所述视频的图像特征与所述视频的音频特征进行双线性汇合处理,得到所述视频的视频特征。5.根据权利要求1所述的方法,其特征在于,所述将用户的用户数据输入第二特征提取网络,通过所述第二特征提取网络对离散的所述用户数据进行特征提取,输出所述用户的用户特征包括:将所述用户的用户数据输入所述第二特征提取网络;通过所述第二特征提取网络中的宽度部分,对离散的所述用户数据进行广义线性组合,得到所述用户的宽度特征;通过所述第二特征提取网络中的深度部分,对离散的所述用户数据进行嵌入处理和卷积处理,得到所述用户的深度特征;对所述用户的宽度特征和所述用户的深度特征进行特征融合,得到所述用户的用户特征。6.根据权利要求5所述的方法,其特征在于,所述对所述用户的宽度特征和所述用户的深度特征进行特征融合,得到所述用户的用户特征包括:通过全连接层对所述用户的宽度特征和所述用户的深度特征进行级联,得到所述用户的用户特征。7.根据权利要求1所述的方法,其特征在于,所述基于所述视频特征和所述用户特征进行特征融合,得到对所述用户推荐所述视频的推荐概率包括:对所述视频特征和所述用户特征进行点乘处理,得到对所述用户推荐所述视频的推荐概率。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:将与所述视频对应的文本输入第三特征提取网络,通过所述第三特征提取网络对离散的所述文本进行特征提取,输出与所述视频对应的文本特征。9.根据权利要求8所述的方法,其特征在于,所述将与所述...

【专利技术属性】
技术研发人员:苏舟刘书凯孙振龙饶君丘志杰刘毅刘祺王良栋商甜甜梁铭霏陈磊张博
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1