【技术实现步骤摘要】
一种视频数据的召回方法、装置、计算机设备和存储介质
本专利技术实施例涉及多媒体处理的
,尤其涉及一种视频数据的召回方法、装置、计算机设备和存储介质。
技术介绍
随之网络的快速发展,网络中视频数据的数量急剧增加,各个视频网站为用户提供服务,从海量的视频数据中筛选有价值的视频数据,并推送给用户。在这个过程中,一般是先召回再排序,召回的作用为在庞大的数据池中,找出用户可能喜欢的视频数据作为候选;排序的作用为对召回的视频数据进行排序,从中选出最优的n个视频数据推送用户。其中,常用的召回方式包括协同过滤(CollaborativeFiltering,CF),协同过滤需要收集用户的偏好,从而找到相似的用户(即UserCF)或信息(即ItemCF)。协同过滤算法需要依赖各个用户的历史信息推送视频数据,当用户仅对数据库中可用的视频数据中的一小部分进行操作时,用户的历史信息存在稀疏的问题,导致召回的视频数据不足,推送的视频数据与用户之间的适配度差,针对诸如短视频等规模量巨大的视频数据,稀疏性尤为明显、召回不足的问题尤为突出。
技术实现思路
本专利技术实施例提出了一种视频数据的召回方法、装置、计算机设备和存储介质,以解决在用户的历史信息稀疏的情况下,使用协同过滤召回视频数据不足、推送的视频数据与用户之间的适相关性差的问题。第一方面,本专利技术实施例提供了一种视频数据的召回方法,包括:以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关 ...
【技术保护点】
1.一种视频数据的召回方法,其特征在于,包括:/n以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列;/n在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,所述用户序列包括多个具有相关性的所述第一用户,所述视频序列包括多个具有相关性的所述视频数据;/n接收来自于第二用户的请求;/n响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据。/n
【技术特征摘要】
1.一种视频数据的召回方法,其特征在于,包括:
以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列;
在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,所述用户序列包括多个具有相关性的所述第一用户,所述视频序列包括多个具有相关性的所述视频数据;
接收来自于第二用户的请求;
响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据。
2.根据权利要求1所述的方法,其特征在于,所述以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列,包括:
以第一用户、视频数据作为节点,以所述第一用户浏览所述视频数据的行为作为边,建立用户行为序列;
以视频数据作为节点,以所述视频数据之间在内容上的关系作为边,建立视频共现序列;
以第一用户作为节点,以所述第一用户之间的社交关系作为边,建立用户社交序列;
将所述用户行为序列、所述视频共现序列与所述用户社交序列合并为目标序列。
3.根据权利要求2所述的方法,其特征在于,所述以第一用户、视频数据作为节点,以所述第一用户浏览所述视频数据的行为作为边,建立用户行为序列,包括:
查找处于活跃状态的第一用户;
统计所述第一用户在浏览视频数据时触发的行为;
以所述第一用户、所述视频数据作为节点,以所述行为作为边,建立用户行为序列。
4.根据权利要求2所述的方法,其特征在于,所述以视频数据作为节点,以所述视频数据之间在内容上的关系作为边,建立视频共现序列,包括:
查找处于活跃状态的第一用户;
对所述第一用户已浏览的视频数据建立浏览序列;
对所述浏览序列进行编码,获得表征所述视频数据内容的向量,作为内容向量;
针对每个所述视频数据,使用所述内容向量检索与当前所述视频数据相似的其他所述视频数据;
以所述视频数据作为节点,以所述相似的关系作为边,建立视频共现序列。
5.根据权利要求2所述的方法,其特征在于,所述以第一用户作为节点,以所述第一用户之间的社交关系作为边,建立用户社交序列,包括:
查找处于活跃状态的第一用户;
针对每个所述第一用户,查找与当前所述第一用户具有社交关系的其他所述第一用户;
以所述第一用户作为节点,以所述社交关系作为边,建立用户社交序列。
6.根据权利要求2所述的方法,其特征在于,所述将所述用户行为序列、所述视频共现序列与所述用户社交序列合并为目标序列,包括:
在所述用户行为序列与所述视频共现序列中查找相同的视频数据,作为目标视频;
在所述用户行为序列与所述用户社交序列中查找相同的第一用户,作为目标用户;
分别将所述用户行为序列与所述视频共现序列在所述目标视频处合并、将所述用户行为序列与所述用户社交序列在所述目标用户处合并,获得目标序列。
7.根据权利要求1所述的方法,其特征在于,所述在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,包括:
在所述目标序列中进行随机游走,以在输出的序列中去除所述视频数据或所述第一用户,获得用户序列或视频序列。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据,包括:
响应于所述请求,对所述用户序列或所述视频序列进行编码,获得所述第一用户的用户向量或所述视频数据的视频向量;
以用户相似和/或视频相似为召回的目标,使用所述用户向量和/或所述视频向量召回与所述第二用户适配的视频数据。
9.根据权利要求8所述的方法,其特征在于,所述以用户相似和/或视频相似为召回的目标,使用所...
【专利技术属性】
技术研发人员:王友,朱众志,
申请(专利权)人:有半岛北京信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。