一种视频数据的召回方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:26308146 阅读:20 留言:0更新日期:2020-11-10 20:10
本发明专利技术实施例提供了一种视频数据的召回方法、装置、计算机设备和存储介质,该方法包括:以第一用户、视频数据作为节点,以第一用户与视频数据的相关性、第一用户之间的相关性、视频数据之间的相关性作为边,建立目标序列,在目标序列中沿边选择部分节点,从而生成用户序列和/或视频数据,用户序列包括多个具有相关性的第一用户,视频序列包括多个具有相关性的视频数据,接收来自于第二用户的请求,响应于请求,以用户序列和/或视频序列作为召回的路径,召回与第二用户适配的视频数据,从多个相关性的维度实现混合构图,从而提高了图的密度,丰富了用户序列和/或视频序列的内容,大大增加了召回视频数据的数量。

【技术实现步骤摘要】
一种视频数据的召回方法、装置、计算机设备和存储介质
本专利技术实施例涉及多媒体处理的
,尤其涉及一种视频数据的召回方法、装置、计算机设备和存储介质。
技术介绍
随之网络的快速发展,网络中视频数据的数量急剧增加,各个视频网站为用户提供服务,从海量的视频数据中筛选有价值的视频数据,并推送给用户。在这个过程中,一般是先召回再排序,召回的作用为在庞大的数据池中,找出用户可能喜欢的视频数据作为候选;排序的作用为对召回的视频数据进行排序,从中选出最优的n个视频数据推送用户。其中,常用的召回方式包括协同过滤(CollaborativeFiltering,CF),协同过滤需要收集用户的偏好,从而找到相似的用户(即UserCF)或信息(即ItemCF)。协同过滤算法需要依赖各个用户的历史信息推送视频数据,当用户仅对数据库中可用的视频数据中的一小部分进行操作时,用户的历史信息存在稀疏的问题,导致召回的视频数据不足,推送的视频数据与用户之间的适配度差,针对诸如短视频等规模量巨大的视频数据,稀疏性尤为明显、召回不足的问题尤为突出。
技术实现思路
本专利技术实施例提出了一种视频数据的召回方法、装置、计算机设备和存储介质,以解决在用户的历史信息稀疏的情况下,使用协同过滤召回视频数据不足、推送的视频数据与用户之间的适相关性差的问题。第一方面,本专利技术实施例提供了一种视频数据的召回方法,包括:以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列;在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,所述用户序列包括多个具有相关性的所述第一用户,所述视频序列包括多个具有相关性的所述视频数据;接收来自于第二用户的请求;响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据。第二方面,本专利技术实施例还提供了一种视频数据的召回装置,包括:目标序列建立模块,用于以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列;节点选择模块,用于在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,所述用户序列包括多个具有相关性的所述第一用户,所述视频序列包括多个具有相关性的所述视频数据;请求接收模块,用于接收来自于第二用户的请求;视频数据召回模块,用于响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据。第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的视频数据的召回方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的视频数据的召回方法。在本实施例中,以第一用户、视频数据作为节点,以第一用户与视频数据的相关性、第一用户之间的相关性、视频数据之间的相关性作为边,建立目标序列,在目标序列中沿边选择部分节点,从而生成用户序列和/或视频数据,用户序列包括多个具有相关性的第一用户,视频序列包括多个具有相关性的视频数据,接收来自于第二用户的请求,响应于请求,以用户序列和/或视频序列作为召回的路径,召回与第二用户适配的视频数据,以第一用户与视频数据的相关性、第一用户之间的相关性、视频数据之间作为构图的方式,从多个相关性的维度实现混合构图,以第一用户与视频数据之间、第一用户之间、视频数据之间均可连通,从而提高了图的密度,丰富了用户序列和/或视频序列的内容,在基于用户序列和/或视频序列召回视频数据时,大大增加了召回视频数据的数量。附图说明图1为本专利技术实施例一提供的一种视频数据的召回方法的流程图;图2为本专利技术实施例一提供的一种目标序列的示例图;图3是本专利技术实施例二提供的一种视频数据的召回方法的流程图;图4A为本专利技术实施例二提供的一种用户行为序列的示例图;图4B为本专利技术实施例二提供的一种视频共现序列的示例图;图4C为本专利技术实施例二提供的一种用户社交序列的示例图;图5为本专利技术实施例三提供的一种视频数据的召回装置的结构示意图;图6为本专利技术实施例四提供的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种视频数据的召回方法的流程图,本实施例可适用于在视频数据中丰富图的信息与结构,从而召回视频数据的情况,该方法可以由视频数据的召回装置来执行,该视频数据的召回装置可以由软件和/或硬件实现,可配置在计算机设备中,例如,服务器、个人电脑,等等,具体包括如下步骤:步骤101、以第一用户、视频数据作为节点,以第一用户与视频数据的相关性、第一用户之间的相关性、视频数据之间的相关性作为边,建立目标序列。在视频网站中,存储有大量的视频数据,该视频数据的形式可以包括短视频、直播节目、电视剧、电影、动画,等等,这些视频数据可以由用户制作、上传,也可以由技术人员上传,本实施例对此不加以限制。此外,这些视频数据作为数据池,既可以由用户以关键词搜索命中后发送给用户,也可以召回之后推送给用户,本实施例对此不加以限制。在本实施例中,针对第一用户与视频数据两两之间遍历相关性,挖掘第一用户与视频数据、第一用户与第一用户、视频数据与视频数据之间的密切程度。一方面,视频数据提供给第一用户浏览,第一用户可以对该视频数据发生各种行为,使得视频数据与第一用户之间产生相关性。另一方面,在视频网站提供的交互体系中,第一用户与第一用户之间可以进行交互,第一用户与第一用户之间的行为相同或相似,可通过社交关系、用户共现、DeepNeuralNetworks,深度神经网络)等方式挖掘第一用户与第一用户之间产生的相关性。又一方面,视频数据与视频数据之间在属性(如制作者、所属国家或地区、语言等)、内容、第一用户发生的行为等维度相同或相似,可通过视频共现、Item2vec、FastText、DNN等方式挖掘视频数据与视频数据之间产生的相关性。在计算机设备中,第一用户可以为注册的用户,也可以为非注册的用户,可以以用户ID、用户账号、IMEI(InternationalMobileEquipmentIdentity,国际移动设备识别码)等用户标识进行表示,一般情况下,第一用户为本文档来自技高网...

【技术保护点】
1.一种视频数据的召回方法,其特征在于,包括:/n以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列;/n在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,所述用户序列包括多个具有相关性的所述第一用户,所述视频序列包括多个具有相关性的所述视频数据;/n接收来自于第二用户的请求;/n响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据。/n

【技术特征摘要】
1.一种视频数据的召回方法,其特征在于,包括:
以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列;
在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,所述用户序列包括多个具有相关性的所述第一用户,所述视频序列包括多个具有相关性的所述视频数据;
接收来自于第二用户的请求;
响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据。


2.根据权利要求1所述的方法,其特征在于,所述以第一用户、视频数据作为节点,以所述第一用户与所述视频数据的相关性、所述第一用户之间的相关性、所述视频数据之间的相关性作为边,建立目标序列,包括:
以第一用户、视频数据作为节点,以所述第一用户浏览所述视频数据的行为作为边,建立用户行为序列;
以视频数据作为节点,以所述视频数据之间在内容上的关系作为边,建立视频共现序列;
以第一用户作为节点,以所述第一用户之间的社交关系作为边,建立用户社交序列;
将所述用户行为序列、所述视频共现序列与所述用户社交序列合并为目标序列。


3.根据权利要求2所述的方法,其特征在于,所述以第一用户、视频数据作为节点,以所述第一用户浏览所述视频数据的行为作为边,建立用户行为序列,包括:
查找处于活跃状态的第一用户;
统计所述第一用户在浏览视频数据时触发的行为;
以所述第一用户、所述视频数据作为节点,以所述行为作为边,建立用户行为序列。


4.根据权利要求2所述的方法,其特征在于,所述以视频数据作为节点,以所述视频数据之间在内容上的关系作为边,建立视频共现序列,包括:
查找处于活跃状态的第一用户;
对所述第一用户已浏览的视频数据建立浏览序列;
对所述浏览序列进行编码,获得表征所述视频数据内容的向量,作为内容向量;
针对每个所述视频数据,使用所述内容向量检索与当前所述视频数据相似的其他所述视频数据;
以所述视频数据作为节点,以所述相似的关系作为边,建立视频共现序列。


5.根据权利要求2所述的方法,其特征在于,所述以第一用户作为节点,以所述第一用户之间的社交关系作为边,建立用户社交序列,包括:
查找处于活跃状态的第一用户;
针对每个所述第一用户,查找与当前所述第一用户具有社交关系的其他所述第一用户;
以所述第一用户作为节点,以所述社交关系作为边,建立用户社交序列。


6.根据权利要求2所述的方法,其特征在于,所述将所述用户行为序列、所述视频共现序列与所述用户社交序列合并为目标序列,包括:
在所述用户行为序列与所述视频共现序列中查找相同的视频数据,作为目标视频;
在所述用户行为序列与所述用户社交序列中查找相同的第一用户,作为目标用户;
分别将所述用户行为序列与所述视频共现序列在所述目标视频处合并、将所述用户行为序列与所述用户社交序列在所述目标用户处合并,获得目标序列。


7.根据权利要求1所述的方法,其特征在于,所述在所述目标序列中沿所述边选择部分所述节点,从而生成用户序列和/或视频数据,包括:
在所述目标序列中进行随机游走,以在输出的序列中去除所述视频数据或所述第一用户,获得用户序列或视频序列。


8.根据权利要求1-7任一项所述的方法,其特征在于,所述响应于所述请求,以所述用户序列和/或所述视频序列作为召回的路径,召回与所述第二用户适配的视频数据,包括:
响应于所述请求,对所述用户序列或所述视频序列进行编码,获得所述第一用户的用户向量或所述视频数据的视频向量;
以用户相似和/或视频相似为召回的目标,使用所述用户向量和/或所述视频向量召回与所述第二用户适配的视频数据。


9.根据权利要求8所述的方法,其特征在于,所述以用户相似和/或视频相似为召回的目标,使用所...

【专利技术属性】
技术研发人员:王友朱众志
申请(专利权)人:有半岛北京信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1