计算视频内容相似度的方法及装置制造方法及图纸

技术编号:24799698 阅读:17 留言:0更新日期:2020-07-07 21:04
本申请公开了计算视频内容相似度的方法及装置,本申请无需针对视频库中的每个视频进行相似度计算,只需要从视频组合集中获取出关联视频组合,然后再统计其中每个关联视频所具有的目标标签数量,就能计算出该关联视频与目标视频的相似度。由于关联视频组合中关联视频的数量远小于视频库中视频的总数量,因此可以有效减少计算次数,降低计算复杂度。

【技术实现步骤摘要】
计算视频内容相似度的方法及装置
本申请涉及互联网
,尤其涉及一种计算视频内容相似度的方法及装置。
技术介绍
在智能推荐领域,基于内容推荐是一种常见的关联推荐方案,它是指基于从内容中提取的代表性内容,如视频的标签信息、新闻的关键词信息、标题等,两两计算内容在关键信息上的匹配程度,由此获取内容之间的相似度。但随着信息时代的到来,信息资源的无限放大,上述计算方法在计算性能上的弊端逐步显现出来。以关联视频推荐领域为例,假设视频库中有10万部视频资源,那么在计算这10万部视频之间的相似度时,需要针对这些视频进行两两之间的相似度匹配,其计算复杂度为10w2,即需要进行约1010次的相似度计算,才能完成对10万部视频之间的相似度计算。当视频库中视频数量更多时,计算复杂度也将更高,因此导致基于内容推荐关联视频的方案较为耗费资源和时间,且推荐结果更新慢,新视频资源上线之后长时间无推荐内容等问题。
技术实现思路
本申请提供一种计算视频内容相似度的方法及装置,以解决现有关联视频推荐实现方案计算复杂度高、耗费资源和时间的问题。第一方面,本申请实施例提供一种计算视频内容相似度的方法,包括:获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视频,所述关联视频具有至少一个所述目标标签;根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度。第二方面,本申请实施例提供一种计算视频内容相似度的装置,包括:获取模块,用于获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;第一计算模块,用于根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视频,所述关联视频具有至少一个所述目标标签;第二计算模块,用于根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度。由以上技术方案可知,与现有技术相比,本申请提供的计算视频内容相似度的方法,无需针对视频库中的每个视频进行相似度计算,只需要从视频组合集中获取出关联视频组合,然后再统计其中每个关联视频所具有的目标标签数量,就能计算出该关联视频与目标视频的相似度。由于关联视频组合中关联视频的数量远小于视频库中视频的总数量,因此可以有效减少计算次数,降低计算复杂度。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请根据一些实施例示例性示出的计算视频内容相似度的方法流程图;图2为本申请根据一些实施例示例性示出的计算视频内容相似度的方法流程图;图3为本申请根据一些实施例示例性示出的计算视频内容相似度的装置框图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。相关技术中,视频网站和视频App不仅在首页罗列视频,还为用户提供视频筛选及推荐服务,例如用户可以根据视频类型列表和/或演员列表中筛选自己喜欢的内容。此外,用户在观看完一类视频后,随后会有相关的视频推荐。例如,如果观看的是一部动作类的视频,则观看结束后运营商向用户推荐其他动作类的视频,但不仅限于此,也可以根据用户所观看视频的其他标签推荐其他相关视频。通常,视频网站和视频APP的运营商不仅拥有庞大的视频库,还拥有与视频库相应的标签库,在标签库中的标签即为视频库中视频的标签,视频的标签包括如地区标签(如大陆、美剧、英剧、韩剧)、类型标签(如动漫、喜剧、科幻、古装、武侠)、年代标签、特色标签(如校园、生活、文艺)、主创人员标签(如主演、导演、编剧)等。在一些实施例中,通过计算两个视频在标签上的重合程度来计算该两个视频的相似度。例如,假设视频M1具有标签(T1,T2,T3),视频M2的标签为(T1,T2,T4),可知视频M1和视频M2共有的标签为(T1,T2),则视频M1和视频M2在标签上的相似度为2。其中,M1和M2为用于表征相应视频的视频标识,视频标识与视频文件内容和/或视频文件的播放/访问地址(如URL)具有唯一对应关系;T1、T2、T3等为用于表征相应标签的标签标识,根据标签标识可以用于唯一确定一个标签。然而,上述计算相似度的方法具有较高的复杂度,进而对推荐服务的计算性能要求较高。具体而言,假设某网站视频库中有N部视频,标签库中有n个标签,其中N>>n。此时若我们采用原有的笛卡尔积(即两两计算相似度)的计算方案,可知我们计算的复杂度为o(N2)。为了降低计算视频内容相似度时的复杂度,本申请实施例提供一种计算视频内容相似度的方法,无论是对于实时计算还是离线计算,该方法都能在保证不损失结果准确性的同时降低计算复杂度,进而可以有效解决关联视频推荐实现方案中计算性能问题。。图1为本申请根据一些示例性实施例示出的计算视频内容相似度的方法流程图,如图1所示,该方法可以包括:步骤101、获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,所述视频组合包含所述视频组合所对应的标签所属的视频。示例性的,视频库M中包含N个视频,分别为[M1,M2,……,MN-1,MN],其中的每个视频具有至少一个标签,这些标签组成该视频库M对应的标签库T,该标签库T包括n个标签,分别为[T1,T2,……,Tn-1,Tn],N>>n。在一些实施例中,对于视频库M中的任意一个视频Mi(1≤i≤N)和其具有的标签Tk、Tj等(1≤k≤n,1≤j≤n),以如下映射方式进行表示:在一些实施例中,根据视频库M和标签库T可以生成步骤101涉及的视频组合集。示例的,视频组合集C中包括n(标签库中标签数量)个视频组合,例如分别为c1-cn,一个视频组合对应一个标签,例如视频组合c1-cn分别对应标签T1-Tn,并且,对于任意一个视频组合cs(1≤s≤n),其包含标签Ts所属的所有视频。需要说明的是,对于任意视频组合cs中的视频,其除具有标签Ts以外,还可以具有其他标签。示例的,上述任意一个视频组合cs可以包括一个或者多个视本文档来自技高网
...

【技术保护点】
1.一种计算视频内容相似度的方法,其特征在于,包括:/n获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;/n根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视频,所述关联视频具有至少一个所述目标标签;/n根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度。/n

【技术特征摘要】
1.一种计算视频内容相似度的方法,其特征在于,包括:
获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;
根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视频,所述关联视频具有至少一个所述目标标签;
根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度。


2.根据权利要求1所述的方法,其特征在于,所述视频组合集的生成步骤,包括:
获取视频库中每个视频对应的视频标识和标签标识,所述视频标识用于表征所述视频,所述标签标识用于表征所述视频具有的标签;
根据所述每个视频对应的视频标识和标签标识生成以视频标识进行排序的第一映射表,在所述第一映射表中所述视频标识与标签标识对应保存;
根据所述第一映射表生成以标签标识进行排序的第二映射表,在所述第二映射表中所述标签标识与所述视频标识对应保存;
依次从所述第二映射表中抽取出与同一标签标识对应的视频标识,以形成与标签对应的视频组合和包含所述视频组合的视频组合集。


3.根据权利要求1所述的方法,其特征在于,所述根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度,包括:
以所述关联视频具有的目标标签的数量,作为所述关联视频与所述目标视频的相似度。


4.根据权利要求1所述的方法,其特征在于,所述根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度,包括:
获取目标标签在所述关联视频所具有的所有标签中的权重;
根据所述关联视频具有的目标标签及所述目标标签对应的权重进行加权计算,得到所述关联视频与所述目标视频的相似度。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述关联视频与所述目标视频的相似度对所述关联视频进行相关度排序;
根据所述关联视频的相关度排序进行关联视频推荐。


6...

【专利技术属性】
技术研发人员:史小龙黄山山王洁
申请(专利权)人:青岛聚看云科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1