【技术实现步骤摘要】
计算视频内容相似度的方法及装置
本申请涉及互联网
,尤其涉及一种计算视频内容相似度的方法及装置。
技术介绍
在智能推荐领域,基于内容推荐是一种常见的关联推荐方案,它是指基于从内容中提取的代表性内容,如视频的标签信息、新闻的关键词信息、标题等,两两计算内容在关键信息上的匹配程度,由此获取内容之间的相似度。但随着信息时代的到来,信息资源的无限放大,上述计算方法在计算性能上的弊端逐步显现出来。以关联视频推荐领域为例,假设视频库中有10万部视频资源,那么在计算这10万部视频之间的相似度时,需要针对这些视频进行两两之间的相似度匹配,其计算复杂度为10w2,即需要进行约1010次的相似度计算,才能完成对10万部视频之间的相似度计算。当视频库中视频数量更多时,计算复杂度也将更高,因此导致基于内容推荐关联视频的方案较为耗费资源和时间,且推荐结果更新慢,新视频资源上线之后长时间无推荐内容等问题。
技术实现思路
本申请提供一种计算视频内容相似度的方法及装置,以解决现有关联视频推荐实现方案计算复杂度高、耗费资源和时间的问题。第一方面,本申请实施例提供一种计算视频内容相似度的方法,包括:获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视 ...
【技术保护点】
1.一种计算视频内容相似度的方法,其特征在于,包括:/n获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;/n根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视频,所述关联视频具有至少一个所述目标标签;/n根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度。/n
【技术特征摘要】
1.一种计算视频内容相似度的方法,其特征在于,包括:
获取预先生成的视频组合集,所述视频组合集包括至少一个视频组合,一个所述视频组合对应一个标签,每个视频组合包含所述视频组合所对应的标签所属的视频;
根据目标视频具有的目标标签,从所述视频组合集中获取所述目标标签对应的视频组合,所述目标视频为视频库中的任意一个视频,所述目标标签对应的视频组合包含所述目标视频的关联视频,所述关联视频具有至少一个所述目标标签;
根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度。
2.根据权利要求1所述的方法,其特征在于,所述视频组合集的生成步骤,包括:
获取视频库中每个视频对应的视频标识和标签标识,所述视频标识用于表征所述视频,所述标签标识用于表征所述视频具有的标签;
根据所述每个视频对应的视频标识和标签标识生成以视频标识进行排序的第一映射表,在所述第一映射表中所述视频标识与标签标识对应保存;
根据所述第一映射表生成以标签标识进行排序的第二映射表,在所述第二映射表中所述标签标识与所述视频标识对应保存;
依次从所述第二映射表中抽取出与同一标签标识对应的视频标识,以形成与标签对应的视频组合和包含所述视频组合的视频组合集。
3.根据权利要求1所述的方法,其特征在于,所述根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度,包括:
以所述关联视频具有的目标标签的数量,作为所述关联视频与所述目标视频的相似度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述关联视频具有的目标标签的数量,确定所述关联视频与所述目标视频的相似度,包括:
获取目标标签在所述关联视频所具有的所有标签中的权重;
根据所述关联视频具有的目标标签及所述目标标签对应的权重进行加权计算,得到所述关联视频与所述目标视频的相似度。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述关联视频与所述目标视频的相似度对所述关联视频进行相关度排序;
根据所述关联视频的相关度排序进行关联视频推荐。
6...
【专利技术属性】
技术研发人员:史小龙,黄山山,王洁,
申请(专利权)人:青岛聚看云科技有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。