视频相似度确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34175721 阅读:53 留言:0更新日期:2022-07-17 11:52
本发明专利技术实施例提供了一种视频相似度确定方法、装置、电子设备及存储介质,所述方法包括:获取视频集,针对视频集中任意两个视频,确定两个视频之间的用户重合度,以及确定两个视频之间的用户第一重合度;根据用户重合度以及用户第一重合度,确定两个视频之间的剔除用户受众规模影响的用户第二重合度;确定两个视频上线时间间隔的影响系数,利用影响系数对用户第二重合度进行处理,得到两个视频之间的用户第三重合度;确定用户第三重合度为两个视频之间的视频相似度。如此用户第三重合度剔除用户受众规模和视频间上线时间间隔的影响,可以保证后续视频相似度聚类的聚类结果合理可靠。证后续视频相似度聚类的聚类结果合理可靠。证后续视频相似度聚类的聚类结果合理可靠。

Video similarity determination method, device, electronic device and storage medium

【技术实现步骤摘要】
视频相似度确定方法、装置、电子设备及存储介质


[0001]本专利技术涉及视频处理
,尤其涉及一种视频相似度确定方法、装置、电子设备及存储介质。

技术介绍

[0002]目前各大视频网站中电视剧、电影、综艺等视频,品类多、覆盖广、内容丰富多样,但是一直以来对这些视频的规划和管理都依赖于相关部门的专家经验。但是视频创作和采购的成本巨大,视频的规划和管理的容错率极低,亟需科学客观的数学工具进行辅助。视频的规划和管理本质就是做视频相似度聚类,最佳的数据工具就是视频相似度。
[0003]相关技术中,视频相似度算法多种多样,包括基于视频内容的文本相似度,基于用户行为的协同过滤推荐算法的相似度等。各种视频相似度算法中最简单和使用约束最少的就是用户重合度,这里把用户重合度视为视频相似度。其中,用户重合度算法也有很多,最常用的就是Jaccard指数(并交比:分子为并集,分母为交集)。
[0004]但是,用户重合度极易受到用户受众规模和视频间上线时间间隔的影响,例如用户受众规模较大的两个视频之间的用户重合度,显然高于用户受众规模较小的两个视频之间的用户重合度,上线时间间隔较小的两个视频之间的用户重合度,显然高于上线时间间隔较大的两个视频之间的用户重合度,如此导致视频相似度聚类的聚类结果不准确。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种视频相似度确定方法、装置、电子设备及存储介质,以实现视频相似度聚类结果合理可靠的有益效果。具体技术方案如下:
[0006]在本专利技术实施例的第一方面,首先提供了一种视频相似度确定方法,所述包括:
[0007]获取视频集,针对所述视频集中任意两个视频,确定两个所述视频之间的用户重合度,以及确定两个所述视频之间的用户第一重合度;
[0008]根据所述用户重合度以及所述用户第一重合度,确定两个所述视频之间的剔除用户受众规模影响的用户第二重合度;
[0009]确定两个所述视频上线时间间隔的影响系数,利用所述影响系数对所述用户第二重合度进行处理,得到两个所述视频之间的用户第三重合度;
[0010]确定所述用户第三重合度为两个所述视频之间的视频相似度。
[0011]在一个可选的实施方式中,所述获取视频集后,所述方法还包括:
[0012]确定所述视频集中任一视频对应的用户,组成所述视频的受众集合,其中,所述用户包括有效播放过所述视频的用户;
[0013]所述确定两个所述视频之间的用户重合度,包括:
[0014]根据两个所述视频各自对应的所述用户,确定两个所述视频之间的用户重合度。
[0015]在一个可选的实施方式中,所述根据两个所述视频各自对应的所述用户,确定两个所述视频之间的用户重合度,包括:
[0016]将两个所述视频各自对应的所述用户,输入至用户重合度计算公式,其中,所述用户重合度计算公式包括:
[0017][0018]所述A、所述B包括两个所述视频各自对应的所述用户,所述r
ab
包括所述用户重合度;
[0019]获取所述用户重合度计算公式输出的两个所述视频之间的用户重合度。
[0020]在一个可选的实施方式中,所述确定两个所述视频之间的用户第一重合度,包括:
[0021]确定所述视频集对应的视频网站的总用户,根据两个所述视频各自对应的所述用户以及所述总用户,确定两个所述视频之间的用户第一重合度。
[0022]在一个可选的实施方式中,所述根据两个所述视频各自对应的所述用户以及所述总用户,确定两个所述视频之间的用户第一重合度,包括:
[0023]将两个所述视频各自对应的所述用户以及所述总用户,输入至用户第一重合度计算公式,其中,所述用户第一重合度计算公式包括:
[0024][0025]所述r
s
包括所述用户第一重合度,所述A、所述B包括两个所述视频各自对应的所述用户,所述All包括所述总用户;
[0026]获取所述用户第一重合度计算公式输出的两个所述视频之间的用户第一重合度。
[0027]在一个可选的实施方式中,所述根据所述用户重合度以及所述用户第一重合度,确定两个所述视频之间的剔除用户受众规模影响的用户第二重合度,包括:
[0028]将所述用户重合度以及所述用户第一重合度,输入至用户第二重合度计算公式,其中,所述用户第二重合度计算公式包括:
[0029][0030]所述r
ab
包括所述用户重合度,所述r
s
包括所述用户第一重合度,所述s
ab
包括所述用户第二重合度,所述All包括所述总用户,所述A、所述B包括两个所述视频各自对应的所述用户;
[0031]获取所述用户第二重合度计算公式输出的两个所述视频之间的剔除用户受众规模影响的用户第二重合度。
[0032]在一个可选的实施方式中,所述确定两个所述视频上线时间间隔的影响系数,包括:
[0033]根据两个所述视频各自对应的所述用户,确定两个所述视频上线时间间隔的影响系数。
[0034]在一个可选的实施方式中,所述根据两个所述视频各自对应的所述用户,确定两个所述视频上线时间间隔的影响系数,包括:
[0035]将两个所述视频各自对应的所述用户,输入至影响系数计算公式,其中,所述影响系数计算公式包括:
[0036][0037]所述A、所述B包括两个所述视频各自对应的所述用户,所述e

k
×
dt
包括所述影响系数,所述dt包括两个所述视频之间的上线时间间隔,所述k包括常数;
[0038]获取所述影响系数计算公式输出的两个所述视频上线时间间隔的影响系数。
[0039]在一个可选的实施方式中,所述利用所述影响系数对所述用户第二重合度进行处理,得到两个所述视频之间的用户第三重合度,包括:
[0040]对所述影响系数进行镜像转换处理,得到所述总用户与两个所述视频上线时间间隔之间的指数关系;
[0041]将所述总用户替换为所述指数关系,输入至所述用户第二重合度计算公式,如下所示;
[0042]所述e
k
×
dt
包括所述指数关系,所述s
ab
包括所述用户第三重合度,所述dt包括两个所述视频之间的上线时间间隔,所述k包括常数;
[0043]获取所述用户第二重合度计算公式输出的两个所述视频之间的用户第三重合度。
[0044]在本专利技术实施例的第二方面,还提供了一种视频相似度确定装置,所述装置包括:
[0045]重合度确定模块,用于获取视频集,针对所述视频集中任意两个视频,确定两个所述视频之间的用户重合度;以及,
[0046]第一重合度确定模块,用于确定两个所述视频之间的用户第一重合度;
[0047]第二重合度确定模块,用于根据所述用户重合度以及所述用户第一重合度,确定两个所述视频之间的剔除用户受本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频相似度确定方法,其特征在于,所述方法包括:获取视频集,针对所述视频集中任意两个视频,确定两个所述视频之间的用户重合度,以及确定两个所述视频之间的用户第一重合度;根据所述用户重合度以及所述用户第一重合度,确定两个所述视频之间的剔除用户受众规模影响的用户第二重合度;确定两个所述视频上线时间间隔的影响系数,利用所述影响系数对所述用户第二重合度进行处理,得到两个所述视频之间的用户第三重合度;确定所述用户第三重合度为两个所述视频之间的视频相似度。2.根据权利要求1所述的方法,其特征在于,所述获取视频集后,所述方法还包括:确定所述视频集中任一视频对应的用户,组成所述视频的受众集合,其中,所述用户包括有效播放过所述视频的用户;所述确定两个所述视频之间的用户重合度,包括:根据两个所述视频各自对应的所述用户,确定两个所述视频之间的用户重合度。3.根据权利要求2所述的方法,其特征在于,所述根据两个所述视频各自对应的所述用户,确定两个所述视频之间的用户重合度,包括:将两个所述视频各自对应的所述用户,输入至用户重合度计算公式,其中,所述用户重合度计算公式包括:所述A、所述B包括两个所述视频各自对应的所述用户,所述r
ab
包括所述用户重合度;获取所述用户重合度计算公式输出的两个所述视频之间的用户重合度。4.根据权利要求2所述的方法,其特征在于,所述确定两个所述视频之间的用户第一重合度,包括:确定所述视频集对应的视频网站的总用户,根据两个所述视频各自对应的所述用户以及所述总用户,确定两个所述视频之间的用户第一重合度。5.根据权利要求4所述的方法,其特征在于,所述根据两个所述视频各自对应的所述用户以及所述总用户,确定两个所述视频之间的用户第一重合度,包括:将两个所述视频各自对应的所述用户以及所述总用户,输入至用户第一重合度计算公式,其中,所述用户第一重合度计算公式包括:所述r
s
包括所述用户第一重合度,所述A、所述B包括两个所述视频各自对应的所述用户,所述All包括所述总用户;获取所述用户第一重合度计算公式输出的两个所述视频之间的用户第一重合度。6.根据权利要求4所述的方法,其特征在于,所述根据所述用户重合度以及所述用户第一重合度,确定两个所述视频之间的剔除用户受众规模影响的用户第二重合度,包括:将所述用户重合度以及所述用户第一重合度,输入至用户第二重合度计算公式,其中,所述用户第二重合度计算公式包括:
所述r
ab
包括所述用户重合度,所述r
s
包括所述用户第一重合度,所述s
ab
包括所述用户第二重合度,所述All包括所述总用户,所述A、所述B包括两个所述视频各自对应的所述用户;获取所述用...

【专利技术属性】
技术研发人员:郭强姚尧周莹叶田田
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1