System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及视频处理,尤其是涉及一种视频去重方法、装置、设备、可读存储介质及程序产品。
技术介绍
1、随着互联网短视频兴起、每天产生的短视频成几何级数暴涨。出现了大量优质内容创造者,也出现了各种剽窃、抄袭的情况。特别是人工智能(artificial intelligence,ai)技术的兴起,更是助长了这种“改编”风气。通过ai技术改写原创标题、改编短视频声音、甚至篡改短视频画面以躲避平台审查。
2、为了规避上述情况,需要对短视频进行去重处理,相关的去重处理过程中,需要将短视频与视频库中的各个短视频进行相似性比对,以根据比对结果进行去重处理。然而,这种方式的相似性比对范围相对较大,导致视频去重效率很低。
技术实现思路
1、本申请实施例的目的在于提供一种视频去重方法、装置、设备、可读存储介质及程序产品,从而解决由于相似性比对范围大导致视频去重效率低的问题。
2、第一方面,为了达到上述目的,本申请的实施例提供一种视频去重方法,包括:
3、获取目标视频的多个维度的特征信息,所述多个维度包括类别、标签和关键词中的至少两项;
4、依次将多个维度中的每一维度的特征信息,分别与视频库的对应维度的视频索引进行比较,获得所述视频库中与所述目标视频的每一维度分别对应的候选视频集合;其中,所述视频索引用于表示所述视频库中相应维度的特征信息与所述视频库中的候选视频之间的索引关系;
5、获取多个所述候选视频集合的交集视频;
6、在所述目标
7、可选地,获取目标视频的多个维度的特征信息,包括以下至少两个步骤:
8、对所述目标视频的视频标题进行分词并计算词权重,获得标签维度的特征信息;
9、对所述标签维度的特征信息进行归类,获得类别维度的特征信息;
10、将所述目标视频的音频数据转换为文本数据,并在所述文本数据中提取关键词维度的特征信息。
11、可选地,所述方法还包括:
12、对于去重检测合格的视频,基于所述去重检测合格的视频的每一维度的特征信息,创建和/或更新所述视频库的对应维度的视频索引。
13、可选地,所述在所述目标视频与所述交集视频中的任一视频的相似度大于相似度阈值时,确定所述目标视频为待去重视频之前,所述方法还包括:
14、根据关键词维度的特征信息,在所述目标视频中,提取与所述关键词维度的特征信息相关的关键帧;
15、根据所述目标视频的关键帧和所述交集视频的各个视频的关键帧,确定所述目标视频与所述交集视频的各个视频的相似度,其中,所述交集视频的各个视频的关键帧与所述交集视频的各个视频的关键词维度的特征信息对应。
16、可选地,根据关键词维度的特征信息,在所述目标视频中,提取与所述关键词维度的特征信息相关的关键帧,包括:
17、在所述目标视频中,识别与所述关键词维度的特征信息对应的视频片段;
18、根据所述关键词维度的特征信息在文本数据中的位置,提取识别到的各个所述视频片段的关键帧,所述文本数据由所述目标视频的音频数据转换得到。
19、可选地,根据所述目标视频的关键帧和所述交集视频的各个视频的关键帧,确定所述目标视频与所述交集视频的各个视频的相似度,包括:
20、对所述目标视频的关键帧进行图像处理,获得所述目标视频的关键帧的特征向量;
21、根据所述目标视频的各个关键帧的特征向量,生成所述目标视频的特征向量;
22、依次计算所述目标视频的特征向量与所述交集视频的各个视频的特征向量的向量积,其中,所述交集视频的各个视频的特征向量由所述交集视频的各个视频的关键帧的特征向量生成;
23、根据各个所述向量积,确定所述目标视频与所述交集视频中对应所述向量积的视频的相似度。
24、第二方面,为了达到上述目的,本申请的实施例提供一种视频去重装置,包括:
25、第一获取模块,用于获取目标视频的多个维度的特征信息,所述多个维度包括类别、标签和关键词中的至少两项;
26、第二获取模块,用于依次将多个维度中的每一维度的特征信息,分别与视频库的对应维度的视频索引进行比较,获得所述视频库中与所述目标视频的每一维度分别对应的候选视频集合;其中,所述视频索引用于表示所述视频库中相应维度的特征信息与所述视频库中的候选视频之间的索引关系;
27、第三获取模块,用于获取多个所述候选视频集合的交集视频;
28、第一确定模块,用于在所述目标视频与所述交集视频中的任一视频的相似度大于相似度阈值时,确定所述目标视频为待去重视频。
29、第三方面,为了达到上述目的,本申请的实施例提供一种视频去重设备,包括:收发机、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的视频去重方法。
30、第四方面,为了达到上述目的,本申请的实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的视频去重方法。
31、第五方面,为了达到上述目的,本申请的实施例提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如第一方面所述的视频去重方法。
32、本申请的上述技术方案至少具有如下有益效果:
33、本申请实施例的视频去重方法,首先,获取目标视频的多个维度的特征信息,所述多个维度包括类别、标签和关键词中的至少两项;其次,依次将多个维度中的每一维度的特征信息,分别与视频库的对应维度的视频索引进行比较,获得所述视频库中与所述目标视频的每一维度分别对应的候选视频集合;其中,所述视频索引用于表示所述视频库中相应维度的特征信息与所述视频库中的候选视频之间的索引关系;再次,获取多个所述候选视频集合的交集视频;最终,在所述目标视频与所述交集视频中的任一视频的相似度大于相似度阈值时,确定所述目标视频为待去重视频,这里,所述交集视频为用于与目标视频进行相似性比对的一个或多个视频,相对于视频库中的所有视频,此处的交集视频的数量明显减少了很多,如此能够缩小视频相似性比对的范围,从而提升视频去重效率。
本文档来自技高网...【技术保护点】
1.一种视频去重方法,其特征在于,包括:
2.根据权利要求1所述的视频去重方法,其特征在于,获取目标视频的多个维度的特征信息,包括以下至少两个步骤:
3.根据权利要求1所述的视频去重方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的视频去重方法,其特征在于,所述在所述目标视频与所述交集视频中的任一视频的相似度大于相似度阈值时,确定所述目标视频为待去重视频之前,所述方法还包括:
5.根据权利要求4所述的视频去重方法,其特征在于,根据关键词维度的特征信息,在所述目标视频中,提取与所述关键词维度的特征信息相关的关键帧,包括:
6.根据权利要求4所述的视频去重方法,其特征在于,根据所述目标视频的关键帧和所述交集视频的各个视频的关键帧,确定所述目标视频与所述交集视频的各个视频的相似度,包括:
7.一种视频去重装置,其特征在于,包括:
8.一种视频去重设备,其特征在于,包括:收发机、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的视频去重方法。
10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令被处理器执行时实现如权利要求1至6中任一项所述的视频去重方法。
...【技术特征摘要】
1.一种视频去重方法,其特征在于,包括:
2.根据权利要求1所述的视频去重方法,其特征在于,获取目标视频的多个维度的特征信息,包括以下至少两个步骤:
3.根据权利要求1所述的视频去重方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的视频去重方法,其特征在于,所述在所述目标视频与所述交集视频中的任一视频的相似度大于相似度阈值时,确定所述目标视频为待去重视频之前,所述方法还包括:
5.根据权利要求4所述的视频去重方法,其特征在于,根据关键词维度的特征信息,在所述目标视频中,提取与所述关键词维度的特征信息相关的关键帧,包括:
6.根据权利要求4所述的视频去重方法,其特征在于,根据所述目标视频的关...
【专利技术属性】
技术研发人员:杨华,陈闯,
申请(专利权)人:咪咕文化科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。