相似视频检索库构建方法、应用方法和装置制造方法及图纸

技术编号:38013022 阅读:10 留言:0更新日期:2023-06-30 10:35
本公开提供了相似视频检索库构建方法、应用方法和装置,涉及图像处理技术领域,尤其涉及视频分析技术领域。具体实现方案为:采集多个样本视频图像帧的样本特征向量;构建分布式集群检索库,并基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量;基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中。通过本公开可以存储大量的样本视频,且可以提高检索相似视频的检索效率机器准确性。准确性。准确性。

【技术实现步骤摘要】
相似视频检索库构建方法、应用方法和装置


[0001]本公开涉及图像处理
,尤其涉及视频分析
,具体涉及一种相似视频检索库构建方法、应用方法、装置、电子设备、存储介质及产品。

技术介绍

[0002]由于互联网视频类网站以及各个视频应用的快速发展,版权视频呈现爆发式增长。并且一些视频存储和视频播放等网站,提供了用户上传视频的功能。而上传的视频可能存在侵犯版权风险,具有较大的安全隐患。
[0003]因此,相关技术中提出视频检测技术,以根据视频检测技术对视频进行相似检测。为了增大视频检测的范围,以保证检测结果的全面性,通常参与匹配的样本视频数据量多达几百万个视频,相关技术对比视频帧等技术手段的检索效率相对较低,且在大量样本视频数据的情况下,其检测相似视频的准确性会明显下降。

技术实现思路

[0004]本公开提供了一种相似视频检索库构建方法、应用方法、装置、电子设备、存储介质及产品。
[0005]根据本公开的第一方面,提供了一种相似视频检索库构建方法,所述方法包括:
[0006]采集多个样本视频图像帧的样本特征向量;构建分布式集群检索库,并基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量;基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中。
[0007]根据本公开的第二方面,提供了一种似视频检索库应用方法,所述方法包括:
[0008]获取待检测视频图像帧的待检测特征向量;在所述分布式集群检索库中,将所述待检测特征向量与所述样本特征向量进行匹配,得到第一匹配结果;获取所述第一匹配结果大于或等于第一阈值对应的第一样本视频,将所述待检测特征向量与所述第一样本视频的样本特征向量进行匹配,得到第二匹配结果;将所述第二匹配结果大于或等于第二阈值对应的第一样本视频,确定为与所述待检测视频的相似视频。
[0009]根据本公开的第三方面,提供了一种相似视频检索库构建装置,所述装置包括:
[0010]采集模块,用于采集多个样本视频图像帧的样本特征向量;构建模块,用于构建分布式集群检索库,并基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量;存储模块,用于基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中。
[0011]根据本公开的第四方面,提供了一种似视频检索库应用方法,所述方法包括:
[0012]获取模块,用于获取待检测视频图像帧的待检测特征向量;匹配模块,用于在所述分布式集群检索库中,将所述待检测特征向量与所述样本特征向量进行匹配,得到第一匹配结果;所述匹配模块,还用于获取所述第一匹配结果大于或等于第一阈值对应的第一样
本视频,将所述待检测特征向量与所述第一样本视频的样本特征向量进行匹配,得到第二匹配结果;确定模块,用于将所述第二匹配结果大于或等于第二阈值对应的第一样本视频,确定为与所述待检测视频的相似视频。
[0013]根据本公开的第五方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或第二方面所述的方法。
[0015]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面或第二方面所述的方法。
[0016]根据本公开的第七方面,提供了一种计算机产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面或第二方面所述的方法。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1示出了本公开实施例提供的一种相似视频检索库构建方法的流程示意图;
[0020]图2示出了本公开实施例提供的一种存储方法的流程示意图,如图2中所示;
[0021]图3示出了本公开实施例提供的一种编码方法的流程示意图;
[0022]图4出了本公开实施例提供的一种分布式集群检索库样本视频检索架构的示意图;
[0023]图5示出了本公开实施例提供的一种压缩方法的流程示意图;
[0024]图6出了本公开实施例提供的一种分单独样本视频检索架构的示意图;
[0025]图7示出了本公开实施例提供的一种视频检索方法的示意图;
[0026]图8示出了本公开实施例提供的一种相似视频检索库应用方法的流程示意图;
[0027]图9示出了本公开实施例提供的一种二次检索方法的示意图;
[0028]图10示出了本公开实施例提供的一种相似视频检索库构建装置的结构示意图;
[0029]图11示出了本公开实施例提供的一种相似视频检索库应用装置的结构示意图;
[0030]图12示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]由于互联网视频类网站以及各个视频应用的快速发展,版权视频呈现爆发式增长。并且一些视频存储和视频播放等网站,提供了用户上传视频的功能。而上传的视频可能存在侵犯版权风险,具有较大的安全隐患。
[0033]因此,相关技术中提出视频检测技术,以根据视频检测技术对视频进行相似检测。
为了增大视频检测的范围,以保证检测结果的全面性,通常参与匹配的样本视频数据量多达几百万个视频,相关技术对比视频帧等技术手段的检索效率相对较低,且在大量样本视频数据的情况下,其检测相似视频的准确性会明显下降。
[0034]相关技术中,可以通过一下方式确定相似视频:
[0035](1)通过人工审核的方式确定,上传的视频是否存在相似视频。
[0036](2)使用信息摘要算法(Message

Digest Algorithm,md5)。通过对视频文件进行哈希处理,可以得到一串长度固定的字符串序列号。通过比较两个视频的md5值来判断视频是否相同。
[0037](3)通过对比两个视频的图像帧,根据两个视频的图像帧判断帧与帧之间的相似度,如果帧与帧之间的相似达到某个阈值,则认为其对应的视频也相似。
[0038]但本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相似视频检索库构建方法,所述方法包括:采集多个样本视频图像帧的样本特征向量;构建分布式集群检索库,并基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量;基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中,得到相似视频检索库。2.根据权利要求1所述的方法,其中,所述基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量,包括:针对每个集群检索库,将所述集群划分为多个第一空间,并基于样本特征向量的数量为每个所述第一空间确定对应的聚类中心向量;针对每个第一空间,将所述第一空间聚类划分为多个第二空间,并将所述第一空间的聚类中心向量确定为每个所述第二空间的聚类中心向量。3.根据权利要求2所述的方法,其中,所述基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中,包括:计算每个样本特征向量与所述聚类中心向量的距离;根据所述距离,确定所述第一空间对应的向量区间;将属于所述向量区间内的样本特征向量对应的样本视频,存储到所述向量区间对应的第一空间中;针对每个所述第一空间对应的第二空间的数量,将所述第一空间内的样本特征向量聚类存储到第二空间;基于所述第一空间和所述第二空间存储的样本视频,确定集群检索库,并基于所述集群检索库确定分布式集群检索库。4.根据权利要求3所述的方法,其中,所述将所述第一空间内的样本特征向量聚类存储到第二空间之后,所述方法包括:计算每个所述第二空间中的样本特征向量与所述聚类中心向量的残差向量;使用量化器对所述残差向量进行编码,得到每个所述第二空间的编码结果;获取预先构建的倒排链,以及所述倒排链上的倒排索引,所述倒排索引与每个第二空间一一对应;将所述编码结果置于对应的所述倒排索引上。5.根据权利要求1

4中任一项所述的方法,其中,所述方法还包括:针对每个样本视频,将所述样本视频的字节进行压缩;基于压缩后的字节数量,对所述样本视频的全部样本特征向量进行聚类,确定多个样本特征向量区域;将所述样本视频的全部样本特征向量聚类划分至相应的特征向量区域。6.基于权利要求1

5的一种相似视频检索库应用方法,所述方法包括:获取待检测视频图像帧的待检测特征向量;在所述分布式集群检索库中,将所述待检测特征向量与所述样本特征向量进行匹配,得到第一匹配结果;获取所述第一匹配结果大于或等于第一阈值对应的第一样本视频,将所述待检测特征
向量与所述第一样本视频的样本特征向量进行匹配,得到第二匹配结果;将所述第二匹配结果大于或等于第二阈值对应的第一样本视频,确定为与所述待检测视频的相似视频。7.根据权利要求6所述的方法,其中,所述在所述分布式集群检索库中,将所述待检测特征向量与所述样本特征向量进行匹配,得到第一匹配结果,包括:获取第一数量的待检测特征向量;在所述分布式集群检索库中,基于人工神经网络技术,将所述第一数量的待检测特征向量与所述样本特征向量进行匹配,得到待检测视频和样本视频的第一相似度;将所述第一相似度确定为所述第一匹配结果。8.根据权利要求6所述的方法,其中,所述将所述待检测特征向量与所述第一样本视频的样本特征向量进行匹配,得到第二匹配...

【专利技术属性】
技术研发人员:唐勇平李瑞锋
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1