【技术实现步骤摘要】
相似视频检索库构建方法、应用方法和装置
[0001]本公开涉及图像处理
,尤其涉及视频分析
,具体涉及一种相似视频检索库构建方法、应用方法、装置、电子设备、存储介质及产品。
技术介绍
[0002]由于互联网视频类网站以及各个视频应用的快速发展,版权视频呈现爆发式增长。并且一些视频存储和视频播放等网站,提供了用户上传视频的功能。而上传的视频可能存在侵犯版权风险,具有较大的安全隐患。
[0003]因此,相关技术中提出视频检测技术,以根据视频检测技术对视频进行相似检测。为了增大视频检测的范围,以保证检测结果的全面性,通常参与匹配的样本视频数据量多达几百万个视频,相关技术对比视频帧等技术手段的检索效率相对较低,且在大量样本视频数据的情况下,其检测相似视频的准确性会明显下降。
技术实现思路
[0004]本公开提供了一种相似视频检索库构建方法、应用方法、装置、电子设备、存储介质及产品。
[0005]根据本公开的第一方面,提供了一种相似视频检索库构建方法,所述方法包括:
[0006]采集多个样本视频图像帧的样本特征向量;构建分布式集群检索库,并基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量;基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中。
[0007]根据本公开的第二方面,提供了一种似视频检索库应用方法,所述方法包括:
[0008]获取待检测视频图像帧的待 ...
【技术保护点】
【技术特征摘要】
1.一种相似视频检索库构建方法,所述方法包括:采集多个样本视频图像帧的样本特征向量;构建分布式集群检索库,并基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量;基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中,得到相似视频检索库。2.根据权利要求1所述的方法,其中,所述基于所述样本特征向量的数量,对每个集群检索库进行聚类划分,得到多个空间,以及与所述空间对应的聚类中心向量,包括:针对每个集群检索库,将所述集群划分为多个第一空间,并基于样本特征向量的数量为每个所述第一空间确定对应的聚类中心向量;针对每个第一空间,将所述第一空间聚类划分为多个第二空间,并将所述第一空间的聚类中心向量确定为每个所述第二空间的聚类中心向量。3.根据权利要求2所述的方法,其中,所述基于所述样本特征向量和所述聚类中心向量之间的距离,将所述样本视频分布式存储到所述分布式集群检索库中,包括:计算每个样本特征向量与所述聚类中心向量的距离;根据所述距离,确定所述第一空间对应的向量区间;将属于所述向量区间内的样本特征向量对应的样本视频,存储到所述向量区间对应的第一空间中;针对每个所述第一空间对应的第二空间的数量,将所述第一空间内的样本特征向量聚类存储到第二空间;基于所述第一空间和所述第二空间存储的样本视频,确定集群检索库,并基于所述集群检索库确定分布式集群检索库。4.根据权利要求3所述的方法,其中,所述将所述第一空间内的样本特征向量聚类存储到第二空间之后,所述方法包括:计算每个所述第二空间中的样本特征向量与所述聚类中心向量的残差向量;使用量化器对所述残差向量进行编码,得到每个所述第二空间的编码结果;获取预先构建的倒排链,以及所述倒排链上的倒排索引,所述倒排索引与每个第二空间一一对应;将所述编码结果置于对应的所述倒排索引上。5.根据权利要求1
‑
4中任一项所述的方法,其中,所述方法还包括:针对每个样本视频,将所述样本视频的字节进行压缩;基于压缩后的字节数量,对所述样本视频的全部样本特征向量进行聚类,确定多个样本特征向量区域;将所述样本视频的全部样本特征向量聚类划分至相应的特征向量区域。6.基于权利要求1
‑
5的一种相似视频检索库应用方法,所述方法包括:获取待检测视频图像帧的待检测特征向量;在所述分布式集群检索库中,将所述待检测特征向量与所述样本特征向量进行匹配,得到第一匹配结果;获取所述第一匹配结果大于或等于第一阈值对应的第一样本视频,将所述待检测特征
向量与所述第一样本视频的样本特征向量进行匹配,得到第二匹配结果;将所述第二匹配结果大于或等于第二阈值对应的第一样本视频,确定为与所述待检测视频的相似视频。7.根据权利要求6所述的方法,其中,所述在所述分布式集群检索库中,将所述待检测特征向量与所述样本特征向量进行匹配,得到第一匹配结果,包括:获取第一数量的待检测特征向量;在所述分布式集群检索库中,基于人工神经网络技术,将所述第一数量的待检测特征向量与所述样本特征向量进行匹配,得到待检测视频和样本视频的第一相似度;将所述第一相似度确定为所述第一匹配结果。8.根据权利要求6所述的方法,其中,所述将所述待检测特征向量与所述第一样本视频的样本特征向量进行匹配,得到第二匹配...
【专利技术属性】
技术研发人员:唐勇平,李瑞锋,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。