视频图像数据检索方法、装置、设备和存储介质制造方法及图纸

技术编号:22914019 阅读:22 留言:0更新日期:2019-12-24 21:51
本发明专利技术涉及一种视频图像数据检索方法、装置、设备和存储介质,该方法包括:获取图片检索数据库和训练数据库;将训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心;计算图片检索数据库中的每一条特征数据与各个聚类中心的距离,按照第一距离规则将图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表;计算待检索图片的特征矩阵与各个聚类中心的距离,按照第二距离规则确定目标数据桶;基于倒排索引表,计算待检索图片的特征向量矩阵与目标数据桶的聚类中心的距离,按照检索规则确定与待检索图片的相似图片作为检索结果。提高了视频图像数据检索时的性能和效率。

【技术实现步骤摘要】
视频图像数据检索方法、装置、设备和存储介质
本专利技术涉及图像数据检索
,具体涉及一种视频图像数据检索方法、装置、设备和存储介质。
技术介绍
随着互联网的飞速发展,大规模视频图像数据在搜索引擎和社会网络中越来越普遍,也吸引了包括智慧社区、智能安防和AI(ArtificialIntelligence,人工智能)城市等解决方案的高度关注。另外,随着人类、城市视频图像资源的不断增加,视频图像数据的规模越来越大。相关技术中,对大规模的视频图像数据的处理虽然可以获得较好的聚类效果,但是聚类时训练集的训练耗时、模型正确性验证复杂且麻烦;而且,部分深度网络模型不仅需要训练,在线上部署时需要GPU(GraphicsProcessingUnit,图形处理器)支持,这样,在模型比较复杂时,需要大量的计算性能来构建。这样,相关技术在检索前的数据处理上比较高效,在检索方法有很大的局限性,例如,处理速度慢以及检索性能差等。
技术实现思路
有鉴于此,提供一种视频图像数据检索方法、装置、设备和存储介质,以解决相关技术中在面临大规模、高维度、分布稀疏的视频图像数据时,检索难度大、检索性能差以及检索效率低的问题。本专利技术采用如下技术方案:第一方面,本申请实施例提供了一种视频图像数据检索方法,该方法包括:获取图片检索数据库和训练数据库;将所述训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心;计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离,按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表;计算待检索图片的特征矩阵与各个所述聚类中心的距离,按照第二距离规则确定目标数据桶;基于所述倒排索引表,计算所述待检索图片的特征向量矩阵与所述目标数据桶的聚类中心的距离,按照检索规则确定与所述待检索图片的相似图片作为检索结果。第二方面,本申请实施例提供了一种视频图像数据检索装置,该装置包括:数据获取模块,用于获取图片检索数据库和训练数据库;聚类模块,用于将所述训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心;索引表确定模块,用于计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离,按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表;目标数据桶确定模块,用于计算待检索图片的特征矩阵与各个所述聚类中心的距离,按照第二距离规则确定目标数据桶;检索模块,用于基于所述倒排索引表,计算所述待检索图片的特征向量矩阵与所述目标数据桶的聚类中心的距离,按照检索规则确定与所述待检索图片的相似图片作为检索结果。第三方面,本申请实施例提供了一种设备,该设备包括:处理器,以及与所述处理器相连接的存储器;所述存储器用于存储计算机程序,所述计算机程序至少用于执行本申请实施例第一方面所述的视频图像数据检索方法;所述处理器用于调用并执行所述存储器中的所述计算机程序。第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面所述的视频图像数据检索方法中各个步骤。本专利技术采用以上技术方案,通过获取图片检索数据库和训练数据库;将训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心,这样就可以进行数据分桶,以便把高维数据点散列到多个数据桶中,提高检索效率;计算图片检索数据库中的每一条特征数据与各个聚类中心的距离,按照第一距离规则将图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表,采用倒排索引和数据分桶,更好降低高维数据检索中的时间复杂度和空间复杂度;计算待检索图片的特征矩阵与各个聚类中心的距离,按照第二距离规则确定目标数据桶;基于倒排索引表,计算待检索图片的特征向量矩阵与目标数据桶的聚类中心的距离,按照检索规则确定与待检索图片的相似图片作为检索结果。因此,在面临大规模、高维度、分布稀疏的数据时,检索过程更加高效,检索性能提高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种视频图像检索方法的流程图;图2是本专利技术实施例提供的另一种视频图像检索方法的流程图;图3是本专利技术实施例中适用的一种降维示例中的降维前的数据集示意图;图4是本专利技术实施例中适用的一种降维示例中处理过程中的数据集示意图;图5是本专利技术实施例中适用的另一种降维示例中处理过程中的数据集示意图;图6是本专利技术实施例提供的一种视频图像检索装置的结构示意图;图7是本专利技术实施例中提供的一种设备的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。实施例图1为本专利技术实施例提供的一种视频图像检索方法的流程图,该方法可以由本专利技术实施例提供的视频图像检索装置来执行,该装置可采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下步骤:S101、获取图片检索数据库和训练数据库。具体的,图片检索数据库通常包括大量的图片,例如,100万张,这些图片可以是随机抓拍的某个城市中各个监控路口的图片,还可以是某个小区中在某段时间内的监控到的图片。另外,这里的图片可以是指直接抓拍的图片,还可以是从监控到的视频图像中提取的视频帧得到的多张图片。本申请实施例的应用场景可以是,从大量的图片检索数据库的图片中,找到与待检索图片相似的图片,这个过程可以称为检索过程。此外,还需要获取训练数据库,训练数据库中也包括大量的图片,这些图片和图片检索库中的图片可以相同,可以不同,也可以有部分相同,也即,没有必然的联系。通过训练数据库,可以将图片检索数据库进行整合处理,再进行视频图像数据的检索。S102、将训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心。其中,数据桶,可以理解为数据库中的数据集中的一部分,一个数据集可以生成多个数据桶,而生成数据桶的方式通常是聚类处理。将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类,由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。在本申请实施例中,当集合中的对象为视频图像中的特征数据时,每个类称本文档来自技高网...

【技术保护点】
1.一种视频图像数据检索方法,其特征在于,包括:/n获取图片检索数据库和训练数据库;/n将所述训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心;/n计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离,按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表;/n计算待检索图片的特征矩阵与各个所述聚类中心的距离,按照第二距离规则确定目标数据桶;/n基于所述倒排索引表,计算所述待检索图片的特征向量矩阵与所述目标数据桶的聚类中心的距离,按照检索规则确定与所述待检索图片的相似图片作为检索结果。/n

【技术特征摘要】
1.一种视频图像数据检索方法,其特征在于,包括:
获取图片检索数据库和训练数据库;
将所述训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心;
计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离,按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表;
计算待检索图片的特征矩阵与各个所述聚类中心的距离,按照第二距离规则确定目标数据桶;
基于所述倒排索引表,计算所述待检索图片的特征向量矩阵与所述目标数据桶的聚类中心的距离,按照检索规则确定与所述待检索图片的相似图片作为检索结果。


2.根据权利要求1所述的方法,其特征在于,获取图片检索数据库和训练数据库之前,还包括:
获取原始图片检索数据库和原始训练数据库;
提取所述原始图片检索数据库中的图片的检索特征数据,以及,所述原始训练数据库中的图片的训练特征数据;
对所述检索特征数据和所述训练特征数据进行降维和压缩处理,得到图片检索数据库和训练数据库;
其中,所述图片检索数据库中的特征数据的维度和所述训练数据库中的特征数据的维度相同,所述图片检索数据库中的特征数据的压缩级别和所述训练数据库中的特征数据的压缩级别相同。


3.根据权利要求2所述的方法,其特征在于,计算待检索图片的特征矩阵与各个所述聚类中心的距离之前,还包括:
获取原始待检索图片,对所述原始待检索图片进行降维和压缩处理得到待检索图片,其中,所述待检索图片的特征数据的维度与所述图片检索数据库中的特征数据的维度相同,所述待检索图片的特征数据的压缩级别与所述图片检索数据库中的特征数据的级别相同。


4.根据权利要求1所述的方法,其特征在于,所述将所述训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,并确定每个数据桶的聚类中心,包括:
应用K-Means聚类算法将所述训练数据库中的特征数据进行聚类训练,生成预设数量的数据桶,其中,所述预设数量为K,K为正整数;
确定每个数据桶的聚类中心。


5.根据权利要求1所述的方法,其特征在于,所述计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离,按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中,以确定倒排索引表;
计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的向量内积或者欧氏距离;
按照向量内积最大或者欧氏距离最小的第一距离...

【专利技术属性】
技术研发人员:常亮
申请(专利权)人:四川东方网力科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1