视频图像数据检索方法、装置、设备和存储介质制造方法及图纸

技术编号：22914019 阅读：22 留言：0更新日期：2019-12-24 21:51

本发明专利技术涉及一种视频图像数据检索方法、装置、设备和存储介质，该方法包括：获取图片检索数据库和训练数据库；将训练数据库中的特征数据进行聚类训练，生成预设数量的数据桶，并确定每个数据桶的聚类中心；计算图片检索数据库中的每一条特征数据与各个聚类中心的距离，按照第一距离规则将图片检索数据库中的每一条特征数据添加到对应的数据桶中，以确定倒排索引表；计算待检索图片的特征矩阵与各个聚类中心的距离，按照第二距离规则确定目标数据桶；基于倒排索引表，计算待检索图片的特征向量矩阵与目标数据桶的聚类中心的距离，按照检索规则确定与待检索图片的相似图片作为检索结果。提高了视频图像数据检索时的性能和效率。

全部详细技术资料下载

【技术实现步骤摘要】
视频图像数据检索方法、装置、设备和存储介质
本专利技术涉及图像数据检索
，具体涉及一种视频图像数据检索方法、装置、设备和存储介质。
技术介绍
随着互联网的飞速发展，大规模视频图像数据在搜索引擎和社会网络中越来越普遍，也吸引了包括智慧社区、智能安防和AI(ArtificialIntelligence，人工智能)城市等解决方案的高度关注。另外，随着人类、城市视频图像资源的不断增加，视频图像数据的规模越来越大。相关技术中，对大规模的视频图像数据的处理虽然可以获得较好的聚类效果，但是聚类时训练集的训练耗时、模型正确性验证复杂且麻烦；而且，部分深度网络模型不仅需要训练，在线上部署时需要GPU(GraphicsProcessingUnit，图形处理器)支持，这样，在模型比较复杂时，需要大量的计算性能来构建。这样，相关技术在检索前的数据处理上比较高效，在检索方法有很大的局限性，例如，处理速度慢以及检索性能差等。
技术实现思路
有鉴于此，提供一种视频图像数据检索方法、装置、设备和存储介质，以解决相关技术中在面临大规模、高维度、分布稀疏的视频图像数据时，检索难度大、检索性能差以及检索效率低的问题。本专利技术采用如下技术方案：第一方面，本申请实施例提供了一种视频图像数据检索方法，该方法包括：获取图片检索数据库和训练数据库；将所述训练数据库中的特征数据进行聚类训练，生成预设数量的数据桶，并确定每个数据桶的聚类中心；计算所述图片检索数据库中的每一条特征数据与各...

【技术保护点】
1.一种视频图像数据检索方法，其特征在于，包括：/n获取图片检索数据库和训练数据库；/n将所述训练数据库中的特征数据进行聚类训练，生成预设数量的数据桶，并确定每个数据桶的聚类中心；/n计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离，按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中，以确定倒排索引表；/n计算待检索图片的特征矩阵与各个所述聚类中心的距离，按照第二距离规则确定目标数据桶；/n基于所述倒排索引表，计算所述待检索图片的特征向量矩阵与所述目标数据桶的聚类中心的距离，按照检索规则确定与所述待检索图片的相似图片作为检索结果。/n

【技术特征摘要】
1.一种视频图像数据检索方法，其特征在于，包括：
获取图片检索数据库和训练数据库；
将所述训练数据库中的特征数据进行聚类训练，生成预设数量的数据桶，并确定每个数据桶的聚类中心；
计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离，按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中，以确定倒排索引表；
计算待检索图片的特征矩阵与各个所述聚类中心的距离，按照第二距离规则确定目标数据桶；
基于所述倒排索引表，计算所述待检索图片的特征向量矩阵与所述目标数据桶的聚类中心的距离，按照检索规则确定与所述待检索图片的相似图片作为检索结果。

2.根据权利要求1所述的方法，其特征在于，获取图片检索数据库和训练数据库之前，还包括：
获取原始图片检索数据库和原始训练数据库；
提取所述原始图片检索数据库中的图片的检索特征数据，以及，所述原始训练数据库中的图片的训练特征数据；
对所述检索特征数据和所述训练特征数据进行降维和压缩处理，得到图片检索数据库和训练数据库；
其中，所述图片检索数据库中的特征数据的维度和所述训练数据库中的特征数据的维度相同，所述图片检索数据库中的特征数据的压缩级别和所述训练数据库中的特征数据的压缩级别相同。

3.根据权利要求2所述的方法，其特征在于，计算待检索图片的特征矩阵与各个所述聚类中心的距离之前，还包括：
获取原始待检索图片，对所述原始待检索图片进行降维和压缩处理得到待检索图片，其中，所述待检索图片的特征数据的维度与所述图片检索数据库中的特征数据的维度相同，所述待检索图片的特征数据的压缩级别与所述图片检索数据库中的特征数据的级别相同。

4.根据权利要求1所述的方法，其特征在于，所述将所述训练数据库中的特征数据进行聚类训练，生成预设数量的数据桶，并确定每个数据桶的聚类中心，包括：
应用K-Means聚类算法将所述训练数据库中的特征数据进行聚类训练，生成预设数量的数据桶，其中，所述预设数量为K，K为正整数；
确定每个数据桶的聚类中心。

5.根据权利要求1所述的方法，其特征在于，所述计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的距离，按照第一距离规则将所述图片检索数据库中的每一条特征数据添加到对应的数据桶中，以确定倒排索引表；
计算所述图片检索数据库中的每一条特征数据与各个所述聚类中心的向量内积或者欧氏距离；
按照向量内积最大或者欧氏距离最小的第一距离...

【专利技术属性】
技术研发人员：常亮，
申请(专利权)人：四川东方网力科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人