一种图像检索方法、装置及计算机可读存储介质制造方法及图纸

技术编号:18302202 阅读:35 留言:0更新日期:2018-06-28 12:04
本发明专利技术涉及计算机视觉领域,提供了一种图像检索方法、装置及计算机可读存储介质,以准确、高效地检索背景复杂和/或ROI较小的图像。所述方法包括:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征;基于各降维特征进行聚类,得到多个聚类特征;对多个聚类特征进行特征融合,得到全局特征;基于全局特征,从数据库中对待检索图像进行检索。本发明专利技术一方面,通过对待检索图像的各卷积层特征分别进行降维操作,使得感兴趣区域(Region Of Interest,ROI)可变成任意形状,降低了噪声对图像检索结果的影响;另一方面,通过基于各降维特征进行聚类操作,获取多个聚类区域特征,最大程度上降低了由于光照、角度、遮挡等因素对图像特征的影响。

Image retrieval method, device and computer readable storage medium

The invention relates to the field of computer vision, providing an image retrieval method, device and a computer readable storage medium for accurate and efficient retrieval of complex background and / or smaller ROI images. The methods described include: the dimensionality reduction operation of each layer feature of the retrieved image is treated respectively, and each dimension reduction feature is obtained. Multiple clustering features are obtained based on each dimension reduction feature and multiple clustering features are obtained. The global features are obtained by feature fusion of multiple clustering features, and the retrieved images are treated from the database based on the global feature. Retrieval. On the one hand, the invention can reduce the influence of the Region Of Interest (ROI) to the image retrieval result by treating the feature of each layer of the retrieved image, which can reduce the influence of the noise to the image retrieval result. On the other hand, the clustering operation is carried out on the basis of each dimension reduction feature to obtain multiple clustering areas. Domain features, to a large extent, reduce the influence of illumination, angle, occlusion and other factors on image characteristics.

【技术实现步骤摘要】
一种图像检索方法、装置及计算机可读存储介质
本专利技术属于计算机视觉领域,尤其涉及一种图像检索方法、装置及计算机可读存储介质。
技术介绍
图像检索指的是给定一张待检索图像,通过检索数据库,从中返回一张与该待检索图像最相近的图像的任务。图像检索是计算机视觉及图像分析的重要问题。图像检索在许多领域有些重要的应用,例如,商品推荐、安防监控和医学诊断等。尽管业界投入了很多精力研究图像检索,但非常遗憾的是,图像检索仍然是一个复杂且困难的问题。图像检索的检索精度、效率等受到很多因素的影响,这是因为,一方面,复杂的图像背景往往对感兴趣区域存在着严重的干扰,影响检索的精确度;另一方面,在大规模的图像检索过程中,图像往往达到百万级甚至更大,而图像检索对实时性要求又是十分高的任务,因此要求图像检索的算法必须十分高效、快捷。然而,现有的许多图像检索算法对于具有复杂背景或者感兴趣区域(RegionOfInterest,ROI)较小的图像往往不能准确、高效地提取出有效的检索方案,进而不能提取出好的特征进行检索。上述技术问题亟待业界解决。
技术实现思路
本专利技术提供一种图像检索方法、装置及计算机可读存储介质,以准确、高效地检索背景复杂和/或ROI较小的图像。本专利技术第一方面提供了一种图像检索方法,所述方法包括:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;基于所述各降维特征进行聚类,得到多个聚类特征;对所述多个聚类特征进行特征融合,得到全局特征;基于所述全局特征,从数据库中对所述待检索图像进行检索。结合本专利技术的第一方面,在第一方面的第一种实施方式中,所述对待检索图像的各卷积层特征分别进行降维操作之前,所述方法还包括:将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。结合本专利技术的第一方面的第一种实施方式,在第一方面的第二种实施方式中,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。结合本专利技术的第一方面,在第一方面的第三种实施方式中,所述基于所述各降维特征进行聚类,得到多个聚类特征,包括:基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。结合本专利技术的第一方面,在第一方面的第四种实施方式中,所述对所述多个聚类特征进行特征融合,得到全局特征,包括:分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;将所述各回归聚类特征相加,得到所述全局特征。结合本专利技术的第一方面的第四种实施方式,在第一方面的第五种实施方式中,所述分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征,包括:分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到所述各回归聚类特征。结合本专利技术的第一方面,在第一方面的第六种实施方式中,所述基于所述全局特征,从数据库中对所述待检索图像进行检索,包括:基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,所述K为大于或者等于1的整数。结合本专利技术的第一方面的第六种实施方式,在第一方面的第七种实施方式中,所述基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,包括:计算所述全局特征与所述数据库中各图像特征之间的距离;基于所述全局特征与所述数据库中各图像特征之间的距离,从所述数据库中获取与所述全局特征之间的距离最小的K个图像,作为所述与待检索图像之间的相似度最高的K个图像。结合本专利技术的第一方面的第六种或第七种实施方式,在第一方面的第八种实施方式中,所述方法还包括:展示所述K个图像以及分别与所述待检索图像之间的相似度。结合本专利技术的第一方面,在第一方面的第九种实施方式中,所述降维特征的维度为5。结合本专利技术的第一方面,在第一方面的第十种实施方式中,所述聚类特征的个数为32个。本专利技术第二方面提供了一种图像检索装置,所述装置包括:降维模块,用于对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;聚类模块,用于基于所述各降维特征进行聚类,得到多个聚类特征;融合模块,用于对所述多个聚类特征进行特征融合,得到全局特征;检索模块,用于基于所述全局特征,从数据库中对所述待检索图像进行检索。结合本专利技术的第二方面,在第二方面的第一种实施方式中,所述装置还包括:输入模块,用于将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。结合本专利技术的第二方面的第一种实施方式,在第二方面的第二种实施方式中,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。结合本专利技术的第二方面,在第二方面的第三种实施方式中,所述聚类模块包括:第一处理单元,用于基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;采样单元,用于针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。结合本专利技术的第二方面,在第二方面的第四种实施方式中,所述融合模块包括:回归处理单元,用于分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;相加单元,用于将所述各回归聚类特征相加,得到所述全局特征。结合本专利技术的第二方面的第四种实施方式,在第二方面的第五种实施方式中,所述回归处理单元包括:第二处理单元,用于分别对所述多个聚类特征中的每个聚类特征依次进行均一化处理、白化处理、再均一化处理,得到所述各回归聚类特征。结合本专利技术的第二方面,在第二方面的第六种实施方式中,所述检索模块包括:第一获取单元,用于基于所述全局特征,从所述数据库中获取与所述待检索图像之间的相似度最高的K个图像,所述K为大于或者等于1的整数。结合本专利技术的第二方面的第六种实施方式,在第二方面的第七种实施方式中,所述第一获取单元包括:计算单元,用于计算所述全局特征与所述数据库中各图像特征之间的距离;第二获取单元,用于基于所述全局特征与所述数据库中各图像特征之间的距离,从所述数据库中获取与所述全局特征之间的距离最小的K个图像,作为所述与待检索图像之间的相似度最高的K个图像。结合本专利技术的第二方面的第六种或第七种实施方式,所述装置还包括:展示模块,用于展示所述K个图像以及分别与所述待检索图像之间的相似度。结合本专利技术的第二方面,在第二方面的第九种实施方式中,所述降维特征的维度为5。结合本专利技术的第二方面,在第二方面的第十种实施方式中,所述聚类特征的个数为32个。本专利技术第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;基于所述各降维特征进行聚类,得到多个聚类特征;对所述多个聚类特征进行特征融合,得到全局特征;基于所述全局特征,从数据库中对所述待检索图像进行检索。本专利技术实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现以下步骤:对本文档来自技高网...
一种图像检索方法、装置及计算机可读存储介质

【技术保护点】
1.一种图像检索方法,其特征在于,所述方法包括:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;基于所述各降维特征进行聚类,得到多个聚类特征;对所述多个聚类特征进行特征融合,得到全局特征;基于所述全局特征,从数据库中对所述待检索图像进行检索。

【技术特征摘要】
1.一种图像检索方法,其特征在于,所述方法包括:对待检索图像的各卷积层特征分别进行降维操作,得到各降维特征,所述降维特征的维度小于所述卷积层特征的维度;基于所述各降维特征进行聚类,得到多个聚类特征;对所述多个聚类特征进行特征融合,得到全局特征;基于所述全局特征,从数据库中对所述待检索图像进行检索。2.如权利要求1所述图像检索方法,其特征在于,所述对待检索图像的各卷积层特征分别进行降维操作之前,所述方法还包括:将所述待检索图像输入卷积神经网络,得到所述各卷积层特征。3.如权利要求2所述图像检索方法,其特征在于,每个所述卷积层特征分别用于表征所述图像中对应像素区域的特征。4.如权利要求1所述图像检索方法,其特征在于,所述基于所述各降维特征进行聚类,得到多个聚类特征,包括:基于所述各降维特征之间的距离,将所述降维特征进行聚类,得到多个特征聚类中心;针对所述多个特征聚类中心的每个特征聚类中心,分别对相应的卷积层特征进行最大值采样,作为各特征聚类中心的所述聚类特征。5.如权利要求1所述图像检索方法,其特征在于,所述对所述多个聚类特征进行特征融合,得到全局特征,包括:分别对所述多个聚类特征中的每个聚类特征进行回归处理,得到各回归聚类特征;将所述各回归聚类特征相加,得到所述全局特征。6.如权利要求5所述图像检索...

【专利技术属性】
技术研发人员:旷章辉张伟
申请(专利权)人:深圳市商汤科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1