一种图片检索方法和系统技术方案

技术编号:15301780 阅读:127 留言:0更新日期:2017-05-13 08:20
本发明专利技术提供了一种图片检索方法和系统,涉及图片检索技术领域。在本发明专利技术实施例中,首先建立图片数据集并提取每一张图片对应的特征数据进行处理以得到特征数据矩阵;然后根据图片所属种类信息构建类别矩阵和类别‑属性矩阵,并将特征数据矩阵划分为训练矩阵和测试矩阵,进而求取哈希转换函数;再通过哈希转换函数分别对训练矩阵和测试矩阵进行编码,并从训练编码矩阵和测试编码矩阵中选取预设数量张图片构成检索库,最后,从测试编码矩阵中选取图片,计算并依据该图片的哈希码与检索库中的图片的哈希码之间的汉明距离,依次输出检索结果。本发明专利技术实施例能够有效提高图片检索效率,降低图片检索成本。

Picture retrieval method and system

The invention provides a picture retrieval method and a system, relating to the technical field of picture retrieval. In the embodiment of the invention, the feature data first establish images data and extract each picture corresponding to the data processing to get the feature matrix; then according to the picture category and category matrix attribute matrix construction type information, and the characteristics of the data matrix is divided into training and test matrix matrix, then obtain the hash conversion through the hash function; the transfer function of the training and test matrix matrix encoding, and from the training and test matrix encoding matrix encoding selected preset number of picture retrieval form library, finally, from the test series of selected picture code matrix, calculating the distance between the foundation and the hash code hash code of the picture and retrieval in the library a picture of the Hamming, sequentially outputs the retrieval results. The embodiment of the invention can effectively improve the efficiency of image retrieval and reduce the cost of image retrieval.

【技术实现步骤摘要】

本专利技术涉及图片检索
,具体而言,涉及一种图片检索方法和系统
技术介绍
随着云计算、物联网、移动电话、社交媒体等信息技术的发展,互联网上的数据呈爆炸式的增长,大数据时代已经到来。在大数据时代,如何进行快速的图片检索,是人们关注的重点。其中,哈希学习通过学习图片的二进制代码表示,节省了存储空间,加快了查询速度,在图片相近性检索中被广泛研究。经专利技术人研究发现,传统的哈希学习,需要人们预先标注大量待编码的图片,供哈希学习算法进行预训练,但是,在大数据时代,随着不断涌现的新数据,昂贵的人工标注和耗时的预训练过程阻碍了哈希学习算法在实际图片检索过程中的应用。
技术实现思路
本专利技术旨在改善上述的技术问题。为此,本专利技术提供一种图片检索方法和系统,旨在大数据时代背景下,能够规避昂贵的人工标注过程和预训练过程,提高图片检索效率。本专利技术较佳实施例提供一种图片检索方法,所述方法包括:建立图片数据集,提取所述图片数据集中每一张图片对应的特征数据并处理,以得到特征数据矩阵;根据图片所属种类信息构建描述每一张图片对应的类别种类的类别矩阵和描述每一个类别对应的图片属性信息的类别-属性矩阵;将所述特征数据矩阵划分为训练矩阵和测试矩阵,其中,所述训练矩阵中不包含所述测试矩阵中包括的类别种类;根据所述训练矩阵、类别矩阵和类别-属性矩阵构建目标损失函数,进而求取哈希转换函数;使用所述哈希转换函数分别对所述训练矩阵和测试矩阵进行编码,得到训练编码矩阵和测试编码矩阵;从所述训练编码矩阵和测试编码矩阵中选取预设数量张图片构成检索库,从所述测试编码矩阵中选取图片,并计算该图片的哈希码与所述检索库中的图片的哈希码之间的汉明距离,进而根据所述汉明距离的大小顺序,依次输出检索结果。本专利技术另一较佳实施例提供一种图片检索系统,所述系统包括:特征数据获取模块,用于建立图片数据集,提取所述图片数据集中每一张图片对应的特征数据并处理,以得到特征数据矩阵;类别矩阵构建模块,用于根据图片所属种类信息构建描述每一张图片对应的类别种类的类别矩阵和描述每一个类别对应的图片属性信息的类别-属性矩阵;数据划分模块,用于将所述特征数据矩阵划分为训练矩阵和测试矩阵,其中,所述训练矩阵中不包含所述测试矩阵中包括的类别种类;函数生成模块,用于根据所述训练矩阵、类别矩阵和类别-属性矩阵构建目标损失函数,进而求取哈希转换函数;编码模块,用于使用所述哈希转换函数分别对所述训练矩阵和测试矩阵进行编码,得到训练编码矩阵和测试编码矩阵;检索模块,用于从所述训练编码矩阵和测试编码矩阵中选取预设数量张图片构成检索库,从所述测试编码矩阵中选取图片,并计算该图片的哈希码与所述检索库中的图片的哈希码之间的汉明距离,进而根据所述汉明距离的大小顺序,依次输出检索结果。与现有技术相比,本专利技术利用样本之间的属性信息,并结合传统哈希算法,提出了基于属性哈希算法的图片检索方法和系统,其中,训练数据和测试数据可以进行两者监督信息的共享,且测试数据并不需要在训练阶段出现,有效避免了传统哈希算法在进行图片检索时的人工标注过程和预训练过程,实现了零样本图片检索,从而有效提高了图片检索效率。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术较佳实施例提供的计算机设备的结构框图。图2为本专利技术较佳实施例提供的图片检索系统的结构框图。图3为图2中的特征数据获取模块的结构框图。图4为图2中的哈希转换函数生成模块的结构框图。图5为本专利技术另一较佳实施例提供的图片检索方法的流程示意图。图6为图5中的步骤S102的子流程示意图。图7为图5中的步骤S108的子流程示意图。图8a为本专利技术提供的图片检索方法与现有哈希方法在AWA数据集下的平均准确率仿真结果示意图。图8b为本专利技术提供的图片检索方法与现有哈希方法在AWA数据集下的准确率仿真结果示意图。图9a为本专利技术提供的图片检索方法与现有哈希方法在CIFAR数据集下的平均准确率仿真结果示意图。图9b为本专利技术提供的图片检索方法与现有哈希方法在CIFAR数据集下的准确率仿真结果示意图。图标:10-计算机设备;100-图片检索系统;102-特征获取模块;1022-第一处理子模块;1024-第二处理子模块;104-类别矩阵构建模块;106-数据划分模块;108-哈希转换函数生成模块;1082-目标损失函数生成子模块;1084-哈希转换函数生成子模块;110-编码模块;112-检索模块;200-处理器;300-存储器。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。请参阅图1,为本专利技术实施例提供一种的计算机设备10的结构框图,所述计算机设备10包括图片检索系统100、处理器200和存储器300,所述计算机设备10可以是,但不限于,PC机、智能手机、服务器等。其中,所述存储器300与处理器200之间可通过一条或多条通讯总线或信号线实现电性连接。所述图片检索系统100包括至少一个可以软件或固件的形式存储于所述存储器300中或固化在所述计算机设备10的操作系统中的软件功能模块。所述处理器200用于执行所述存储器300中存储的可执行模块,例如所述图片检索系统100所包括的软件功能模块及计算机程序等。如图2所示,为本专利技术较佳实施例提供的图片检索系统100的结构框图,所述图片检索系统100包括特征获取模块102、类别矩阵构建模块104、数据划分模块106、哈希转换函数生成模块108、编码模块110和检索模块112。所述特征获取模块102用于建立图片数据集,提取所述图片数据集中每一张图片对应的特征数据并处理,以得到特征数据矩阵。可选地,如图3所示,所述特征获取模块102包括第一处理子模块1022和第一处理子模块1022。其中,所述第一处理子模块1022用于在对每一张图片的特征数据做归一化处理之前,使用Caffe深度学习框架,本文档来自技高网...
一种图片检索方法和系统

【技术保护点】
一种图片检索方法,其特征在于,所述方法包括:建立图片数据集,提取所述图片数据集中每一张图片对应的特征数据并处理,以得到特征数据矩阵;根据图片所属种类信息构建描述每一张图片对应的类别种类的类别矩阵和描述每一个类别对应的图片属性信息的类别‑属性矩阵;将所述特征数据矩阵划分为训练矩阵和测试矩阵,其中,所述训练矩阵中不包含所述测试矩阵中包括的类别种类;根据所述训练矩阵、类别矩阵和类别‑属性矩阵构建目标损失函数,进而求取哈希转换函数;使用所述哈希转换函数分别对所述训练矩阵和测试矩阵进行编码,得到训练编码矩阵和测试编码矩阵;从所述训练编码矩阵和测试编码矩阵中选取预设数量张图片构成检索库,从所述测试编码矩阵中选取图片,并计算该图片的哈希码与所述检索库中的图片的哈希码之间的汉明距离,进而根据所述汉明距离的大小顺序,依次输出检索结果。

【技术特征摘要】
1.一种图片检索方法,其特征在于,所述方法包括:建立图片数据集,提取所述图片数据集中每一张图片对应的特征数据并处理,以得到特征数据矩阵;根据图片所属种类信息构建描述每一张图片对应的类别种类的类别矩阵和描述每一个类别对应的图片属性信息的类别-属性矩阵;将所述特征数据矩阵划分为训练矩阵和测试矩阵,其中,所述训练矩阵中不包含所述测试矩阵中包括的类别种类;根据所述训练矩阵、类别矩阵和类别-属性矩阵构建目标损失函数,进而求取哈希转换函数;使用所述哈希转换函数分别对所述训练矩阵和测试矩阵进行编码,得到训练编码矩阵和测试编码矩阵;从所述训练编码矩阵和测试编码矩阵中选取预设数量张图片构成检索库,从所述测试编码矩阵中选取图片,并计算该图片的哈希码与所述检索库中的图片的哈希码之间的汉明距离,进而根据所述汉明距离的大小顺序,依次输出检索结果。2.根据权利要求1所述的图片检索方法,其特征在于,所述构建目标损失函数的步骤包括:构造多层信息表示空间项其中,Xtrain表示图片在特征空间的信息,B表示图片在哈希码空间的信息,S表示图片在属性空间的信息,Ytrain表示图片在类别空间的信息,V和P用于不同空间之间的转换;构造正则项其中,L为Xtrain的拉普拉斯矩阵;将所述多层信息表示空间项与所述正则项相加,得到所述目标损失函数。3.根据权利要求2所述的图片检索方法,其特征在于,所述求取哈希转换函数的步骤为:使用坐标下降法和离散循环坐标下降法,分别对所述目标损失函数中的P、B、V进行迭代优化,从而得到哈希转换函数其中,P为哈希函数。4.根据权利要求1所述的图片检索方法,其特征在于,所述得到特征数据矩阵的步骤包括:对每一张图片的特征数据做归一化处理,得到归一化数据;从所述归一化数据中选取m个锚点,利用m个锚点,再次对所述归一化数据进行处理,处理后的每张图片保存为m维矩阵,作为特征数据矩阵,其中,所述锚点为随机在所述归一化数据中选取的图片。5.根据权利要求4所述的图片检索方法,其特征在于,所述从所述归一化数据中选取m个锚点,利用m个锚点,再次对所述归一化数据进行处理的步骤包括:随机从所述归一化数据中抽取m张图片作为锚点;利用公式将图片的特征数据x转换为矩阵将所述矩阵进行拼接生成特征数据矩阵,其中,δ=1,a1、a2、a3……、am分别对应m个锚点。6.根据权利要求1所述的图片检索方法,其特征在于,提取所述图片数据集中每一张图片对应的特征数据并处理的步骤包...

【专利技术属性】
技术研发人员:杨阳徐亚辉沈复民谢宁申恒涛
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1