一种多标签图像的二值向量生成方法及图像语义相似度查询方法技术

技术编号：18763861 阅读：677 留言：0更新日期：2018-08-25 10:31

本发明专利技术公开了一种多标签图像的二值向量生成方法及图像语义相似度查询方法。本发明专利技术利用训练数据集对卷积神经网络模型进行训练，直至该卷积神经网络模型的损失值趋于稳定；然后利用训练后的卷积神经网络模型对图像数据库中的图片进行计算，得到每张图片的二值向量并进行存储；利用训练后的卷积神经网络模型计算待查询图片的二值向量，并将其与存储的二值向量进行相似度计算，根据相似度计算结果返回与该待查询图片最相似的若干图片。本发明专利技术大大提高了图像的存储效率和查询效率；而且可以根据与查询图片的多级语义相似度对目标图片进行排序。

全部详细技术资料下载

【技术实现步骤摘要】
一种多标签图像的二值向量生成方法及图像语义相似度查询方法
本专利技术主要应用于图像检索领域，涉及一种多标签图像的二值向量生成方法及针对多标签图像语义特征的相似度查询方法。
技术介绍
近年来，随着网络技术的快速发展，每天都有成千上万的图片上传至互联网中，如何从海量的图片中根据不同用户需求快速准确地检索出相关图片已经成为研究的热点和难点。比如，基于内容的图像检索需要检索出和查询图片内容相似的目标图片，这里的“相似”指视觉或者语义相似。面向图像语义特征的哈希算法将图像高维原始特征映射到低维二进制特征的同时保留了图像语义信息，因此受到广泛关注。目前主流的面向图像语义特征的哈希算法利用深度学习技术能够同时提取图像语义特征并学习哈希函数，但仍有以下局限：(1)绝大多数的哈希算法只能简单区分相似和不相似的图片，对于含有多级语义相似度的多标签图像效果不佳。(2)面向多标签图像的哈希算法无法有效区分相似度不同的多标签图片。
技术实现思路
针对现有技术中存在的技术问题，本专利技术的目的在于提供一种多标签图像的二值向量生成方法及大规模多标签图像语义相似度查询方法。本专利技术基于卷积神经网络模型，通过精心设计的损失函数学习模型参数，实现同时提取图像原始特征并学习哈希函数，最终输出的图像二进制编码具有以下性质：●由1、-1组成，同时提高了存储和查询效率；●可以根据与查询图片的多级语义相似度对目标图片进行排序；●在图像特征编码较短的情况下，仍能根据语义相似度有效区分目标图片，特别是返回结果前几条的准确率较主流算法更高。本专利技术的技术方案为：一种多标签图像的二值向量生成方法，其步骤包括：...

【技术保护点】
1.一种多标签图像的二值向量生成方法，其步骤包括：1)利用训练数据集对卷积神经网络模型进行训练，直至该卷积神经网络模型的损失值趋于稳定；其中，每次训练时的训练数据集包括N对图片，对于第i对图片Ii，1、Ii，2，设图片Ii，1的标签数量为ni，1，第i对图像中图片Ii，1与图片Ii，2共同关联的标签数量为ni，2，计算所述损失值的损失函数η为

【技术特征摘要】
1.一种多标签图像的二值向量生成方法，其步骤包括：1)利用训练数据集对卷积神经网络模型进行训练，直至该卷积神经网络模型的损失值趋于稳定；其中，每次训练时的训练数据集包括N对图片，对于第i对图片Ii，1、Ii，2，设图片Ii，1的标签数量为ni，1，第i对图像中图片Ii，1与图片Ii，2共同关联的标签数量为ni，2，计算所述损失值的损失函数η为其中，ni，1＝ni，2时，yi＝0，否则yi＝1；Ones代表元素全为1的向量，||·||1表示向量的第一范数，表示向量间的欧式距离，|·|表示对向量每位元素进行绝对值操作，α是用来控制量化损失大小的参数，w为卷积神经网络模型的哈希层的权重向量，f(I；w)为卷积神经网络模型输出的图片I的k位二值向量，m是指汉明距离阈值参数；2)利用训练后的卷积神经网络模型计算图片的二值向量。2.一种多标签图像语义相似度查询方法，其步骤包括：1)利用训练数据集对卷积神经网络模型进行训练，直至该卷积神经网络模型的损失值趋于稳定；其中，每次训练时的训练数据集包括N对图片，对于第i对图片Ii，1、Ii，2，设图片Ii，1的标签数量为ni，1，第i对图像中图片Ii，1与图片Ii，2共同关联的标签数量为ni，2，计算所述损失值的损失函数η为其中，ni，1＝ni，2时，yi＝0，否则yi＝1；Ones代表元素全为1的k位向量，||·||1表示向量的第一范数，表示向量间的欧...

【专利技术属性】
技术研发人员：吴大衍，叶明臻，李波，古晓艳，王伟平，孟丹，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人