【技术实现步骤摘要】
一种基于卷积神经网络的两阶段图像检索方法
本专利技术涉及图像检索的
,尤其涉及一种基于卷积神经网络的两阶段图像检索方法。
技术介绍
随着各领域可用图像资源的快速增长,有效的图像搜索方法变得越来越重要。基于内容的图像检索(CBIR)旨在通过分析图像内容功能(如颜色、纹理和布局)来检索类似的图像。因此图像表示和相似性测量是任务的关键。卷积神经网络(CNN)具有强大的特征提取能力,可以直接处理图像,消除不同基础特征的影响。因此,深度CNN显著提高了各种视觉任务的性能。这些成就都归功于CNN深入学习丰富的中层图像表现的能力。然而,由于卷积神经网络所提取的特征是高维的,因此直接计算两个向量之间的相似性是十分低效的。Babenko等人建议使用主成分分析(PCA)的方法来压缩提取的特征维度,并取得了良好的性能。计算成本和图像表示在CBIR中起着至关重要的作用。随着视觉内容的持续增长,大型数据库的快速搜索已成为一种新兴需求。许多研究都旨在回答如何有效地从大型数据库中检索相关数据的问题。传统的线性搜索由于计算成本大,不适合在大型语料库中搜索。基于哈希的图像检索将高维特征映射到低维空间,并生成紧凑的二进制代码。生成的二进制代码可用于快速图像搜索,以进行二进制模式匹配或汉明距离测量。这一理念大大降低了计算成本,进一步优化了搜索效率。但是,在处理大型数据集时,必须构建相应的矩阵并生成二进制码。当前的几种加速图像检索的哈希算法可以分为两大类:无监督方法和监督法。最具代表性的无监督哈希方法是局部敏感哈希(LSH),使用未标 ...
【技术保护点】
1.一种基于卷积神经网络的两阶段图像检索方法,其特征在于,其步骤如下:/n步骤一:在VGG16网络的卷积层和密集连接层之间添加一个特征提取层构建卷积神经网络模型;将数据集分成训练集、验证集和测试集;/n步骤二:利用训练集和验证集对步骤一构建的卷积神经网络模型进行训练,同时利用反向传播调整卷积神经网络模型的参数,将卷积神经网络模型训练为具有特征提取能力和图像分类能力;/n步骤三:将测试集中的图像输入步骤二中训练好的卷积神经网络模型,特征提取层对图像进行特征提取得到特征向量,利用哈希函数映射将特征向量映射得到二进制哈希码,利用softmax分类函数对密集连接层输出的向量进行分类,将测试集中的图像按类别分类构造类别索引码,从而构建二级索引库;/n步骤四:将待检索图像输入训练好的卷积神经网络模型,获得待检索图像的特征向量和密集连接层输出向量,进行第一阶段的检索:将待检索图像的密集连接层输出向量输入softmax分类函数得到二进制类别码,根据二进制类别码在二级索引库中检索得到哈希索引码列表;/n步骤五:进行第二阶段检索:利用哈希函数映射处理待检索图像的特征向量得到二进制哈希码,将二进制哈希码的值 ...
【技术特征摘要】
1.一种基于卷积神经网络的两阶段图像检索方法,其特征在于,其步骤如下:
步骤一:在VGG16网络的卷积层和密集连接层之间添加一个特征提取层构建卷积神经网络模型;将数据集分成训练集、验证集和测试集;
步骤二:利用训练集和验证集对步骤一构建的卷积神经网络模型进行训练,同时利用反向传播调整卷积神经网络模型的参数,将卷积神经网络模型训练为具有特征提取能力和图像分类能力;
步骤三:将测试集中的图像输入步骤二中训练好的卷积神经网络模型,特征提取层对图像进行特征提取得到特征向量,利用哈希函数映射将特征向量映射得到二进制哈希码,利用softmax分类函数对密集连接层输出的向量进行分类,将测试集中的图像按类别分类构造类别索引码,从而构建二级索引库;
步骤四:将待检索图像输入训练好的卷积神经网络模型,获得待检索图像的特征向量和密集连接层输出向量,进行第一阶段的检索:将待检索图像的密集连接层输出向量输入softmax分类函数得到二进制类别码,根据二进制类别码在二级索引库中检索得到哈希索引码列表;
步骤五:进行第二阶段检索:利用哈希函数映射处理待检索图像的特征向量得到二进制哈希码,将二进制哈希码的值传递到哈希索引码列表中进行局部敏感哈希操作,得到根据相似度排序的检索结果。
2.根据权利要求1所述的基于卷积神经网络的两阶段图像检索方法,其特征在于,所述卷积神经网络模型中VGG16网络的结构包括依次连接的卷积层、特征提取层和密集连接层,其中,卷积层包括依次连接的两个卷积层I、池化层I、三个卷积层II、池化层II、三个卷积层III、池化层III、三个卷积层IV、池化层IV和三个卷积层V,卷积层I-V的大小都为3*3,池化层I-IV的大小都为2*2;特征提取层和最终分类层的权重是随机初始化的,特征提取层的初始权重是随机的,密集连接层训练并微调之前设定的参数。
3.根据权利要求2所述的基于卷积神经网络的两阶段图像检索方法,其特征在于,所述步骤二中反向传播调整卷积神经网络模型的参数的方法为:
1)由于神经网络的输出结果与实际结果有误差,计算估计值与实际值之间的误差,并将误差从输出层向隐藏层反向传播,直至传播到输入层;
2)根据误差调整相连神经元的权重,使得总损失函数减小;
迭代上述步骤1)和2),直到损失函数的值最小停止;其中,ym代表第m个输入图像的真实标签值,y′m代表模型输出的第m个输入图像的预测结果,n为输入图像的总数。
4.根据权利要求1或3所述的基于卷积神经网络的两阶段图像检索方法,其特征在于,所...
【专利技术属性】
技术研发人员:李玉华,王昌海,范艳焕,贺智强,韩旭,张建伟,马江涛,黄万伟,马军霞,陈明,马欢,孙玉胜,
申请(专利权)人:郑州轻工业大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。