融合颜色特征和残差网络深度特征的服装图像检索方法技术

技术编号：23400085 阅读：185 留言：0更新日期：2020-02-22 12:20

本发明专利技术属于图像检索技术领域，公开了一种融合颜色特征和残差网络深度特征的服装图像检索方法，将训练数据集输入到以ResNet50为基础的网络模型中；融合深层特征和颜色特征信息作为图像的全局特征表示；使用K‑Means算法对特征库中的向量进行聚类；将待检索的服装图片输入到与数据集相同的神经网络中，获取待查询服装图片的全局特征向量；依次计算聚类中心的向量与待检索图片向量间的距离，通过距离的比较来进行相似性度量，得到检索结果。实验结果显示，本发明专利技术能结合图片多种特征信息，检索效率高，时间开销小；提取的深层特征具有一定的有效性和层次性；具较强的鲁棒性和实用性，优于其它主流检索方法。

Clothing image retrieval method based on color feature and residual network depth feature

全部详细技术资料下载

【技术实现步骤摘要】
融合颜色特征和残差网络深度特征的服装图像检索方法
本专利技术属于图像检索
，尤其涉及一种融合颜色特征和残差网络深度特征的服装图像检索方法。
技术介绍
目前，最接近的现有技术：伴随电子商务行业的快速发展，服装行业作为其中的重要一部分，其数据量不断增多，为了处理海量的服装图像数据，一种全新的线上服装搜索模式被用户所使用——“以图搜图”，其核心是图像检索技术。服装图像检索作为服装智能推荐、服装搜索等应用的核心，具有广泛的市场应用前景。服装展现出当代人的一种潮流趋势及品味，大量的语义及细节信息蕴含其中，服装的色彩搭配及款式是其重要的语义信息，纹理和材质等表现其细节信息。然而服装不规则的外形、柔软的材质、可变形性较强以及对光照敏感这些条件，使服装图像检索快速精准地实现成为了一个极具挑战的难题。基于内容的图像检索(Content-basedImageRetrieval,CBIR)是服装图像检索领域研究的主流方法。图像检索的过程可大致分为两类：一是提取数据库图的表示向量，二是将待检索图片的表示向量与库向量中的每个向量进行距离度量，以最近邻方式进行搜索。一张图片表示向量的好坏直接决定了我们图像检索算法的优劣。早期的研究主要是基于颜色、形状、纹理三大视觉特征，将其单一特征或聚合特征作为服装图像的全局表示向量。黄冬梅等首先对待检索图片做了联合分割处理，然后提取出分割后的服装图片的Bundled和颜色特征，最后与特征库中的服装图像特征进行相似性度量。陶彬娇等将分块加权颜色直方图与Grabcut图像分割算法相结合，提升了对复杂...

【技术保护点】
1.一种融合颜色特征和残差网络深度特征的服装图像检索方法，其特征在于，所述融合颜色特征和残差网络深度特征的服装图像检索方法利用残差网络进行图像特征提取，并融合服装图片的深层网络特征和颜色特征作为最终特征向量，进行相似性度量，得到检索结果。/n

【技术特征摘要】
1.一种融合颜色特征和残差网络深度特征的服装图像检索方法，其特征在于，所述融合颜色特征和残差网络深度特征的服装图像检索方法利用残差网络进行图像特征提取，并融合服装图片的深层网络特征和颜色特征作为最终特征向量，进行相似性度量，得到检索结果。

2.如权利要求1所述的融合颜色特征和残差网络深度特征的服装图像检索方法，其特征在于，所述深层网络特征提取的方法包括以下步骤：
1)向深度卷积网络输入一个C×H×W的三维张量，C表示特征的通道数，初始值为3；H和W分别表示输入图片的高和宽的像素大小；
2)图片经过多层卷积操作，每一层卷积的输入为上一层的输出，计算方法为：

式中，表示第l层的第j个运算结果；表示第n层第j个输出特征图所对应的多个输入特征图的索引集合；表示偏置项,其被所有输入特征图共享；表示第l层一个i×j大小的卷积核；ReLU为激活函数，公式为：

3)残差网络采用了平均池化(mean-pooling)对邻域内特征点求平均值，池化操作公式为：

以Resnet50为主网络模型，ResNet50最后的卷积层输出若干个7X7的卷积结果，去掉其最后的两层全连接层，加入两个全连接层：FC1层和FC2层，分别输出512维和30维的特征向量；对网络模型进行微调，使用已有的ResNet50模型及参数来训练全连接层的参数，得到一个拟合服装图片数据集的网络模型，提取FC1层的512维的向量，作为深层网络特征。

3.如权利要求1所述的融合颜色特征和残差网络深度特征的服装图像检索方法，其特征在于，所述服装颜色特征提取的方法包括：
1)网络模型的最后一层卷积层中有2048个7x7卷积，对其进行平均池化后得出7x7的矩阵，直接提取信息较强位置最大的10个值，并记录其位置；
2)将原图的RGB值做平均池化，池化为7x7的矩阵，根据得到的10个值最大的位置，选出图片中相对应的10个RGB值得到3x10维的颜色特征，对矩阵进行标准化处理，z-score标准化公式为：

式中，x表示真实值，μ表示矩阵的平均值，σ表示标准差；
3)将矩阵转...

【专利技术属性】
技术研发人员：何儒汉，侯媛媛，刘军平，彭涛，陈常念，胡欣荣，
申请(专利权)人：武汉纺织大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人