一种基于稠密网络和多相似损失的服饰检索方法技术

技术编号:30284941 阅读:10 留言:0更新日期:2021-10-09 21:55
本发明专利技术涉及一种基于稠密网络和多相似损失的服饰检索方法,属于人工智能领域。因为本发明专利技术以稠密网络为基础,并引用多相似性损失函数,将数据流编码成特定的特征图进行比较,最有效的找到最接近的服装款式,所以在服装检索方面具有较高的准确率、节省人力物力、并且在处理庞大数据集时,同样适用,具有广泛的应用前景。前景。前景。

【技术实现步骤摘要】
一种基于稠密网络和多相似损失的服饰检索方法


[0001]本专利技术涉及人工智能领域,具体涉及一种基于稠密网络和多相似损失的服饰检索方法。

技术介绍

[0002]日常生活当中,吃穿住行一直是人们关心的基本问题,其中“穿”指的就是服装。随着电商平台的大力发展,越来越多人喜欢在网上购物,如何在大量的服装图片选择自己喜欢的衣服,这里可以使用到服装检索技术。这是一个很有挑战性且有很多实际应用价值的方向,激发很多视觉方面学者去探究。
[0003]过去的图像检索主要是基于文本的图像检索,它旨在针对图像文本内容进行检索匹配,它的精度尽管很高,但同时缺陷也很明显,需要大量的人工标注。尽管针对小数据集效果显著,不过在大数据集的面前需要大量的人力物力,而现在研究的重点在基于内容的图像检索。基于内容的图像检索主要是针对于每个像素点,通过其像素值来提取特征,进而在另外一个嵌入空间用它的编码向量来表证这个图片语义,寻找此空间内相近的图片。
[0004]图像检索任务处理方法从原来较为流行的传统图像算法SIFT到现在越来越火的卷积神经网络算法,这是从手工提取特征到计算机自动提取特征的转变。图像检索也可以看作一种度量学习过程。目前针对于深度度量的学习主要有两个发展方向,其一是设计新的网络结构,像孪生网络,三元组网络等。第二就是针对于损失函数的改进,像对比损失,中心损失,多相似度损失等。这些方法主要对于嵌入空间里的不同特征向量的进行不同程度的不同方向的推拉。
[0005]在服饰检索中,比如在数据集中,可能衣服会出现褶皱或遮挡。这些问题都会影响测试结果。当衣服出现褶皱时进行训练,通过训练样本提取的特征值一定和平铺衣服的特征值有很多区别,这个在测试的时候会成为很大的干扰。在人们的认知中,对于同一款衣服的颜色可能不同,我们一般认为它们是一类衣服,但是模型识别图片的时候一般以RGB颜色为主,通过大量的同类数据集可能会校正模型输出的结果,可是往往实际情况中我们可能整个数据集很大,但同一类的数据往往并不是很多,因此导致我们无法矫正模型正确的输出,同时在训练训练集时,由于训练集过于庞大,一般采用批处理的方式去训练数据集,但是一般的批处理方式仅仅是把数据随机采样的划成数据集的子集进行训练,可能会出现重复的同属性数据。

技术实现思路

[0006]本专利技术是为了解决上述问题而进行的,目的在于提供一种基于稠密网络和多相似损失的服饰检索方法。
[0007]本专利技术提供了一种基于稠密网络和多相似损失的服饰检索方法,具有这样的特征,包括如下步骤:步骤S1,将图片的像素点矩阵作为图像输入,将图片的多个感兴趣区域坐标值作为感兴趣区域输入;步骤S2,图像输入在稠密网络提取特征向量后,得到第一特征
向量、第二特征向量及分类结果;步骤S3,第一特征向量与感兴趣区域坐标值经区域池化层后得到局部特征;步骤S4,第二特征向量经第一降维层后得到降维全局特征;步骤S5,局部特征经第二降维层后得到降维局部特征;步骤S6,降维全局特征与降维局部特征进行维度拼接,经平铺操作、全连接计算,得到最终全局与局部的联合向量;步骤S7,第二特征向量以交叉熵损失函数作为损失函数,联合向量以多相似性损失函数作为损失函数,直到损失值降到最低,输出检索结果。
[0008]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,步骤S1中,感兴趣区域坐标值通过Kmeans方法得到。
[0009]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,感兴趣区域的数量为3块

5块。
[0010]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,第一降维层与第二降维层均包括3个卷积层、3个归一化层及3个激活函数层。
[0011]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,3个卷积层的卷积核分别为1x1、3x3、1x1。
[0012]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,激活函数层的激活函数为relu函数。
[0013]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,交叉熵损失函数的具体公式如下:
[0014]其中,x是样本,y是真实标签,a是预测值,n为数据个数。
[0015]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,多相似性损失函数的具体公式如下:
[0016][0017]其中,m为数据的个数,α、β、λ均为可调整的阈值超参、L
MS
为数据的多相似损失函数值。
[0018]在本专利技术提供的基于稠密网络和多相似损失的服饰检索方法中,还具有这样的特征:其中,稠密网络包括1个卷积层、1个池化层、4个稠密块、3个转化层及1个分类层。
[0019]专利技术的作用与效果
[0020]根据本专利技术所涉及的基于稠密网络和多相似损失的服饰检索方法,包括如下步骤:步骤S1,将图片的像素点矩阵作为图像输入,将图片的多个感兴趣区域坐标值作为感兴趣区域输入;步骤S2,图像输入在稠密网络提取特征向量后,得到第一特征向量、第二特征向量及分类结果;步骤S3,第一特征向量与感兴趣区域坐标值经区域池化层后得到局部特征;步骤S4,第二特征向量经第一降维层后得到降维全局特征;步骤S5,局部特征经第二降维层后得到降维局部特征;步骤S6,降维全局特征与降维局部特征进行维度拼接,经平铺操作、全连接计算,得到最终全局与局部的联合向量;步骤S7,第二特征向量以交叉熵损失函数作为损失函数,联合向量以多相似性损失函数作为损失函数,直到损失值降到最低,输出
检索结果。因为本专利技术以稠密网络为基础,并引用多相似性损失函数,将数据流编码成特定的特征图进行比较,最有效的找到最接近的服装款式,所以在服装检索方面具有较高的准确率、节省人力物力、并且在处理庞大数据集时,同样适用,具有广泛的应用前景。
附图说明
[0021]图1是本专利技术的实施例中基于稠密网络和多相似损失的服饰检索方法的流程图;
[0022]图2是本专利技术的实施例中基于稠密网络和多相似损失的服饰检索的整体框架图;
[0023]图3是本专利技术的实施例中稠密网络的结构框架图;
[0024]图4是本专利技术的实施例中降维层的结构框架图;
[0025]图5是本专利技术的实施例中训练集的部分数据集;
[0026]图6是本专利技术的实施例中不同算法的准确率对比结果图。
具体实施方式
[0027]为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本专利技术一种基于稠密网络和多相似损失的服饰检索方法作具体阐述。
[0028]<实施例>
[0029]图1是本专利技术的实施例中基于稠密网络和多相似损失的服饰检索方法的流程图。
[0030]如图1所示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于稠密网络和多相似损失的服饰检索方法,其特征在于,包括如下步骤:步骤S1,将图片的像素点矩阵作为图像输入,将所述图片的多个感兴趣区域坐标值作为感兴趣区域输入;步骤S2,所述图像输入在所述稠密网络提取特征向量后,得到第一特征向量、第二特征向量及分类结果;步骤S3,所述第一特征向量与所述感兴趣区域坐标值经区域池化层后得到局部特征;步骤S4,所述第二特征向量经第一降维层后得到降维全局特征;步骤S5,所述局部特征经第二降维层后得到降维局部特征;步骤S6,所述降维全局特征与所述降维局部特征进行维度拼接,经平铺操作、全连接计算,得到最终全局与局部的联合向量;步骤S7,所述第二特征向量以交叉熵损失函数作为损失函数,所述联合向量以多相似性损失函数作为损失函数,直到损失值降到最低,输出检索结果。2.根据权利要求1所述的基于稠密网络和多相似损失的服饰检索方法,其特征在于:其中,步骤S1中,所述感兴趣区域坐标值通过Kmeans方法得到。3.根据权利要求1所述的基于稠密网络和多相似损失的服饰检索方法,其特征在于:其中,所述感兴趣区域的数量为3块

5块。4.根...

【专利技术属性】
技术研发人员:徐菲菲田宇
申请(专利权)人:上海电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1