当前位置: 首页 > 专利查询>东华大学专利>正文

基于改进的YOLOv5的服装检测及搭配性分析方法技术

技术编号:38226581 阅读:22 留言:0更新日期:2023-07-25 17:56
本发明专利技术公开了一种基于改进的YOLOv5的服装检测及搭配性分析方法,属于服装搭配性分析领域,收集两组服装数据集,数据集一用以服装单品检测,数据集二为搭配好的服装套装数据集,每件服装单品都有其文本描述;构建改进的YOLOv5检测网络,训练服装单品检测网络;搭建服装搭配性分析网络,训练服装搭配性评分模型;将服装检测模型中得到的服装单品分类输入到搭配性分析模型中得到搭配性评分。通过建立一种改进的YOLOv5网络对服装单品进行分类和检测,减轻网络参数量,方便部署到移动端和网页端;如果有不合适的单品会被标注出来并给出搭配建议。克服搭配时尚性的主观属性,为服装搭配提供客观且直接的分析结果。搭配提供客观且直接的分析结果。搭配提供客观且直接的分析结果。

【技术实现步骤摘要】
基于改进的YOLOv5的服装检测及搭配性分析方法


[0001]本专利技术属于服装搭配性分析的
,尤其涉及一种基于改进的YOLOv5的服装检测及搭配性分析方法。

技术介绍

[0002]服装作为人们生活中的重要组成部分,随着意识观念的增强和物质生活的丰富,它已不再以遮体避寒、适应环境为目的,逐渐升级为个人意识的外在具现,被赋予了更多深层次的含义。近年来,随着互联网经济的发展,服装零售逐渐向线上发展,与线下销售对比,网络购物打破了时间和空间的限制,并且因其种类繁多,价格实惠等优点,逐渐成为主流销售方式。网络平台不像实体店受时间和空间的限制,有更多的种类和方式可以挑选服装,然而网络平台因其独特性不能进行试穿,用户仅凭肉眼来判断搭配不仅耗时巨大而且会降低购买欲望。虽然现有的电商平台大部分都提供了搜索功能,但局限于文字搜索和图片识别搜索,对用户不能提出穿搭建议。因此,利用服装的搭配技术,为用户提供直观有效的搭配推荐,可以提升用户体验和购买效率,在一定程度上会促进服装商品的销量,能对服装电商行业的进一步发展起到推动作用。

技术实现思路

[0003]为克服上述现有技术的不足,本专利技术提供了一种基于改进的YOLOv5的服装检测方法,该方法采用改进的YOLOv5算法检测输入图片中的服装,将服装单品裁剪后送入多层比较网络中进行服装搭配度的分析。该方法充分发挥了YOLOv5在目标检测方面的简洁高速的优点,并结合了图像信息和语义信息,解决了传统搭配度分析算法中仅考虑服装图像颜色特征和形状特征,或仅用文字信息时分析结果过于片面的问题,克服搭配时尚性的主观属性,得到客观且直接的分析结果。
[0004]一种基于改进的YOLOv5的服装检测及搭配性分析方法,包括以下步骤:
[0005]步骤S1:收集两组服装数据集,数据集一用以服装单品检测,数据集二为搭配好的服装套装数据集,每件服装单品都有其文本描述;
[0006]步骤S2:构建改进的YOLOv5检测网络,训练服装单品检测网络,用以检测服装单品并分类和裁剪;
[0007]步骤S3:搭建服装搭配性分析网络,训练服装搭配性评分模型,用以对服装单品之间的搭配性评分;
[0008]步骤S4:将服装检测模型中得到的服装单品分类输入到搭配性分析模型中得到搭配性评分。
[0009]本专利技术构建了一个改进的YOLOv5服装检测网络,加入Ghost卷积网络减少参数量,方便部署到移动端和网页端,同时为了提高检测精度和对小目标的检测效果,加入坐标注意力模块,增强模型信息表达能力和模型的感知力。将包含服装的图片输入检测模块后,检测网络会将图片中的服装单品检测并裁剪下来输入到服装搭配性分析模型中,计算各个服
装单品之间的搭配程度并给出搭配性分数。如果搭配程度不高,搭配性分析模型会通过反向传播梯度找出不搭配的单品,然后从服装数据集中选出搭配程度更高的单品替换该单品,以给出一组评分更高的搭配建议。
[0010]与现有技术相比,本专利技术的有益效果是,结合图像信息和文本信息,不再局限于根据服装单品或者文字信息搜索配套服装,直接明了地展示了服装单品之间的搭配性并提出搭配建议。
附图说明
[0011]图1为基于改进YOLOv5的服装检测及搭配性分析方法流程图;
[0012]图2为Ghost卷积网络结构示意图;
[0013]图3为坐标注意力网络结构示意图;
[0014]图4为拆分注意力网络结构示意图;
[0015]图5为服装检测网络输出示意图;
[0016]图6为服装搭配性分析网络输出示意图。
具体实施方式
[0017]下面结合附图对本专利技术进一步说明:
[0018]一种基于改进的YOLOv5的服装检测及搭配性分析方法,包括以下步骤:
[0019]步骤S1:收集两组服装数据集,数据集一用以服装单品检测,数据集二为搭配好的服装套装数据集,每件服装单品都有其文本描述;
[0020]步骤S2:构建改进的YOLOv5检测网络,训练服装单品检测网络,用以检测服装单品并分类和裁剪;
[0021]采用改进的YOLOv5网络结构输入图像进行服装单品的检测,引入Ghost卷积模块,减少模型的参数量和计算量,便于部署到移动端或网页端。
[0022]采用改进的YOLOv5网络结构输入图像进行服装单品的检测,引入坐标注意力机制,提升网络的特征表达能力和信息感知能力,增加对小目标的检测精度。
[0023]步骤S3:搭建服装搭配性分析网络,训练服装搭配性评分模型,用以对服装单品之间的搭配性评分;
[0024]利用拆分注意力残差神经网络的卷积层提取服装单品图片不同层次的特征;拆分注意力残差神经网络按照通道维度划分为K个基数组,再在基数组内细分为R个分量,特征组的总数为G=KR。对每一个单独的分量做{F1,F2,...F
G
}变换,则每一个分量的中间表示为U
i
=F
i
(X),i∈(1,2,...,G)。通过融合将若干基数构成一个组合,即跨多个分量按元素求和,第k个基数组特征图表示为:
[0025][0026]其中,且H,W,C为块输出特征矩阵的形状,U
j
表示第k组的第j个分量,j∈{R(k

1)+1,R(k

1)+2,...,Rk}。
[0027]通过跨空间维度的全局平均池化可以得到具有嵌入的通道信息的全局上下文信息s
k
,第k个基数组的第c个分量的全局上下文信息计算公式如下:
[0028][0029]用基数组表示加权融合后的输出,其C个通道的输出计算公式如下:
[0030][0031]其中的表示分配权重:
[0032][0033]映射根据全局上下文表示s
k
确定第C个通道中的每个分量的权重。
[0034]将视觉特征x投影到嵌入空间的过程表示为u=W
I
x,其中W
I
是视觉嵌入的权重。
[0035]利用词袋模型提取服装单品的文本特征,使用独热编码方法对特征词汇进行编码,文字信息可以采用以下符号进行表示:
[0036]S=w1,w2,...,w
n
[0037]其中,w
i
表示第i个单词,并且可以表示为一个one

hot向量e
i
,e
i
的词向量的表示公式为v
i
=W
T
e
i
,其中W
T
是词嵌入的权重。
[0038]将文本信息和图像信息结合起来,利用视觉语义嵌入(VSE),学习一个深度嵌入空间,使视觉数据嵌入到与其相对应的文本描述相近的位置。视觉语义嵌入的目的是当u和v来自同一项时,使他们在视觉语义空间的距离彼此接近,实现视觉语义嵌入目标的损失函数如下:
[0039][0040]其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的YOLOv5的服装检测及搭配性分析方法,其特征在于包括以下步骤:步骤S1:收集两组服装数据集,数据集一用以服装单品检测,数据集二为搭配好的服装套装数据集,每件服装单品都有其文本描述;步骤S2:构建改进的YOLOv5检测网络,训练服装单品检测网络,用以检测服装单品并分类和裁剪;步骤S3:搭建服装搭配性分析网络,训练服装搭配性评分模型,用以对服装单品之间的搭配性评分;步骤S4:将服装检测模型中得到的服装单品分类输入到搭配性分析模型中得到搭配性评分。2.根据权利要求1所述的一种基于改进的YOLOv5的服装检测及搭配性分析方法,其特征在于:步骤S2中采用改进的YOLOv5网络结构输入图像进行服装单品的检测,引入Ghost卷积模块,减少模型的参数量和计算量,便于部署到移动端或网页端。3.根据权利要求1所述的一种基于改进的YOLOv5的服装检测及搭配性分析方法,其特征在于:步骤S2中采用改进的YOLOv5网络结构输入图像进行服装单品的检测,引入坐标注意力机制,提升网络的特征表达能力和信息感知能力,增加对小目标的检测精度。4.根据权利要求1所述的一种基于改进的YOLOv5的服装检测及搭配性分析方法,其特征在于:步骤S3中利用拆分注意力残差神经网络的卷积层提取服装单品不同层次的特征;拆分注意力残差神经网络按照通道维度划分为K个基数组,再在基数组内细分为R个分量,特征组的总数为G=KR;对每一个单独的分量做{F1,F2,...F
G
}变换,则每一个分量的中间表示为U
i
=F
i
(X),i∈(1,2,...,G);通过融合将若干基数构成一个组合,即跨多个分量按元素求和,第k个基数组特征图表示为:其中,k∈1,2,...,K,且H,W,C为块输出特征矩阵的形状,U
j
表示第k组的第j个分量,j∈{R...

【专利技术属性】
技术研发人员:张义红任少贤李银剑
申请(专利权)人:东华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1