一种时尚图像主色调解析方法技术

技术编号:21800888 阅读:54 留言:0更新日期:2019-08-07 10:57
本发明专利技术涉及一种时尚图像主色调解析方法,其特征在于,包括如下步骤:S1、深度学习时尚服饰检测框架的构建;S2、目标检测损失函数的设计;S3、时尚服饰前景目标区域的提取预处理;S4、时尚服饰候选区域的主色调解析操作。其优点表现在:鲁棒性强、精确度高、目标定位准确,背景干扰因素低,自动化程度高,能够有效提高主色调解析的精确率。

A Method of Main Tone Analysis for Fashion Images

【技术实现步骤摘要】
一种时尚图像主色调解析方法
本专利技术涉及计算机视觉识别
,具体地说,是一种时尚图像主色调解析方法。
技术介绍
时尚服饰的风格一直以来都是时尚领域重点关注的话题,而作为风格表现形式的主要色调自然成为了行业关注的焦点,主色调为服饰的选款及搭配提供参考事实依据,这也意味着主色调的准确获取成为了一项具有实用价值的研究对象。主色调主要是指某件时尚单品所包含的主要几种色调,主色调的提取解析广泛应用于电商、街拍以及时尚领域,不仅可以为设计师提供色彩设计,也可以用于图像相似类别搜索、分类以及识别。由于时尚品牌多样,款式风格各异,单纯的采用人工方式去采集和分析当前流行的主色调,势必存在分析不准确并且非常耗时耗力。为了让色彩信息在数据事实层面得到较为精准的反馈,因此有必要建立一套自动化的主色调提取方法。主色调的提取主要运用视觉图像处理技术和深度学习技术,对整个时尚图片库进行单品或者单品牌进行提取解析的工作。目前已有的对图片进行主色调分析的算法大致分为以下几类:1.运用颜色量化法:因为彩色图像一般采用RGB色彩模式,每个像素由RGB三个颜色分量组成,每个分量由8位表示,红绿蓝三原色组合共有1677万(256*256*256)万种颜色,如果将RGB看作是三维空间中的三个坐标轴,则可以得到一个色彩分布立体图。其中一种量化法中位切分算法的原理很简单直接,将图像颜色看作是色彩空间中的长方体,从初始整个图像作为一个长方体开始,将RGB中最长的一边从颜色统计的中位数一切为二,使得到的两个长方体所包含的像素数量相同,重复上述步骤,直到最终切分得到长方体的数量等于主题颜色数量为止。另一种量化法八叉树算法将颜色成分转换成二进制之后,较低位(八叉树中位置较深层)数值将被压缩进较高位(八叉树中较浅层)并逐渐进行合并。2.运用聚类算法:主要多采用Kmeans聚类算法,KMeans算法的原理较为简洁:将图像中每个像素点的信息归为k个类别,使得每个类别中的每个数据样本,距离该类别的中心距离最小,最终获取的类别中心分别为图像的几个主色调,但是这种方法存在的弊端在于无法提前预知图像色彩的复杂度,一旦复杂度较高,而归类类别k设定较小,则会稀释主色调在所有颜色中的权重及分布状况,无法满足特定的提取和分析。图像的主要前景的定位是实现时尚图像主要颜色提取的重要环节,也是实现色彩分析的先决条件,然而基于以上几种现有的方法的主色调提取方法存在目标定位不准确,背景干扰因素较大等原因,不太适合准确的主色调解析。中国专利文献:CN201810982554.4,申请日2018.08.27,专利名称为:一种基于图像识别和知识图谱的时尚领域文本生成方法。公开了一种基于图像识别和知识图谱的时尚领域文本生成方法,步骤S1、采用深度学习的方法,对基本的图片视频数据进行基础信息的提取,并对针对所有的时尚的基础信息进行分解和整理,训练深度学习的算法,对图像基础信息进行提取;步骤S2、预先准备时尚领域的知识图谱,对市面上的流行元素进行定义,将基础信息和流行信息相关联;步骤S3、将上述的基本信息和推理的高阶抽象标签作为搜索关键字,在已有的时尚领域专业文章库中搜索相似文本,按照相似度排序,生成摘要文字。上述专利文献的一种基于图像识别和知识图谱的时尚领域文本生成方法,能够解决在时尚领域中需要撰写大量和图片文字相关性非常大的领域专业文稿的问题,提供时尚编辑文字素材,以激发时尚编辑的灵感,提高时尚撰稿效率。但是关于一种鲁棒性强、精确度高、目标定位准确,背景干扰因素低,自动化更优的适合准确的主色调解析的一种时尚图像主色调解析方法目前则没有相关的报道。综上所述,继续一种鲁棒性强、精确度高、目标定位准确,背景干扰因素低,自动化更优的适合准确的主色调解析的一种时尚图像主色调解析方法。
技术实现思路
本专利技术的目的是针对现有技术中的不足,提供一种鲁棒性强、精确度高、目标定位准确,背景干扰因素低,自动化更优的适合准确的主色调解析的一种时尚图像主色调解析方法。为实现上述目的,本专利技术采取的技术方案是:一种时尚图像主色调解析方法,其特征在于,包括如下步骤:S1、深度学习时尚服饰检测框架的构建;S2、目标检测损失函数的设计;S3、时尚服饰前景目标区域的提取预处理;S4、时尚服饰候选区域的主色调解析操作。作为一种优选的技术方案,所述步骤S1包括:S11、深度学习时尚服饰检测框架包括服饰特征提取、检测框的预测以及包围框的回归,三个模块分别对应卷积神经网络中的卷积计算、前向传播输出和误差反向传播;卷积计算是一个滤波的过程,可以将网络学习参数逐渐收敛从而提取感兴趣的目标特征;前向传播是卷积神经网络特征提取金字塔的传递,将低层的纹理和轮廓信息逐层抽象表达;训练过程中每一次的训练都是对目标结果的收敛过程,包围框的回归是目标输出过程中对二维位置信息的逐步收敛;S12、本实施例采用生层建议窗框形式,通过多层卷积计算和池化操作,从底层到高层逐渐的缩减特征层大小,并且将预测方式直接作用于特征图,每张图生成300个建议窗口,预测每一个特征单元的所属类归属;S13、在每一个特征图中,构建多个预测框,预检测框映射到卷积神经网络的最后一层卷积特征层上,通过池化层使每个感兴趣区域生成固定尺寸的特征图。作为一种优选的技术方案,所述步骤S2具体包括如下步骤:S21、在预测阶段,为了去除相关度不高且重叠率较大的默认框,常按照匹配分数从高到低排序,利用非极大值抑制的方法,搜索局部极大值,抑制非极大值;在用于时尚服饰图像识别检测过程中,本实施例采用随机梯度下降算法和端到端的检测模型,首先利用大数据集上的预训练模型权重对服饰的训练图像进行模型训练,得到目标检测模型,然后利用训练性能好的推理模型进行时尚服饰的检测测试,得到检测结果。作为一种优选的技术方案,所述步骤S3具体包括如下步骤:S31、经过时尚服饰的位置区域提取之后,表明该区域内大概率事件为服饰前景,根据抠图原理:对于一幅图像I,可表示为前景F和背景B在因子α作用下的加权和:I=αF+(1-α)B,α∈[0,1]S32、对于S31中的式子,其中I为已知量,而α、F、B均为未知量,要解决这样一个病态的方程必须附加一定的约束条件,恰好在深度学习检测模型的辅助之下,找到了属于背景B的某些归属像素区域,同样的,感兴趣区域的前景F部分也在标注框内,进一步明确了下一步的工作是重点突破α值的确定;S33、在深度学习检测模型的帮助下检测到的时尚服饰区域,该区域内可能存在多种噪声,为了降低噪声对抠图精度的影响,本实施例采用双边滤波方式将噪声滤除,使得该区域内的边缘信息更加明确突出。作为一种优选的技术方案,所述步骤S4具体包括如下步骤:S41、为了确保候选区域的主色调在人眼范围内可以明确的分辨,避免解析过程的精确度低问题,本实施例将图像的主色调人为的归纳为59种常见时尚色系,根据像素间的欧式距离判别候选区域的色调归类,在时尚单品提取解析中,遍历候选区域,以便得到最终的主色调排序,根据排序的结果,计算每一种色调所占的比例,将主要的几种靠前色调作为服饰的主色调;S42、同样的,对于时尚单品牌的主色调解析,可以将该品牌的所有图像输入深度学习检测模型并做抠图预处理,融合所有的图像像素归类信息,根据排序结果选取相应的品牌主本文档来自技高网
...

【技术保护点】
1.一种时尚图像主色调解析方法,其特征在于,包括如下步骤:S1、深度学习时尚服饰检测框架的构建;S2、目标检测损失函数的设计;S3、时尚服饰前景目标区域的提取预处理;S4、时尚服饰候选区域的主色调解析操作。

【技术特征摘要】
1.一种时尚图像主色调解析方法,其特征在于,包括如下步骤:S1、深度学习时尚服饰检测框架的构建;S2、目标检测损失函数的设计;S3、时尚服饰前景目标区域的提取预处理;S4、时尚服饰候选区域的主色调解析操作。2.根据权利要求1所述的一种时尚图像主色调解析方法,其特征在于,所述步骤S1具体包括如下步骤:S11、深度学习时尚服饰检测框架包括服饰特征提取、检测框的预测以及包围框的回归,三个模块分别对应卷积神经网络中的卷积计算、前向传播输出和误差反向传播;卷积计算是一个滤波的过程,可以将网络学习参数逐渐收敛从而提取感兴趣的目标特征;前向传播是卷积神经网络特征提取金字塔的传递,将低层的纹理和轮廓信息逐层抽象表达;训练过程中每一次的训练都是对目标结果的收敛过程,包围框的回归是目标输出过程中对二维位置信息的逐步收敛;S12、本实施例采用生层建议窗框形式,通过多层卷积计算和池化操作,从底层到高层逐渐的缩减特征层大小,并且将预测方式直接作用于特征图,每张图生成300个建议窗口,预测每一个特征单元的所属类归属;S13、在每一个特征图中,构建多个预测框,预检测框映射到卷积神经网络的最后一层卷积特征层上,通过池化层使每个感兴趣区域生成固定尺寸的特征图。3.根据权利要求1所述的一种时尚图像主色调解析方法,其特征在于,所述步骤S2具体包括如下步骤:S21、在预测阶段,为了去除相关度不高且重叠率较大的默认框,常按照匹配分数从高到低排序,利用非极大值抑制的方法,搜索局部极大值,抑制非极大值;在用于时尚服饰图像识别检测过程中,本实施例采用随机梯度下降算法和端到端的检测模型,首先利用大数据集上的预训练模型权重对服饰的训练图像进行模型训练,得到目标检测模型,然后利用训练性能好的推理模型进行时尚服饰的检测测试,得到检测结果。4.根据权利要求1所述的一种时尚图像主色调解析方法,其特征在于,所述步骤S3具体包括如下步骤:S31、经过时尚服饰的位置区域提取之后,表明该区域内大概率事件为服饰前景,根据抠图原理:对于一幅图像I,可表示为前景F和背景B在因子α作用下的加权和:I=αF+(1-α)B,α∈[0,1]S32、对于S31中的式子,其中I为已知量,而α、F、B均为未知量,要解决这样一个病态的方程必须附加一定的约束条件,恰好在深度学习检测模型的辅助之下,找到了属于背景B的某些归属像素区域,同样的,感兴趣区域的前景F部分也在标注框内,进一步明确了下一步的工作是重点突破α值的确定;S33、在深度学习检测模型的帮助下检测到的时尚服饰区域,该区域内可能存在多种噪声,为了降低噪声对抠图精度的影响,本实施例采用双边滤波方式将噪声滤除,使得该区域内的边缘信息更加明确突出。5....

【专利技术属性】
技术研发人员:黄博胡玉琛吴磊彬林博
申请(专利权)人:上海宝尊电子商务有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1