一种基于分类服装的颜色特征提取方法及服装检索系统技术方案

技术编号:14244098 阅读:61 留言:0更新日期:2016-12-21 23:36
本发明专利技术公开了一种基于分类服装的颜色特征提取方法,步骤为:获取服装图像;将服装图像的颜色转换为HSV空间;去除服装图像背景;计算服装图像的H分量颜色直方图并对其进行N阶量化;寻找H分量颜色直方图中占比最多的分量作为最大H分量峰值;采用基于阈值的峰值判断法寻找满足条件的H分量峰值;根据H分量峰值总数进行服装图像分类,针对各种类别的服装图像分别对应选取相应的聚类数目以及初始聚类中心;本发明专利技术根据分类后的服装确定聚类数目和初始聚类中心,能够提取到更加稳定的主颜色特征值,有效减少了颜色特征提取时的计算量和计算时间。将本发明专利技术方法应用到服装图像检索时,能够有效提高检索的查准率和查全率,并且使检索结果更加稳定。

【技术实现步骤摘要】

本专利技术涉及服装图像检索
,特别涉及一种基于分类服装的颜色特征提取方法及服装检索系统
技术介绍
传统的服装图像检索是基于文本的,用户通过输入描述服装的关键词进行检索,这种方式被称为基于文本的图像检索(TBIR)。然而,随着服装网购市场的飞速发展,网上服装数量迅猛增加,传统的TBIR系统由于其主观性强、文本描述信息有限以及搜索效率低下等缺点已无法满足用户的需求,因此,基于内容的图像检索(CBIR)技术应运而生。目前主要采用图像的底层视觉特征(颜色、形状和纹理等)来描述图像的内容信息。颜色是服装图像最稳定的视觉特征,也是图像检索使用的主要特征之一。而在服装检索中,用户最关注的往往是服装的主色。现有的提取服装图像主色的方法主要是k均值聚类算法,但传统的k均值聚类算法应用于服装检索时存在两点不足:第一,传统算法中,图像的聚类数目是人为指定的一个固定值。而事实上,不同类型的服装所需提取的主色数往往不同,因此采用固定值并不合适。第二,传统算法通常随机指定初始聚类中心,这会导致检索结果的不稳定,并影响检索的查准率和查全率。而且,由于随机指定的初始聚类中心并未考虑图像本身的颜色特点,故而导致算法需要进行较多次数的迭代运算才能找到真正的聚类中心,其计算量较大,计算耗时。
技术实现思路
本专利技术的第一目的在于克服现有技术的缺点与不足,提供一种基于分类服装的颜色特征提取方法。该方法根据分类后的服装确定聚类数目和初始聚类中心,能够提取到更加稳定的主颜色特征值,有效减少了颜色特征提取时的计算量和计算时间。将本专利技术方法应用到服装图像检索时,能够有效提高检索的查准率和查全率,并且使得检索结果更加稳定。本专利技术的第二目的在于提供一种基于上述方法实现的服装检索系统,通过该系统能够获取到稳定的服装检索结果,并且具有服装查准率和查全率高的优点。本专利技术的第一目的通过下述技术方案实现:一种基于分类服装的颜色特征提取方法,步骤如下:S1、获取服装图像;S2、将服装图像的颜色转换为HSV空间;S3、去除服装图像背景;S4、计算服装图像的H分量颜色直方图,并对其进行N阶量化;S5、寻找H分量颜色直方图中占比最多的分量作为最大H分量峰值;S6、采用基于阈值的峰值判断法进行服装图像分类,具体如下:寻找H分量颜色直方图中分量频数与最大H分量峰值频数之比大于阈值X且与最大H分量峰值距离大于Y值的H分量峰值,统计上述寻找到的H分量峰值个数,计算上述寻找到的H分量峰值个数和步骤S5中寻找到的最大H分量峰值个数总和,将该总和作为H分量峰值总数,然后根据该H分量峰值总数进行服装图像分类,将该H分量峰值总数为a的服装图像分类为A,将该H分量峰值总数为a+1~b的服装图像分类为B,将该H分量峰值总数为b+1以上的服装图像分类为C;S7、针对各种类别的服装图像分别对应选取相应的聚类数目以及初始聚类中心,然后提取出服装图像的主颜色特征值,具体如下:S71、针对步骤S5中寻找到的最大H分量峰值和步骤S6中寻找到的各H分量峰值对应的占比进行对比;S72、针对于分类为A的服装图像采用步骤S71中获取到的占比从大到小排名第一的H分量峰值作为主颜色特征值;S73、针对于分类为B的服装图像,采用k均值聚类算法提取主颜色特征值,其中选取的聚类数目为m,并将步骤S71中获取到的占比从大到小排名前m的m个H分量峰值作为初始聚类中心;S74、针对于分类为C的服装图像,采用k均值聚类算法提取主颜色特征值,其中选取的聚类数目为n,并将步骤S71中获取到的占比从大到小排名前n的n个H分量峰值作为初始聚类中心,其中n大于m。优选的,步骤S4中N为36。优选的,步骤S6中阈值X为10%~30%。优选的,步骤S6中Y为1或2。优选的,步骤S6中a为1,b为8,A为纯色,B为带少量图案,C为花色。优选的,步骤S7中m为4,n为9。本专利技术的第二目的通过下述技术方案实现:一种基于上述所述的基于分类服装的颜色特征提取方法实现的服装检索系统,应用于藉由客户端和服务端构建的网络链路架构中,其特征在于,包括:建置于服务端的数据库,用于存储服装图像及其颜色特征值;建置于服务端的特征提取模块,用于通过上述基于分类服装的颜色特征提取方法提取服装图像的主颜色特征值,并将提取出的服装图像的主颜色特征值存储于数据库中;以及建置于服务端的特征匹配模块,用于通过上述基于分类服装的颜色特征提取方法提取待检索服装图像的主颜色特征值,然后与数据库中存储的各服装图像的主颜色特征值进行相似度度量计算,最后返回相似度最高的F幅服装图像作为检索结果,并输出至客户端。优选的,还包括建置于客户端的用户界面模块,用于上传待检索服装图像,用于提供数据库选取以及返回和显示检索结果。优选的,特征匹配模块中采用欧式距离针对待检索服装图像的主颜色特征值与数据库中存储的各服装图像的主颜色特征值进行相似度度量计算,最后返回相似度最高的F幅服装图像即欧式距离最小的F幅服装图像作为检索结果;所述F为25,即特征匹配模块中将距离最小的前25幅图像作为检索结果。优选的,采用Tomcat作为服务端,采用Mysql作为数据库来实现。本专利技术相对于现有技术具有如下的优点及效果:(1)本专利技术方法采用基于阈值的峰值判断法寻找H分量颜色直方图中的H分量峰值,并且统计出符合要求的H分量峰值和最大H分量峰值个数的总和,然后根据该总和对服装图像进行分类,根据服装图像的分类选取对应的聚类数目以及初始聚类中心,提取出服装图像的主颜色特征值。本专利技术方法避免了传统聚类算法的随机性,并使聚类算法更适用于服装图像主色的提取,该方法根据分类后的服装确定聚类数目和初始聚类中心,能够提取到更加稳定的主颜色特征值,有效减少了颜色特征提取时的计算量和计算时间。将本专利技术方法应用到服装图像检索时,可以显著提高检索结果的稳定性,有效提高服装图像检索的查全率和查准率,并大大提升了检索出同类服装的能力。(2)本专利技术方法根据H分量峰值总数将服装图像分类为纯色、带少量图案,或花色三类,当服装为纯色时直接将占比最大的H分量峰值即最大H分量峰值作为服装图像的主颜色特征值,当服装为带少量图案或花色时采用k均值聚类算法提取主颜色特征值,并且根据前面得到的各H分量峰值分别选定聚类数目和初始聚类中心,本专利技术方法提取的服装图像颜色特征值是基于分类服装的,即结合了服装图像本身的颜色特点。因此,基于该颜色特征值的服装图像检索系统的检索性能得到了有效的提升。附图说明图1是本专利技术方法流程图。图2是本专利技术方法应用于服装检索时的检索稳定性测试图。图3是本专利技术方法、传统k均值聚类算法和传统颜色直方图算法应用于服装检索时的检索效果对比图。具体实施方式下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。实施例本实施例公开了一种基于分类服装的颜色特征提取方法,如图1所示,步骤如下:S1、获取服装图像,该服装图像可以从服装图像数据库中载入。S2、使用opencv的颜色空间转换函数,将服装图像的颜色由RGB空间转换为HSV空间。S3、去除服装图像背景,具体为采用canny算子进行服装图像的前景边缘检测,提取前景即服装图像主体的像素点。S4、统计服装图像主体的H分量的频数,获得H分量颜色直方图,并对其进行N阶量化,在本实施例中N可本文档来自技高网...
一种基于分类服装的颜色特征提取方法及服装检索系统

【技术保护点】
一种基于分类服装的颜色特征提取方法,其特征在于,步骤如下:S1、获取服装图像;S2、将服装图像的颜色转换为HSV空间;S3、去除服装图像背景;S4、计算服装图像的H分量颜色直方图,并对其进行N阶量化;S5、寻找H分量颜色直方图中占比最多的分量作为最大H分量峰值;S6、采用基于阈值的峰值判断法进行服装图像分类,具体如下:寻找H分量颜色直方图中分量频数与最大H分量峰值频数之比大于阈值X且与最大H分量峰值距离大于Y值的H分量峰值,统计上述寻找到的H分量峰值个数,计算上述寻找到的H分量峰值个数和步骤S5中寻找到的最大H分量峰值个数总和,将该总和作为H分量峰值总数,然后根据该H分量峰值总数进行服装图像分类,将该H分量峰值总数为a的服装图像分类为A,将该H分量峰值总数为a+1~b的服装图像分类为B,将该H分量峰值总数为b+1以上的服装图像分类为C;S7、针对各种类别的服装图像分别对应选取相应的聚类数目以及初始聚类中心,然后提取出服装图像的主颜色特征值,具体如下:S71、针对步骤S5中寻找到的最大H分量峰值和步骤S6中寻找到的各H分量峰值对应的占比进行对比;S72、针对于分类为A的服装图像采用步骤S71中获取到的占比从大到小排名第一的H分量峰值作为主颜色特征值;S73、针对于分类为B的服装图像,采用k均值聚类算法提取主颜色特征值,其中选取的聚类数目为m,并将步骤S71中获取到的占比从大到小排名前m的m个H分量峰值作为初始聚类中心;S74、针对于分类为C的服装图像,采用k均值聚类算法提取主颜色特征值,其中选取的聚类数目为n,并将步骤S71中获取到的占比从大到小排名前n的n个H分量峰值作为初始聚类中心,其中n大于m。...

【技术特征摘要】
1.一种基于分类服装的颜色特征提取方法,其特征在于,步骤如下:S1、获取服装图像;S2、将服装图像的颜色转换为HSV空间;S3、去除服装图像背景;S4、计算服装图像的H分量颜色直方图,并对其进行N阶量化;S5、寻找H分量颜色直方图中占比最多的分量作为最大H分量峰值;S6、采用基于阈值的峰值判断法进行服装图像分类,具体如下:寻找H分量颜色直方图中分量频数与最大H分量峰值频数之比大于阈值X且与最大H分量峰值距离大于Y值的H分量峰值,统计上述寻找到的H分量峰值个数,计算上述寻找到的H分量峰值个数和步骤S5中寻找到的最大H分量峰值个数总和,将该总和作为H分量峰值总数,然后根据该H分量峰值总数进行服装图像分类,将该H分量峰值总数为a的服装图像分类为A,将该H分量峰值总数为a+1~b的服装图像分类为B,将该H分量峰值总数为b+1以上的服装图像分类为C;S7、针对各种类别的服装图像分别对应选取相应的聚类数目以及初始聚类中心,然后提取出服装图像的主颜色特征值,具体如下:S71、针对步骤S5中寻找到的最大H分量峰值和步骤S6中寻找到的各H分量峰值对应的占比进行对比;S72、针对于分类为A的服装图像采用步骤S71中获取到的占比从大到小排名第一的H分量峰值作为主颜色特征值;S73、针对于分类为B的服装图像,采用k均值聚类算法提取主颜色特征值,其中选取的聚类数目为m,并将步骤S71中获取到的占比从大到小排名前m的m个H分量峰值作为初始聚类中心;S74、针对于分类为C的服装图像,采用k均值聚类算法提取主颜色特征值,其中选取的聚类数目为n,并将步骤S71中获取到的占比从大到小排名前n的n个H分量峰值作为初始聚类中心,其中n大于m。2.根据权利要求1所述的基于分类服装的颜色特征提取方法,其特征在于,步骤S4中N为36。3.根据权利要求1所述的基于分类服...

【专利技术属性】
技术研发人员:陈倩潘中良黄晓峰
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1