一种商品图像特征描述方法技术

技术编号:30828833 阅读:25 留言:0更新日期:2021-11-18 12:36
一种商品图像特征描述方法,解决了采用现有视觉词包特征描述方法的商品图像分类效果不佳的问题,属于图像分类领域。本发明专利技术包括:对2倍升采样的商品图像进行小波多尺度分解,提取多尺度特征点,进行边缘填充,在边缘填充后的图像上划定图像的局部区域,利用SURF局部特征与量化归一的颜色矢量角特征对划定的局部区域进行描述,并通过串行融合得到最终的局部区域特征的描述子;对局部区域特征进行聚类,形成词包;对每个局部区域特征与词包中的词特征向量进行距离度量,给局部区域特征编码,使用对角同心矩空间模型进行特征汇聚形成图像描述子,并进行降维,获得视觉词包特征向量;将获得的视觉词包特征向量用分类器分类。获得的视觉词包特征向量用分类器分类。获得的视觉词包特征向量用分类器分类。

【技术实现步骤摘要】
一种商品图像特征描述方法
[0001]本申请为申请号202110144794.9、申请日2021年02月02日、专利技术名称“一种基于多尺度视觉词包模型的商品图像特征描述方法”的分案申请。


[0002]本专利技术涉及一种商品图像特征描述方法,属于图像分类领域。

技术介绍

[0003]我国电子商务的规模不断增长,已成为影响居民生活的重要行业。随着互联网的不断进步促进了淘宝、京东和唯品会等各大电子商务平台的快速发展,网上购物已经成为了大众购买商品的主要方式,越来越被人们所认可。根据中国互联网络信息中心统计,截至2020年3月,我国网民规模为9.04亿,互联网普及率达64.5%,我国网络购物用户规模达7.10亿,2019年交易规模达10.63万亿元,同比增长16.5%。为给用户对商品的快速浏览、搜索定位等提供更加优良的购物体验,一个良好的商品图像特征描述及分类系统也越来越凸显其重要性。而以往基于人工标注的图像分类方法已经不符合现实需求。如何利用图像处理、计算机视觉、模式识别以及机器学习等技术,实现商品图像的特征描述并进行分类具有很大的研究和商业价值。
[0004]对图像特征描述及分类的研究,从技术层面大致可划分成三类,第一类是使用颜色、纹理、形状的底层特征作为图片的描述通过分类器进行训练进而使该分类器具有对图像在所选特征上的分类效果;第二类是使用视觉词典这种中层语义特征来对图像进行分类,视觉词典通过整合底层特征的关系对图像的局部区域有很强的描述能力,在某些分类任务上具有较好的效果;第三类是使用深度学习的方法对图像进行分类,通过合适深度的网络可以设计出分类效果较好的分类模型。上述三种处理方式,其中底层特征主要针对像素来进行处理,会大大减轻距离较远像素间的关系,且不能很好的对图像内商品目标进行描述,往往会侧重于商品的某些特征,而忽略其他的特征;深度学习在图像分类上有不错的效果,但是深度学习存在着不可解释性和需要大量计算机算力的缺点,即便有不少方法能够在一定程度上减少运算量(例如迁移学习),依然远远超出正常电脑运算的上限;词包特征在商品图像分类上有不错的效果,但对于词包模型的进一步研究有所匮乏,并且对于商品图像的自身特点没有很好地挖掘(例如忽视了商品图像的颜色信息,忽略了商品图像中的目标分布特点),所以视觉词典在商品图像的特征描述与分类研究仍具有价值和意义。
[0005]在视觉词包特征中关于局部区域的提取方式具有两种方式,分别为稀疏类和稠密类,其中稀疏类指的是提取图像中一些稳定的像素点并围绕该特征点根据确定的尺度大小划分成对应的图像块,而稠密类指的是在图像坐标中按一定抽样比例抽取像素点并围绕该点划定图像块。两种方式各有优缺点,稀疏类往往对前景突出的图像表现更好,而稠密类对背景明显的图像更有优势。对于商品图像是属于前景突出的类型,但同时商品图像有着比其他图像更光滑的特点,稀疏类的特征点提取较其他类型更加困难,过少的特征点导致不足以支撑对整个图像的描述。除了图像区域的划分之外,对于区域特征描述也存在特征描
述单一的问题,传统的描述方式是SIFT(Scale

invariant feature transform)与SURF(Speeded

up robust features),这两种方式都只包含了纹理信息。但对于商品而言,颜色信息也是一个值得参考的方面。对于传统的词包模型得到的特征是一个无序的统计特征,并没有包含词的位置信息,而常用的金字塔空间模型有着维数数十倍增长的特点,对于正常的词包特征维数会设定在一个较大的数值,将使得最终特征的维数爆炸,寻求一种表示商品图像更合适更简单的词包空间模型是一个研究的要点。

技术实现思路

[0006]针对采用现有视觉词包特征描述方法的商品图像分类效果不佳的问题,本专利技术提供一种商品图像特征描述方法。
[0007]本专利技术的一种基于多尺度视觉词包模型的商品图像特征描述方法,所述方法包括:
[0008]S1:对2倍升采样的商品图像进行小波多尺度分解,在不同分解尺度进行多尺度特征点提取;
[0009]S2:对提取的多尺度特征点进行边缘填充,在边缘填充后的图像上划定图像的局部区域,利用SURF局部特征与量化归一的颜色矢量角特征对划定的局部区域进行描述,并通过串行融合得到最终的局部区域特征的描述子;
[0010]S3:对S2得到的局部区域特征进行聚类,形成词包;
[0011]S4:对每个局部区域特征与词包中的词特征向量进行距离度量,给局部区域特征编码,并使用对角同心矩空间模型进行特征汇聚形成图像描述子,将该图像描述子使用主成分分析对特征进行降维,获得降维的视觉词包特征向量;
[0012]S5:将S4获得的视觉词包特征向量用分类器分类。
[0013]作为优选,所述S1包括:
[0014]S11:将商品图像灰度值化并进行二倍升采样处理,然后对升采样图像进行多层小波分解,对每层分解得到的三个方向的高频小波响应矩阵提取相同坐标上的归一化系数;
[0015]S12:根据归一化系数的大小筛选出侯选点;
[0016]S13:对所有候选点进行非极大值抑制,以候选点为中心划定5*5大小的矩阵块,矩阵块每个位置的值为坐标相同的三个小波高频通道响应值之和,若候选点的值为该区域的最大值则保留,反之去除,得到对应尺度下的特征点;
[0017]S14:计算出特征点映射到原图的坐标位置。
[0018]作为优选,所述S11中,对每层分解得到的三个方向的高频小波响应矩阵提取相同坐标上的归一化系数为:
[0019][0020][0021][0022]其中ch、cv、cd分别为小波分解的竖直方向、水平方向和对角方向的高频小波响应
矩阵,max表示分量内取最大值,cH、cV、cD分别为竖直方向、水平方向和对角方向对应的归一化系数。
[0023]作为优选,所述S14中,映射到原图的坐标位置为:
[0024][0025]其中,L为小波分解层数,x和y是在尺度上检测的特征点位置坐标,X和Y为原图所对应的坐标位置。
[0026]作为优选,所述S1中,尺度大小为:
[0027]σ=1.6*2
L
‑1[0028]其中,L为小波分解层数。
[0029]作为优选,所述S2包括:
[0030]S21:对图像进行边缘填充,根据特征点位置与尺度划定图像的局部区域;
[0031]S22:对局部区域的SURF描述子V
SURF

[0032]围绕以某一像素点为中心半径大小为6σ的圆形区域计算haar响应值,将响应值最大的方向视为主方向;
[0033]将局部区域旋转至主方向位置,划分出以围绕特征点为中心,大小为20σ*20σ的局部区域,并将20σ*20σ的局部区域划分4*4的子区域,统计每个子区域内x、y方向的haar响应得到4维向量[Σx,Σy,Σ|x|,Σ|y|],最终16个子区域特征串联得到4*4*4的64维本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品图像特征描述方法,其特征在于,所述方法包括:S1:对2倍升采样的商品图像进行小波多尺度分解,在不同分解尺度进行多尺度特征点提取;S2:对提取的多尺度特征点进行边缘填充,在边缘填充后的图像上划定图像的局部区域,利用SURF局部特征与量化归一的颜色矢量角特征对划定的局部区域进行描述,并通过串行融合得到最终的局部区域特征的描述子;S3:对S2得到的局部区域特征进行聚类,形成词包;S4:对每个局部区域特征与词包中的词特征向量进行距离度量,给局部区域特征编码,并使用对角同心矩空间模型进行特征汇聚形成图像描述子,将该图像描述子使用主成分分析对特征进行降维,获得降维的视觉词包特征向量;S5:将S4获得的视觉词包特征向量用分类器分类;所述S4中,使用对角同心矩空间模型进行特征汇聚形成图像描述子,将该图像描述子使用主成分分析对特征进行降维,获得降维的视觉词包特征向量,为:按照对角同心矩空间模型,给图像划定空间子区域,统计整张图像内每类词的出现次数以及在划定空间子区域每类词出现次数,进行归一化处理,得到空间词频特征向量F,作为图像描述子:F=[f0,f1,...,f
M
]若图像划分为n部分则得到的空间词频特征向量F是K*(n+1)维的;其中,f0表示在整个图像范围而不考虑子空间范围得到的词频统计特征,它是K维的向量;f1,...,fn表示在划定的不同子空间内得到的词频统计特征,它们也是K维的向量;S43:对图像描述子使用主成分分析方法进行降维,获得降维的视觉词包特征向量。2.根据权利要求1所述的一种商品图像特征描述方法,其特征在于,所述S1包括:S11:将商品图像灰度值化并进行二倍升采样处理,然后对升采样图像进行多层小波分解,对每层分解得到的三个方向的高频小波响应矩阵提取相同坐标上的归一化系数;S12:根据归一化系数的大小筛选出侯选点;S13:对所有候选点进行非极大值抑制,以候选点为中心划定5*5大小的矩阵块,矩阵块每个位置的值为坐标相同的三个小波高频通道响应值之和,若候选点的值为该区域的最大值则保留,反之去除,得到对应尺度下的特征点;S14:计算出特征点映射到原图的坐标位置。3.根据权利要求2所述的一种商品图像特征描述方法,其特征在于,所述S11中,对每层分解得到的三个方向的高频小波响应矩阵提取相同坐标上的归一化系数为:分解得到的三个方向的高频小波响应矩阵提取相同坐标上的归一化系数为:分解得到的三个方向的高频小波响应矩阵提取相同坐标上的归一化系数为:其中ch、cv、cd分别为小波分解的竖直方向、水平方向和对角方向的高频小波响应矩
阵,max表示分量内取最大值,cH、cV、cD分别为竖直方向、水平方向和对角方向对应的归一化系数。4.根据权利要求2所述的一种商品图像特征描述方法,其特征在于,所述S14中,映射到原图的坐标位置为:其...

【专利技术属性】
技术研发人员:邱泽国韩小为孙华东张旭赵志杰金雪松
申请(专利权)人:哈尔滨商业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1