The invention discloses a multi view affine invariant descriptor for commodity image search, which is used for the retrieval of clothing merchandise image. An image retrieval method in the extraction of visual features of clothing commodity image, the traditional scale invariant descriptor SIFT (Scale Invariant Feature Transform) in the presence of large affine transformation and perspective transformation under the condition of no effective matching problem, put forward to use the camera imaging model, clothing merchandise image simulation from the perspective of conversion, generated the clothing product image a set of simulated view image sequence, and then extract the analog image in the image sequence from the perspective of visual features in the area of the SIFT invariant affine, finally using random sample consensus algorithm RANSAC (Random Sample Consensus), the simulation visual feature mapping perspective in the image sequence to the original reference image. Constitute the feature points of original image. The invention can effectively extract the visual features of clothing Commodity images, and can still match well in the case of larger view transformation and affine transformation, which is in line with the visual characteristics of people observing targets.
【技术实现步骤摘要】
一种用于商品图像搜索的融合多视角的仿射不变描述子
本专利技术涉及一种融合多视角的仿射不变特征描述方法,主要用于服装商品图像的搜索与匹配。
技术介绍
由于本专利技术抽取的是服装商品图像的视觉特征,对于现实中采集到的RGB彩色图像,在抽取图像特征前需要通过图像预处理将采集的所有图像均转化成灰度图像。图像的识别检索通常包括以下几个步骤:特征抽取过程:1、输入训练图像;2、图像预处理,将输入的训练图像转化成灰度图像;3、按照特征抽取算法逐一抽取服装图像的视觉特征;4、对抽取的视觉特征做必要的处理,并进行存储。图像检索识别过程:1、输入查询图像,对其进行预处理,将其转换成灰度图像;2、抽取查询图像的视觉特征,并做相应处理;3、按照匹配相似度度量准则,计算查询图像特征向量与训练图像的距离;4、对上述计算得到的所有度量距离进行排序,检索识别查询图像。目前常用的图像特征描述方法主要有:基于图像全局特征的图像搜索方法和基于图像局部特征的图像搜索方法。基于全局特征的图像搜索方法利用的是图像的全局特征,如:颜色、纹理、形状等;基于图像局部特征的图像搜索方法利用的是图像的局部特征,如SI ...
【技术保护点】
一种服装商品图像识别方法,包括对目标图像的视觉特征描述方法,其特征在于,所述特征描述方法融合了目标服装商品图像在各个可能视角之下的视觉特征,具有很好的视角不变性和仿射不变性。
【技术特征摘要】
1.一种服装商品图像识别方法,包括对目标图像的视觉特征描述方法,其特征在于,所述特征描述方法融合了目标服装商品图像在各个可能视角之下的视觉特征,具有很好的视角不变性和仿射不变性。2.如权利要求1所述目标服装商品图像融合多视角的仿射不变特征,其特征在于,所述特征描述方法利用相机成像模型,模拟出目标图像在各种可能视角之下的模拟视角图像,具体过程包括以下步骤:步骤A、将输入的目标图像转换成灰度图像,其一般形式可以表示如下:g(x,y)=f(x,y,1)*0.299+0.587*f(x,y,2)+0.114*f(x,y,3)其中,g(x,y)表示灰度图像,f(x,y,1)、f(x,y,2)、f(x,y,3)分别表示原目标图像的R、G、B分量。步骤B、对于灰度图像g(x,y),根据相机的成像模型可以得到该图像的模拟视角图像序列,图像的成像模型可以表示如下:u=SgGgAgu0其中,S表示相机的CCD抽样函数,G表示相机透镜的反走样高斯滤波函数,A是平面投射变换矩阵,u0表示相机正对物体时的无限平面。其中,A作为平面投射变换矩阵,可以分解为:可将其简写为:其中,λ>0,λt为A的行列式的值;ψ表示相机旋转角度,是由相机绕其光轴进行旋转所产生的;T定义为相机的倾斜角;和θ=arccos(1/t)表示相机的观测角度。假设图像u1(x,y)=u(A(x,y))和u2(x,y)=u(B(x,y))为同一图像u0在不同视角下的成像示意图,可推导出矩阵A、B之间存在如下对应关系:其中,ψ12为两幅图像的相机视角相对于光轴的旋转角度之差,是两幅图像的相机观测角度之差。由此,可以将原始图像进行抽样旋转和平面变换生成模拟视角图像序列,即可以通过改变t与的值生成模拟视角图像序列。步骤C、通过大量实验表明,为最合适的生成模拟视角图像序列的抽样参数,并以此抽样参数对基准图像进行模拟视角转换,生成模拟视角图像序列。3.如权利要求2所述对目标商品图像提取仿射不变区域,其特征在于,运用MSER(MaximallyStableExtremalRegion)算法寻找图像的仿射不变区域,具体步骤如下:步骤D、使用一系列灰度阈值对图像进行二值化处理。对任意一幅图像I(x,y),假设该图像存在所有可能的阈值t∈(0,1,2,...,255),I0、I1、I2、...It...、I255分别为对应各个可能阈值的图像。对于图像I(x,y)中的每一个像素值,如果大于或等于阈值t,则将该像素值设为0;如果像素值小于阈值t,则将该像素值设为255。步骤E、在灰度阈值范围内保持形状稳定的区域就是MSERs:评判标准:dA/dtA:图像区域面积,t:灰度阈值步骤F、将不规则的MSER区域拟合为椭圆,将不规则区域拟合为椭圆的通式为:其中X为向量,代表像素点的空间坐标(x,y),R代表不规则区域,|R|表示集合的势,此处代表不规则区域内像素点的个数,u为像素点的一阶矩,∑为像素点的二阶矩。由以上公式得到协方差矩阵的降维矩阵:其中D(x)为不规则区域所有像素点横坐标的方差,D(y)为不规则区域内所有像素点纵坐标的方差,COV(x,y)为不规则区域所有像素点横纵坐标的方差:其中,U为对称矩阵,拟合后椭圆的长短轴方向θ和幅值a1、a2可以通过U的特征向量和特征根得到。E(g)为相应的一阶矩。通过以上计算可以得到拟合后的椭圆的长短轴方向和幅值。步骤G、将仿射不变区域图像变换为标准形式:首先计算仿射不变区域图像I(x,y)的协方差矩阵,得到图像的概率密度函数f(x,y)与期望E(X)和E(Y):其中,m、n分别为图像I(x,y)的长与高。则得出p+q阶的中心距upq:upq=E{(X-E(X))p(Y-E(Y))q}可得图像的协方差矩阵为:再计算协方差矩阵的特征值λ1,λ2以及相应的特征向量(e1xe1y)T,(e2xe2y)T,将图像I(x,y)沿着特征向量方向旋转,使图像坐标中心化。协方差矩阵为实对称矩阵,则有:e1xe1y+e2xe2y=0于是,可构造旋转矩阵E:原图像I(x,y)可利用旋转矩阵E进行旋转变换,得到新的图像I′(x′,y′):利用协方差矩阵的特征值,分别改变图像...
【专利技术属性】
技术研发人员:王斌,王其浩,曾范清,
申请(专利权)人:南京财经大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。