基于图像和社会化标签的商品推荐方法技术

技术编号:18446172 阅读:22 留言:0更新日期:2018-07-14 10:53
本发明专利技术公开了一种基于图像和社会化标签的商品推荐方法,主要解决现有推荐方法不能很好的捕捉用户的偏好的问题。其实现方案是:1.提取商品图片的颜色特征、纹理特征和形状特征;2.设计最优语义空间:根据用户,标签和商品图片两两之间的联系构建二分图和近邻关系图,并将用户、标签和商品图片这三种数据映射到同一空间内,即最优语义空间;3.在最优语义空间内根据用户与商品图片的之间的欧氏距离对商品图片按照从近到远的顺序进行排序,将距离用户最近的前N个商品图片推荐给用户。本发明专利技术能更精确的计算出图片间的相似度,有效的处理标签数据三类对象之间的复杂关联结构,获得更好的推荐性能,可用于电子商务的个性化推荐系统。

Commodity recommendation method based on image and social tagging

The invention discloses a commodity recommendation method based on image and socialized label, which mainly solves the problem that the existing recommendation method can not catch the user's preference well. The actual scheme is: 1. extract the color feature, texture feature and shape feature of the commodity picture; 2. design the optimal semantic space: according to the connection between the user, the label and the commodity picture 22, construct the two sub map and the close neighbor diagram, and map the three kinds of data of the user, the label and the commodity picture to the same space, that is, the best Semantic space; 3. in the optimal semantic space, according to the Euclidean distance between the user and the commodity picture, the commodity pictures are sorted in the order of near to distance, and the previous N commodity pictures from the users are recommended to the users. The invention can more accurately calculate the similarity between the images, effectively handle the complex association structure between the three classes of objects of the label data, and get better recommendation performance, and can be used in the personalized recommendation system of electronic commerce.

【技术实现步骤摘要】
基于图像和社会化标签的商品推荐方法
本专利技术属于数据挖掘
,特别涉及一种商品推荐方法,可用于电子商务的个性化推荐系统。
技术介绍
近年来,随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在海量信息中的消费者不断流失。为了解决该问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种主动信息服务系统,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。传统的推荐系统大多利用用户评分数据,并使用协同过滤算法进行计算筛选,然后推荐给用户。但是,评分数据不能直观反映用户的喜好所在,比如电影评分,使用用户评分数据只能得知用户对该电影是否喜爱,却不能得知用户对电影具体的关注点。因此,基于用户评分数据的推荐系统并不能很好的捕捉用户的具体偏好。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足,提出一种基于图像和社会化标签的商品推荐方法,以更好的捕捉用户的具体偏好。本专利技术的技术方案是这样实现的:一.技术原理社会化标签更能直接地反映用户的偏好,这是因为标签对资源,即商品图片提供了一个有意义的描述,比如针对衣服的图片,通过标签可以了解到这件衣服是“田园风”还是“甜美淑女”,因此,标签体现了用户对于该商品的语义理解,暗示了用户的偏好所在。另外,由于标签数据有三类对象:用户、标签、商品图片,它们之间具有复杂的关联结构,所以无法使用传统的协同过滤算法进行商品推荐。因此,本专利技术设计了一种基于图的多类关联对象降维算法,该算法对用户、标签、商品图片三者之间的关系构建二分图,对商品图片集构建近邻关系图,在保持两种图结构的前提下,将三者映射到同一空间里,该空间因为保持了标签数据的语义关联关系,被称为语义空间。在获得最优的语义空间后,在该语义空间里计算用户与商品图片之间的欧氏距离,将离用户最近的图片所对应的商品推荐给用户,并以图片形式展示本专利技术推荐的商品,图片相比文字和链接,更易被用户所理解和接受。二.技术方案根据上述原理,本专利技术的技术方案包括如下:(1)提取商品图片的内容特征,即颜色特征、纹理特征和形状特征;(2)设计最优语义空间:2a)利用多核学习算法学习出商品图片所述三种特征之间的权重参数向量,得到最终两张商品图片之间的相似度,将权重参数向量与计算出的商品图片之间的相似度进行融合得到相似度矩阵;2b)定义标签数据为(ui,dj,tk),U为用户集,D为商品图片集,T为标签集,ui表示U中第i个用户,dj表示D中第j个商品图片,tk表示T中第k个标签,标签数据(ui,dj,tk)表示用户ui使用标签tk来标注图片dj;2c)对标签数据中用户与标签之间的联系构建加权二分图,对标签数据中标签与商品图片之间的联系构建加权二分图,对标签数据中用户与商品图片之间的联系构建无权二分图,对商品图片集构建近邻关系图;2d)在保持2c)中二分图和近邻关系图这两种图结构的前提下,将用户、标签和商品图片这三种数据映射到同一空间内,该空间即为最优语义空间;(3)在步骤(2)已经获得的最优语义空间内,根据用户与商品图片的之间的欧氏距离对商品图片按照从近到远的顺序进行排序,将距离用户最近的前N个商品图片推荐给用户,N的范围是(1,+∞)。本专利技术的有益效果如下:1.本专利技术由于使用标签数据而不是用户评分数据,可以更直接地反映出用户的偏好,能获得更好的推荐性能。2.本专利技术由于提取了三种图片的特征,利用多核学习技术学习出这些特征间的权重关系,并计算出特征间进行加权融合后的图片相似度,相较于简单将三种特征连接成一个长特征的方法,能更精确的计算出图片间的相似度。3.本专利技术通过构建二分图和近邻关系图建立了用户、标签、商品图片之间复杂的联系,不仅解决了数据稀疏性问题,而且使得推荐方法更加有效和准确。4.本专利技术设计的语义空间能够有效的处理标签数据的三类对象即用户、标签、商品图片之间复杂的关联结构,而传统的协同过滤算法不能处理这种标签数据。附图说明图1是本专利技术的实现总流程图;图2本专利技术中设计语义空间子流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。参照图1,本专利技术的实现步骤如下:步骤1,提取商品图片的内容特征,即颜色特征、纹理特征和形状特征;1.1)提取商品图片的颜色特征:建立颜色直方图,对于图片Q,在颜色向量空间上统计其颜色直方图,颜色直方图是一个一维的离散函数,即:式中,nk为颜色特征值为k的像素个数,N为图像像素的总个数,l为颜色特征值数,由此得到图像Q的颜色直方图H(k);1.2)提取商品图片的纹理特征:通过提取尺度不变特征sift描述符来描述图片的纹理特征;1.2.1)令图片为I(x,y),(x,y)是空间尺度坐标,则该图片尺度空间L(x,y,σ)为:L(x,y,σ)=G(x,y,σ)*I(x,y),其中G(x,y,σ)为高斯函数,σ为尺度参数,*表示乘号;1.2.2)计算相邻尺度图像的高斯差分D(x,y,σ):D(x,y,σ)=L(x,y,k1σ)-L(x,y,σ)其中,k1取L(·)是尺度空间;计算出相邻尺度图像的高斯差分之后,得到一系列高斯差分图;1.2.3)在高斯差分图的空间中求极值点,分别比较每一幅高斯差分图中的一个像素点和它所有的相邻点:如果某个像素点比其所有的相邻点都大或者都小,则该像素点为极值点,极值点的高斯差分如下所示:其中,为Z的极值,Z=(x,y,σ)表示的是像素点的偏移,D(·)为高斯差分函数;1.2.4)求出极值点后,需要对尺度空间DoG函数进行曲线拟合,来筛选极值点,去除低对比度的点,即对每一个候选极值点的进行判断:如果小于0.03,则判定该候选极值点为对比度低的极值点,予以去除,否则保留;1.2.5)去除了对比度低的极值点后,还应去除主曲率异常的极值点,因为一个定义不好的高斯差分的极值在横跨边缘的地方会有较大的主曲率,在垂直边缘的方向有较小的主曲率,而理想状态是极值点在任意方向的主曲率都相同,所以需要检测主曲率是否在某阈值r下,为了检测主曲率是否在某域值r下,只需检测如下不等式:其中,Tr(H)表示矩阵H的迹,Det(H)表示矩阵H的行列式,矩阵H是Hession矩阵,表达式如下:其中,Dxx是某一尺度图像的D(x,y,σ)在DoG空间中的x方向求导两次的结果;Dyy是某一尺度图像的D(x,y,σ)在DoG空间中的y方向求导两次的结果;Dxy是某一尺度图像的D(x,y,σ)在DoG空间中的x方向求导一次,再在y方向求导一次的结果;当上述不等式成立时,则极值点保留,反之去除,保留的极值点即为要找的特征点;1.2.6)确定了图像特征点的位置以后,接下来需要为图像特征点赋予一个方向,该步骤通过求每个特征点邻域的梯度来实现,即定义梯度幅值m(x,y)与梯度方向θ(x,y)为:θ(x,y)=tan-1(L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y))其中L(·)是尺度空间函数;1.2.7)以图像特征点为中心,划定一个区域,利用所有在本文档来自技高网...

【技术保护点】
1.一种基于图像和社会化标签的商品推荐方法,其特征在于,包括:(1)提取商品图片的内容特征,即颜色特征、纹理特征和形状特征;(2)设计最优语义空间:2a)利用多核学习算法学习出商品图片所述三种特征之间的权重参数向量,得到最终两张商品图片之间的相似度,将权重参数向量与计算出的商品图片之间的相似度进行融合得到相似度矩阵;2b)定义标签数据为(ui,dj,tk),U为用户集,D为商品图片集,T为标签集,ui表示U中第i个用户,dj表示D中第j个商品图片,tk表示T中第k个标签,标签数据(ui,dj,tk)表示用户ui使用标签tk来标注图片dj;2c)对标签数据中用户与标签之间的联系构建加权二分图,对标签数据中标签与商品图片之间的联系构建加权二分图,对标签数据中用户与商品图片之间的联系构建无权二分图,对商品图片集构建近邻关系图;2d)在保持2c)中二分图和近邻关系图这两种图结构的前提下,将用户、标签和商品图片这三种数据映射到同一空间内,该空间即为最优语义空间;(3)在步骤(2)已经获得的最优语义空间内,根据用户与商品图片的之间的欧氏距离对商品图片按照从近到远的顺序进行排序,将距离用户最近的前N个商品图片推荐给用户,N的范围是(1,+∞)。...

【技术特征摘要】
1.一种基于图像和社会化标签的商品推荐方法,其特征在于,包括:(1)提取商品图片的内容特征,即颜色特征、纹理特征和形状特征;(2)设计最优语义空间:2a)利用多核学习算法学习出商品图片所述三种特征之间的权重参数向量,得到最终两张商品图片之间的相似度,将权重参数向量与计算出的商品图片之间的相似度进行融合得到相似度矩阵;2b)定义标签数据为(ui,dj,tk),U为用户集,D为商品图片集,T为标签集,ui表示U中第i个用户,dj表示D中第j个商品图片,tk表示T中第k个标签,标签数据(ui,dj,tk)表示用户ui使用标签tk来标注图片dj;2c)对标签数据中用户与标签之间的联系构建加权二分图,对标签数据中标签与商品图片之间的联系构建加权二分图,对标签数据中用户与商品图片之间的联系构建无权二分图,对商品图片集构建近邻关系图;2d)在保持2c)中二分图和近邻关系图这两种图结构的前提下,将用户、标签和商品图片这三种数据映射到同一空间内,该空间即为最优语义空间;(3)在步骤(2)已经获得的最优语义空间内,根据用户与商品图片的之间的欧氏距离对商品图片按照从近到远的顺序进行排序,将距离用户最近的前N个商品图片推荐给用户,N的范围是(1,+∞)。2.根据权利要求1所述的方法,其特征在于步骤2a)中利用多核学习算法学习出商品图片所述三种特征之间的权重关系,是通过如下核函数学习出商品图片的颜色特征、纹理特征和形状特征之间的的权重参数向量:其中i表示第i个商品图片,j表示第j个商品图片,H1表示商品图片的特征向量的个数,参数η=[η1,η2,......,ηH]T是需要学习出的权重参数向量,参数ηv表示权重参数向量η=[η1,η2,......,ηH]T中第v个参数,Kv(i,j)表示第v个特征下的两张商品图片之间的相似度,K(i,j,η)表示最终两张商品图片之间的相似度。3.根据权利要求1所述的方法,其特征在于步骤2c)中对用户与标签间的联系构造加权二分图,按如下步骤进行:2c1)定义如下矩阵:其中,ui表示U中第i个用户,dk表示D中第k个商品图片,tj表示T中第j个标签,B表示所有标签数据的集合;2c2)对上述矩阵进行归一化,得到归一化后的矩阵:Rut为结构矩阵化的用户与标签之间的加权二分图。4.根据权利要求1所述的方法,其特征在于步骤2c)中对标签与商品图片间的联系构造加权二分图,按如下步骤进行:2c3)定义如下矩阵其中,uk表示U中第k个用户,dj表示D中第j个商品图片,ti表示T中第i个标签,B表示所有标签数据的集合;2c4)对上述矩...

【专利技术属性】
技术研发人员:赵伟黄若谷管子玉王泉
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1