一种层次化商品信息过滤推荐方法技术

技术编号:13417825 阅读:45 留言:0更新日期:2016-07-27 14:51
本发明专利技术涉及一种层次化商品信息过滤推荐方法,包括如下步骤:对于推荐系统,构造一种分层泊松模型;对每一组有效用户商品对构造长度为K的向量,评分大小为对应用户偏好向量与商品属性向量的内积;采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导出所有隐变量的近似分布;预测每组用户商品对评分,根据得分大小排序可对用户进行最终的推荐。本发明专利技术的优点在于:1、可以生成对商品用户的稀疏表示;准确拟合了用户商品的长尾效应;3、对未评分用户商品对有降权效果;4、对稀疏评分矩阵可作出快速推断;5、良好的拓展性,适用于大规模评分集。

【技术实现步骤摘要】

本专利技术涉及信息过滤技术,特别涉及一种层次化商品信息过滤推荐方法
技术介绍
推荐系统作为一类信息过滤技术,在工业界尤其是互联网产品中应用广泛,比如购物网站的商品推荐,豆瓣电影、读书推荐等等。推荐系统在工业上有着巨大的商用价值,可以挖掘出消费者对商品的喜好倾向。一般而言,学习推荐系统需要一个包含所有用户的用户集以及包含所有商品的商品集,此外还包括用户对商品的评分矩阵。这里的评分矩阵一般情况下分为两种:显反馈和隐反馈。显式的评分即用户在给定打分范围内给商品评分,显式地表明对该商品的喜欢程度,比如豆瓣电影用户可以给自己看过的电影打分,1分表示不喜欢该电影,相反地,5分表明用户非常喜欢该电影。而更常见的情况是用户的隐反馈,比如用户在网上的购买、点击、收藏等记录,这些行为并非明确表示用户对商品的喜恶程度,而且一般情况下评分用0,1表示,1表示用户浏览过该商品,反之,0意味着用户没有浏览过该商品。经典的推荐算法主要有:1)基于近邻模型,比如协同过滤,这又可分为基于用户和基于商品,前者通过比较不同用户间的相似度,且先验地认为兴趣相似的用户对相同商品均感兴趣,后者则比较相似商品,同样先验地认为相似商品拥有相同的用户群;2)基于矩阵分解的隐因子模型,即将评分矩阵分解为两个低秩矩阵乘积,分别表示为用户矩阵和商品矩阵。基于矩阵分解模型根据分解算法不同衍生出很多算法,比如奇异值分解(SingularValueDecompose,SVD)、非负矩阵分解(Non-negativeMatrixFactorization,NMF)、带权值的非负矩阵分解(Weighted,Non-negativeMatrixFactorization,WNMF)、概率非负矩阵分解(ProbabilityNon-negativeMatrixFactorization,PNMF)。以上算法一般针对显反馈情况,而在对隐反馈的研究中,已有的方法包括基于近邻的合并分解法,加权调整正样本相对重要性法,基于下采样的负样本法等。业界根据用户对商品喜好的不同方式的反馈,将推荐问题分为两种,一种是基于评分制(比如豆瓣电影评分为1-10分),称为显式反馈,另一种更为广泛的是隐式反馈,比如用户购买、浏览、点击过商品,一般用1表示,其余为0。
技术实现思路
本专利技术的目的在于提供一种。本专利就推荐系统构建一种新的推荐模型,提出新的推荐算法。为此,本专利技术提出的一种层次化商品信息过滤推荐方法包括如下步骤:A1:对于推荐系统,构造一种分层泊松模型;A2、对每一组有效用户商品对构造长度为K的向量zui,其中每一个分量zuik~Poisson(θukβik),参数大小为对应用户偏好向量分量与商品属性向量分量乘积,其中K为商品属性向量和用户偏好向量的长度,zui为每组用户、商品对构造的长度为K的辅助向量,θu为用户偏好向量,βi为商品属性向量,k为分量的序号,u为用户序号,i为商品序号;A3、采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导出所有隐变量的近似分布;其中各参数的含义如下:β为βi的集合,θ表示θu的集合;ξu为用户偏好向量满足Gamma分布中的尺度参数,ξ表示ξu的集合,ηi为商品属性向量满足Gamma分布中的尺度参数,η为ηi的集合,z变量表示zui的集合;A4、预测每组用户商品对评分,根据得分大小排序可对用户进行最终的推荐,其中上标T表示向量转置,将列向量转置为行向量。优选地,本专利技术还可包括如下特征:步骤A1中,构造分层泊松分布是针对隐反馈的情况。步骤A1包括:A1‐1:对每一个用户u构造长度为K的用户偏好向量θu,该向量表示该用户的潜在特征,其中每个分量θuk~Gamma(a,ξu),即每个分量满足Gamma分布,并且该分布中的参数ξu定义为该用户的活跃度,即用户消费的商品占所有商品的比例,且ξu~Gamma(a′,a′/b′),即用户活跃度同样也满足Gamma分布;其中参数a表示用户偏好向量满足Gamma分布中的形状参数,a’表示′上述尺度参数满足Gamma分布中的形状参数,a’/b’表示上述尺度参数满足Gamma分布中的尺度参数;A1‐2:对于每件商品i构造长度为K的商品属性向量βi,该向量同样表明了该商品的潜在特征,其中每一个分量βik~Gamma(c,ηi),即每个分量满足Gamma分布,并且该分布中的参数ηi定义为该商品的流行度,即消费该商品的用户占所有用户的比例,且ηi~Gamma(c′,c′/d′),即商品流行度同样也满足Gamma分布;;其中参数c表示商品属性向量满足Gamma分布中的形状参数,c’表示上述尺度参数满足Gamma分布中的形状参数,c’/d’表示上述尺度参数满足Gamma分布中的尺度参数;A1‐3:每组用户商品对的评分假定满足Poisson分布,即该分布中的参数等于用户偏好向量和商品属性向量的内积。步骤A2中,假设zui各分量相互独立。在于步骤A3中,通过坐标上升法,即假设其他隐变量分布已知,最大化关于当前目标变量分布的后验分布和真实分布之间的KL散度,通过多次迭代直至收敛,继而得出参数的近似后验分布。步骤A4中,在辅助变量zui的帮助下,各隐变量的完全条件分布如下:θuk|β,ξ,z,y~Gamma(a+∑izuik,ξu+∑iβik)βik|θ,η,z,y~Gamma(a+∑uzuik,ηi+∑uθuk)ξu|θ~Gamma(a′+Ka,b′+∑kθuk)ηi|β~Gamma(c′+Kc,d′+∑kβik) z u i | β , θ , y ~ M u l t ( y u i , θ u β i Σ k θ u 本文档来自技高网
...

【技术保护点】
一种层次化商品信息过滤推荐方法,其特征在于包括如下步骤:A1:对于推荐系统,构造一种分层泊松模型;A2、对每一组有效用户商品对构造长度为K的向量zui,其中每一个分量zuik~Poisson(θukβik),评分大小为对应用户偏好向量与商品属性向量的内积,其中K为商品属性向量和用户偏好向量的长度,zui为每组用户、商品对构造的长度为K的辅助向量,θu为用户偏好向量,βi为商品属性向量,k为分量的序号,u为用户序号,i为商品序号;A3、采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导出所有隐变量的近似分布;其中各参数的含义如下:β为βi的集合,θ表示θu的集合;ξu为用户偏好向量满足Gamma分布中的尺度参数,ξ表示ξu的集合,ηi为商品属性向量满足Gamma分布中的尺度参数,η为ηi的集合,z变量表示zui的集合;A4、预测每组用户商品对评分,根据得分大小排序可对用户进行最终的推荐,其中上标T表示向量转置,将列向量转置为行向量。

【技术特征摘要】
1.一种层次化商品信息过滤推荐方法,其特征在于包括如下步骤:
A1:对于推荐系统,构造一种分层泊松模型;
A2、对每一组有效用户商品对构造长度为K的向量zui,其中每一个分量zuik~Poisson
(θukβik),评分大小为对应用户偏好向量与商品属性向量的内积,其中K为商品属性向量和
用户偏好向量的长度,zui为每组用户、商品对构造的长度为K的辅助向量,θu为用户偏好向
量,βi为商品属性向量,k为分量的序号,u为用户序号,i为商品序号;
A3、采用变分推断的方法进行逼近后验分布,利用坐标上升法多次迭代直至收敛,推导
出所有隐变量的近似分布;其中各参数的含义如下:β为βi的集合,θ表示θu的
集合;ξu为用户偏好向量满足Gamma分布中的尺度参数,ξ表示ξu的集合,ηi为商品属性向量
满足Gamma分布中的尺度参数,η为ηi的集合,z变量表示zui的集合;
A4、预测每组用户商品对评分,根据得分大小排序可对用户进行最终
的推荐,其中上标T表示向量转置,将列向量转置为行向量。
2.如权利要求1所述的层次化商品信息过滤推荐方法,其特征在于:步骤A1中,构造分
层泊松分布是针对隐反馈的情况。
3.如权利要求1所述的层次化商品信息过滤推荐方法,其特征在于步骤A1包括:
A1‐1:对每一个用户u构造长度为K的用户偏好向量θu,该向量表示该用户的潜在特征,
其中每个分量θuk~Gamma(a,ξu),即每个分量满足Gamma分布,并且该分布中的参数ξu定义
为该用户的活跃度,即用户消费的商品占所有商品的比例,且ξu~Gamma(a′,a′/b′),即用
户活跃度同样也满足Gamma分布;其中参数a表示用户偏好向量满足Gamma分布中的形状参
数,a’表示′上述尺度参数满足Gamma分布中的形状参数,a’/b’表示上述尺度参数满足
Gamma分布中的尺度参数;
A1‐2:对于每件商品i构造长度为K的商品属性向量βi,该向量同样表明了该商品的潜在
特征,其中每一个分量βik~Gamma(c,ηi),即每个分量满足Gamma分布,并且该分布中的参数
ηi定义为该商品的流行度,即消费该商品的用户占所有用户的比例,且ηi~Gamma(c′,c′/
d′),即商品流行度同样也满足Gamma分布;;其中参数c表示商品属性向量满足Gamma分布中
的形状参数,c’表示上述尺度参数满足Gamma分布中的形状参数,c’/d’表示上述尺度参数
满足Gamma分布中的尺度参数;
A1‐3:每组用户商品对的评分假定满足Poisson分布,即该分布
中的参数等于用户偏好向量和商品属性向量的内积。
4.如权利要求1或2或3所述的层次化商品信息过滤推荐方法,其特征在于步骤A2中,假
设zui各分量相互独立。
5.如权利要求1或2或3所述的层次化商品信息过滤推荐方法,其特征在于在于步骤A3
中,通过坐标上升法,即假设其他隐变量分布已知,最大化关于当前目标变量分布的后验分
布和真实分布之间的KL散度,通过多次迭代直至收敛,继而得出参数的近似后验分布。
6.如权利要求4所述的层次化商品信息过滤推荐方法,其特征是在于步骤A4中,在辅助
变量zui的帮助下,各隐变量的完全条件分布如下:
θ u k | β , ξ , z , y ~ G a m m a ( a + Σ i z u i k , ξ u + Σ i β i k ) ]]> β i k | θ , η , z , y ~ G a m m a ( a + Σ u z u i k , η i + Σ u θ u k ) ]]> ξ u | θ ~ G a m m a ( a ′ + K a , b ′ + Σ k θ u k ) ]]> η i | β ~ G a m m a ( c ′ + K c , d ′ + Σ k β i k ) ]]> z u i | β , θ , y ~ M u l t ( y u i , θ u β i Σ k θ u k β i k ) ]]>,其中y为yui的集合,zui为每组用户、商品对构造的长度为K的辅助向量。
7.如权利要求5所述的层次化商品信息过滤推荐方法,其特征是坐标上升法迭代所有
参数包括:假设隐变量的后验分布可分解为各独立向量的分布乘积,即假设所有隐变量之
间相互独立(实际上不可能),其形式如下:
q ( β , θ , ξ , η , z ) = Π i , k q ( β i k | λ i k ) Π u , k q ( θ u k | γ u k ) ]]> Π u q ( ξ u | κ ...

【专利技术属性】
技术研发人员:杨余久黄旭邵航张如意
申请(专利权)人:深圳市未来媒体技术研究院清华大学深圳研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1