一种基于GBP的PMF方法技术

技术编号:25891676 阅读:31 留言:0更新日期:2020-10-09 23:34
本发明专利技术公开了一种基于GBP的PMF方法,上述方法能解决现有技术中的推荐系统没有基于基因维度来进行推荐,只保证在BP维度方面,没有办法从高维度进行匹配推荐的问题,该算法有具有提升学习率,防止步长过大导致最终无法收敛的问题;迭代次数减少,提高运行效率;相比传统MF更加精准、高效。

【技术实现步骤摘要】
一种基于GBP的PMF方法
本专利技术属于数据挖掘
,尤其涉及一种基于GBP的PMF方法,上述推荐系统能解决现有技术中的推荐系统没有基于基因维度来进行推荐,只保证在BP维度方面,没有办法从高维度进行匹配推荐的问题。
技术介绍
随着电子商务网站的快速发展,推荐系统已经被广泛研究和应用,推荐系统通过提取分析用户的资料、行为、评分等信息,获得用户的喜好,来帮助电商找到特定的用户为其推荐可能购买的产品,增加商品的销售量。推荐系统通过收集用户的历史评分、交互(浏览、收藏、“点赞”,“踩”等交互行为)、用户肖像(年龄、职业、性别等)、社交网络和上下文(时间、位置、活动状态、周围人员等)等数据,对用户的历史兴趣及偏好进行分析,挖掘出用户喜欢的项目(视频、音频、书籍、菜品、Web服务等信息),然后主动地将相关信息推荐给用户,满足用户的个性化需求。推荐算法是推荐系统的核心,很大程度上决定了推荐系统的性能。目前主要的推荐算法包括基于内容的推荐、基于知识的推荐、基于关联规则的推荐、协同过滤推荐和组合推荐等。目前被广泛研究的推荐系统有的是采用基于内容的推荐算法、协同过滤推荐算法等。基于内容的推荐算法是通过用户购买过的产品的特征,为用户推荐与其相似的产品。这种算法的优点是可以处理冷启动问题,处理新加入的产品,并且这种算法不会受到打分稀疏性的问题,因为它不依赖于用户对产品的评分。但是它的缺点是无法处理像图形、视频和音乐这种难以分析提取内容特征的商品。协同过滤算法则是利用用户-产品评分矩阵,计算用户或产品之间的相似度,利用相似度较高的邻居对其他产品进行评分预测,并根据预测评分的高低为目标用户进行推荐。但是每一个用户购买的产品数量通常不到产品总数的1%,所以造成用户-产品评分矩阵非常稀疏,从而使得推荐结果不佳;而基于邻域的协同过滤推荐算法是应用最早的协同过滤推荐技术,代表性算法为基于用户的协同过滤推荐和基于项目的协同过滤推荐。然而随着用户规模和项目数量的快速增长,基于邻域的协同过滤推荐算法的计算量大规模增大,同时产生了严重的评分数据稀疏性问题,即评分稀疏性问题。为了处理可扩展性和评分稀疏性问题,一些研究学者提出采用基于矩阵分解模型的推荐算法。矩阵分解模型假定“用户—项目”评分矩阵可以被分解为低维的潜在特征矩阵的乘积,其中潜在特征用于表示用户偏好或项目特征,如在电影推荐中,这些特征可能为喜剧、悬疑剧、爱情剧因素等。多次国际性比赛和大量研究都验证了矩阵分解模型具有抗数据稀疏性、易编程、较低的时空复杂度、较高的推荐精度和良好的可扩展性等优点。相对于基于邻域的协同过滤推荐算法,矩阵分解模型有效缓解了评分稀疏性问题,但该问题还没有得到完全解决。为了进一步缓解评分稀疏性问题,本专利技术在深入研究PMF的基础上,提出了一种基于矩阵分解的协同过滤推荐方法及系统,该算法在PMF的基础上,通过将用户的基因(Gene),行为(Behavior),表型(Phenotypic)这三类信息称之为用户的GBP数据,将这些数据进行标签化,进而形成以用户为基础的GBP标签;将用户的GBP信息进行标签化后,再将内容(商品、文章、视频、图片等)信息进行标签化,进而将用户的GBP标签和内容的标签进行算法层面的匹配;本专利技术中将上述算法称为GBP-PMF算法,可见,GBP-PMF算法是一种基于矩阵分解的协同过滤推荐算法,GBP-PMF算法是基于基因维度对原有MF算法进行优化,该算法有具有提升学习率,防止步长过大导致最终无法收敛的问题;迭代次数减少,提高运行效率;相比传统MF更加精准、高效。
技术实现思路
本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于矩阵分解的协同过滤推荐方法及系统,该算法在PMF的基础上,通过将用户的基因(Gene),行为(Behavior),表型(Phenotypic)这三类信息称之为用户的GBP数据,将这些数据进行标签化,进而形成以用户为基础的GBP标签;将用户的GBP信息进行标签化后,再将内容(商品、文章、视频、图片等)信息进行标签化,进而将用户的GBP标签和内容的标签进行算法层面的匹配;本专利技术中将上述算法称为GBP-PMF算法,可见,GBP-PMF算法是一种基于矩阵分解的协同过滤推荐算法,GBP-PMF算法是基于基因维度对原有MF算法进行优化,该算法有具有提升学习率,防止步长过大导致最终无法收敛的问题;迭代次数减少,提高运行效率;相比传统MF更加精准、高效。为实现上述专利技术目的,本专利技术采用如下的技术方案:一种基于矩阵分解的协同过滤推荐方法,包含以下步骤:1)用户对商品作出评分,通过信息采集模块对用户信息和商品信息以及评分信息进行采集;2)信息处理:2-1)将步骤1)中记录所得的用户信息和商品信息以及评分信息发送至信息处理模块中,并通过整合模块对信息进行整合,去除冗余;2-2)将步骤2-1)中处理后的信息发送到用户信息存储模块中保存,并通过用户信息存储模块建立系统评分矩阵;3)预测商品评分:4)商品推荐:4-1)为多个用户产生推荐,分别为每个用户产生推荐的独立过程:对一个用户进行推荐,由推荐列表产生模块对该用户产生推荐列表;4-2)推荐列表产生模块中的排序模块对所有已进行预测评分的商品的预测评分值由大至小进行排序,并通过列表生成模块将选取的结果生成推荐列表,放松给用户;5)完成项目的推荐;对于所述步骤2-2)中,系统评分矩阵满足:当系统有m个用户,n个商品,每个用户对每个物品的评分为从0-X。R为一个m行n列的系统评分矩阵,Ri,j代表用户i对物品j的评分。R中蕴含着用户爱好特征,也蕴含这物品的爱好特征。设U为一个d行m列的矩阵,每一列代表用户的特征向量;V为一个d行n列的矩阵,每一列代表一个物品的特征向量;设f为预测函数,该函数以用户特征和物品特征为输入值,输出值为该用户对该物品的预测分数值。从数学的角度来看PMF就是要将R分解为R≈f(UTV);对于所述步骤3)中,预测商品评分满足:采用评分估值公式为用户-商品评分矩阵中缺省评分赋予评分估值,评分估值公式的目标函数为E,函数E由如下步骤得出:假真实评分数据和预测评分值之差服从正态分布,即:其中,为服从均值为方差为σ2的正态分布,Ii,j为一个指示函数,当用户i对物品j的有过评分,则Ii,j等于1,否则Ii,j等于0。我们假设各项评分的误差之间相互独立,所以可以写成连乘的形式。同样的,我们假设用户的特征向量和物品的特征向量分别服从均值为0方差为和均值为0方差为的正态分布,即:由(2)、(3)、(4)以及贝叶斯公式可得:p(R)为常数,所以(5)式正比于对(6)两边取对数之后得:忽略常数项,设(8)为目标函数:一种基于矩阵分解的协同过滤推荐的系统,包含以下结构:依次连接的信息采集模块、信息处理模块、用户信息存储模块、商品评分本文档来自技高网
...

【技术保护点】
1.一种基于GBP的PMF方法,其特征在于,包含以下步骤:/n1)用户对商品作出评分,通过信息采集模块对用户信息和商品信息以及评分信息进行采集;/n2)信息处理:/n2-1)将步骤1)中记录所得的用户信息和商品信息以及评分信息发送至信息处理模块中,并通过整合模块对信息进行整合,去除冗余;/n2-2)将步骤2-1)中处理后的信息发送到用户信息存储模块中保存,并通过用户信息存储模块建立系统评分矩阵;/n3)预测商品评分:/n4)商品推荐:/n4-1)为多个用户产生推荐,分别为每个用户产生推荐的独立过程:对一个用户进行推荐,由推荐列表产生模块对该用户产生推荐列表;/n4-2)推荐列表产生模块中的排序模块对所有已进行预测评分的商品的预测评分值由大至小进行排序,并通过列表生成模块将选取的结果生成推荐列表,放松给用户;/n5)完成项目的推荐;/n对于所述步骤2-2)中,系统评分矩阵满足:/n当系统有m个用户,n个商品,每个用户对每个物品的评分为从0-X。R为一个m行n列的系统评分矩阵,R

【技术特征摘要】
1.一种基于GBP的PMF方法,其特征在于,包含以下步骤:
1)用户对商品作出评分,通过信息采集模块对用户信息和商品信息以及评分信息进行采集;
2)信息处理:
2-1)将步骤1)中记录所得的用户信息和商品信息以及评分信息发送至信息处理模块中,并通过整合模块对信息进行整合,去除冗余;
2-2)将步骤2-1)中处理后的信息发送到用户信息存储模块中保存,并通过用户信息存储模块建立系统评分矩阵;
3)预测商品评分:
4)商品推荐:
4-1)为多个用户产生推荐,分别为每个用户产生推荐的独立过程:对一个用户进行推荐,由推荐列表产生模块对该用户产生推荐列表;
4-2)推荐列表产生模块中的排序模块对所有已进行预测评分的商品的预测评分值由大至小进行排序,并通过列表生成模块将选取的结果生成推荐列表,放松给用户;
5)完成项目的推荐;
对于所述步骤2-2)中,系统评分矩阵满足:
当系统有m个用户,n个商品,每个用户对每个物品的评分为从0-X。R为一个m行n列的系统评分矩阵,Ri,j代表用户i对物品j的评分。R中蕴含着用户爱好特征,也蕴含这物品的爱好特征。设U为一个d行m列的矩阵,每一列代表用户的特征向量;V为一个d行n列的矩阵,每一列代表一个物品的特征向量;设f为预测函数,该函数以用户特征和物品特征为输入值,输出值为该用户对该物品的预测分数值。



对于所述步骤3)中,预测商品评分满足:采用评分估值公式为用户-商品评分矩阵中缺省评分赋予评分估值,评分估值公式的目标函数为E,函数E由如下步骤得出:
假真实评分数据和预测评分值之差服从正态分布,即:



其中,为服从均值为方差为σ2的正态分布,Ii,j为一个指示函数,当用户i对物品j的有过评分,则Ii,j等于1,否则Ii,j等于0。我们假设各项评分的误差之间相互独立,所以可以写成连乘的形式。同样的,我们假设用户的特征向量和物品的特征向量分别服从均值为0方差为和均值为0方差为的正态分布,即:






由(2)、(3)、(4)以及贝叶斯公式可得:



p(R)为常数,所以(5)式正比于

【专利技术属性】
技术研发人员:吴健王强刘智平
申请(专利权)人:上海解兮生物科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1