当前位置: 首页 > 专利查询>东华大学专利>正文

一种基于多相似度的双极限学习机混合协同过滤推荐方法技术

技术编号:21184764 阅读:42 留言:0更新日期:2019-05-22 15:22
本发明专利技术涉及一种基于多相似度的双极限学习机混合协同过滤推荐方法,包括以下步骤:利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。本发明专利技术能够降低评分预测的误差,提高了推荐的精度。

A Hybrid Collaborative Filtering Recommendation Method Based on Multi-similarity for Dual-limit Learning Machines

The present invention relates to a hybrid collaborative filtering recommendation method based on multi-similarity for dual-limit learning machine, which includes the following steps: calculating similarity from both items and users by using score matrix, and adding similarity as weight to the nearest neighbor score vector to obtain user contribution vector and item contribution vector; training the dual-limit learning machine network with user contribution in training Vectors and item contribution vectors are used as input of double-limit learning machine. The trained network of double-limit learning machine is used to predict user u's score on item I and to judge whether to recommend item I to user u according to the score. The invention can reduce the error of score prediction and improve the accuracy of recommendation.

【技术实现步骤摘要】
一种基于多相似度的双极限学习机混合协同过滤推荐方法
本专利技术涉及互联网技术中的兴趣点推荐
,特别是涉及一种基于多相似度的双极限学习机混合协同过滤推荐方法。
技术介绍
随着互联网的高速发展,推荐系统在电子商务,新闻推荐,视频推送等领域崭露头角,取得不错的效果。目前,大多数互联网公司都使用着各种推荐系统作为一种新的方式来提升服务质量和客户粘性。对于广大的消费者来说,推荐系统在一定程度上省去了海量信息检索的过程,可以轻易获取想要的信息。在推荐系统中,协同过滤(CollaborativeFiltering,CF)算法作为一种最重要的信息过滤的手段,受到了人们的广泛关注,并取得了很大的成功,协同过滤推荐源于现实生活中口碑相传的过程,利用相似用户之间具有相似兴趣偏好的方法,来发现用户对物品的潜在偏好。严格意义上来说,协同过滤推荐算法主要包括三类:基于内存的协同过滤(MemorybasedCF)算法,基于模型的协同过滤(modelbasedCF)推荐算法,混合协同过滤(hybridCF)推荐算法。基于内存的协同过滤算法是在稀疏评分矩阵的基础上通过计算用户或物品间的相似度,来预测评分或进行TopN推荐,比如基于用户的协同过滤(User-basedCF),基于物品的协同过滤(Item-basedCF)。基于模型的协同过滤是建立一个基于评分数据集的模型,然后从数据集中提取一些信息,并将其作为“模型”来进行推荐,这种方法有着快速和可伸缩性的优点,如矩阵分解,概率潜在语义分析,贝叶斯网络。混合协同过滤将基于内存的协同过滤与基于模型的协同过滤相结合,克服数据稀疏的不足,提高了预测性能,大多数的商业运用都是混合协同推荐算法。虽然传统的协同过滤因其简单有效而被广泛使用,但也存在以下不足:a)传统的协同过滤算法都是聚焦于单一的相似度,或用户间相似度,或物品间相似度。对于这两者的使用场景主要是取决于推荐系统的用户规模和物品规模,但并不是表明使用效果差的不能提供有效的信息,这是不符合认知规律的,人类对陌生对象的认知是取决于自己属性和对象属性的共同作用。b)评分预测公式过于简单。传统的基于用户和基于物品的协同过滤的推荐算法的评分预测公式只是近邻评分做了加权求和的过程。而事实上,评分过程可能是一个包含非线性的复杂的决策过程,不能很好的表征这一过程。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于多相似度的双极限学习机混合协同过滤推荐方法,能够降低评分预测的误差,提高了推荐的精度。本专利技术解决其技术问题所采用的技术方案是:提供一种基于多相似度的双极限学习机混合协同过滤推荐方法,包括以下步骤:(1)利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;(2)对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;(3)采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。所述步骤(1)包括以下子步骤:(11)清洗数据样本,去除重复数据,对用户和商品进行连续编号;(12)构建评分矩阵,矩阵的同一列为不同用户对同一商品的评分,同一行为同一用户对不同商品的评分,以零来填充缺失的项;(13)从用户维度和物品维度计算用户间相似度和物品间相似度,以行向量为特征向量构建用户相似度矩阵SuserN′N,以列向量为特征向量构建物品相似度矩阵SitemM×M;(14)对用户间相似度和物品间相似度分别进行排序,根据预设的近邻数,确定目标用户和目标物品的近邻群体;(15)将用户间相似度和物品间相似度分别与评分记录相乘,来度量近邻分数对评分的贡献,得到用户贡献矩阵和物品贡献矩阵。所述步骤(13)中用户间相似度和物品间相似度均采用余弦相似度计算方法进行计算,其中,用户间相似度物品间相似度rak和rbk表示用户a与用户b对物品k的评分,rka和rkb表示用户k对物品a和物品b的评分。所述步骤(2)包括以下子步骤:(21)随机初始化双极限学习机的隐层参数,包括w1为第一隐层权重,b1为第一隐层偏置,w2为第二隐层权重,b2为第二隐层偏置;(22)计算第一隐层输出和第二隐层输出,其中,第一隐层输出第二隐层输出h(·)是激活函数,x1为第一隐层输入,x2为第二隐层输入;(23)计算输出层输出,其中,输出层输出O=H1β1+H2β2,β1和β2为输出权重;(24)计算损失函数,损失函数Y表示实际评分值;(25)更新输出权重,完成训练。所述步骤(22)中激活函数采用RELU激活函数所述步骤(25)中采用梯度下降的方式来更新输出权重,具体计算方式如下:其中,η表示梯度下降法的更新步长。所述步骤(25)中令输出权重(H1+H2)为H1+H2的Moore-Penrose广义逆矩阵。所述步骤(3)具体包括以下步骤:(31)计算用户u与其他用户的相似度,确定用户u的近邻群;(32)查询出这些近邻对物品i的评分,并与对应的相似度进行加权得到用户贡献向量V1;(33)计算物品i与其他物品的相似度,确定物品i的近邻群;(34)查询出这些近邻被用户u的评分,并与对应的相似度进行加权得到物品贡献向量V2;(35)将用户贡献向量V1和物品贡献向量V2作为输入,根据训练好的双极限学习机网络计算预测的评分;(36)当评分超过阈值时向用户u推荐物品i。有益效果由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:本专利技术将目标用户和目标物品的加权后的近邻分数分别作为输入,利用用户维度的信息和物品的维度的信息综合预测评分,与传统的协同过滤算法相比,本方法明显降低了评分预测的误差,提高了推荐的精度。附图说明图1是本专利技术的流程图;图2是本专利技术中双极限学习机评分预测模型示意图。具体实施方式下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。本专利技术的实施方式涉及一种基于多相似度的双极限学习机混合协同过滤推荐方法,如图1所示,包括以下步骤:(1)清洗评分记录数据样本,去除重复数据,对用户和商品进行编号(假设有N个用户,M件商品),并使编号连续;(2)建立评分矩阵R。假设某平台有N个活跃用户,M件产品,L条评分记录,每条评分记录有用户ID,物品的ID和用户对此商品的打分构成。那可以构建如下的矩阵:i1…ij…iMu1r11…r1j…r1M………uirj1…rijriM…………uNrN1…rNjrNM其中,rij表示第i个用户对第j件产品的偏好,由于每个用户不可能使用所有产品,所以矩阵R有数据缺失,是一个稀疏矩阵,缺失的部分可以用0来填补。用户对产品的偏好可以是评分,也可以是赞成与反对。(3)计算用户间相似度和物品间相似度。在构建评分矩阵后,根据和从用户维度和物品维度计算相似度,以行向量为特征向量构建用户相似度矩阵SuserN×N,以列向量为特征向量构建物品相似度矩阵SitemM×M。(4)确定近邻,构建贡献矩阵。相似度进行排序,根据预设的近邻数K,目标用户和目标物品的近邻群体就可本文档来自技高网
...

【技术保护点】
1.一种基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,包括以下步骤:(1)利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;(2)对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;(3)采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。

【技术特征摘要】
1.一种基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,包括以下步骤:(1)利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;(2)对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;(3)采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。2.根据权利要求1所述的基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,所述步骤(1)包括以下子步骤:(11)清洗数据样本,去除重复数据,对用户和商品进行连续编号;(12)构建评分矩阵,矩阵的同一列为不同用户对同一商品的评分,同一行为同一用户对不同商品的评分,以零来填充缺失的项;(13)从用户维度和物品维度计算用户间相似度和物品间相似度,以行向量为特征向量构建用户相似度矩阵SuserN×N,以列向量为特征向量构建物品相似度矩阵SitemM×M;(14)对用户间相似度和物品间相似度分别进行排序,根据预设的近邻数,确定目标用户和目标物品的近邻群体;(15)将用户间相似度和物品间相似度分别与评分记录相乘,来度量近邻分数对评分的贡献,得到用户贡献矩阵和物品贡献矩阵。3.根据权利要求2所述的基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,所述步骤(13)中用户间相似度和物品间相似度均采用余弦相似度计算方法进行计算,其中,用户间相似度物品间相似度rak和rbk表示用户a与用户b对物品k的评分,rka和rkb表示用户k对物品a和物品b的评分。4.根据权利要求1所述的基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,所述步骤(2)包括以下...

【专利技术属性】
技术研发人员:罗成陈亮
申请(专利权)人:东华大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1