基于遗传算法和新型相似度计算策略的协同过滤推荐算法制造技术

技术编号:15640967 阅读:197 留言:0更新日期:2017-06-16 09:13
本发明专利技术涉及一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法,算法将每个用户的个体评分均值与方差充分利用到物品的相似度计算方案中,并用于基于物品推荐的协同过滤算法中。此外,算法利用遗传算法自动调整相似度计算公式中的权重值,并通过遗传算法控制推荐算法建模过程中的平均绝对偏差值。通过实验对比和结果分析表明,本专利提出的基于遗传算法和新型相似度计算策略的协同过滤推荐算法在推荐准确度、召回率等指标上都有明显的提高。

【技术实现步骤摘要】
基于遗传算法和新型相似度计算策略的协同过滤推荐算法
本专利技术涉及个性化推荐系统技术,尤其涉及一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法。
技术介绍
随着互联网和无线通信技术的迅猛发展,给人们日常生活带来了海量信息,如何在信息爆炸的年代获取有用信息成为科技工作者们急需解决的一个问题。个性化推荐是解决信息爆炸和信息过载的一种重要手段,它是根据用户的兴趣特点和购买行为,向用户推荐用户可能会感兴趣的信息和商品。推荐算法是个性化推荐中的重要组成部分,是利用数学和计算机算法等知识,推测出用户可能喜欢的东西。基于内容的过滤推荐、协同过滤推荐和混合推荐是三类较常见的推荐算法。基于内容的推荐算法根据物品的自身属性及其描述,如物品的颜色、材质等属性,找出与这些物品相似的物品,然后推荐给目标用户。但由于物品的属性往往不容易获取,基于内容的推荐算法用途受限。协同过滤算法则是利用用户过去的行为,如浏览记录、对物品的评分和购买记录等,为用户进行推荐,该类算法因其简单易实现且推荐质量好,成为当前最为流行的一种推荐算法。最后一类基于混合的推荐算法则是将基于内容的推荐算法和基于协同过滤技术的推荐算法相结合,从而提高推荐结果的质量。相似度的计算是基于相似度的协同过滤算法的关键技术,推荐算法可以根据相似度计算方案得出的用户或物品的相似度,找到目标对象(用户或物品)的邻居,即最相似的对象,进行推荐。现有的相似度计算方案大都忽略了用户的个性化评分习惯这一因素,有的用户比较苛刻,评分总体较低,然而有的用户比较宽容,对于相同满意度的商品,给出的评分较高。例如,在一个5级评分体系中,将4-5分的划为喜欢,低于4分的划分为不喜欢。但是,这种划分方式过于笼统,忽略了不同的人具有不同的评分习惯。不同的人对喜欢的界定不一样,有的人3分就能够表达他对某个物品的喜欢,而有的人则是5分才表示对某个物品的喜欢。有的人比较苛刻,对事物的品味较高,一部制作精美的电影,对于他来说也只是给出了3分的及格分数。而另一些人,比较慷慨大方,他们看到一部普通的电影,可能也会给出4分的高分。没有考虑用户个性化评分习惯这一因素的相似度计算方案所得到的推荐性能不够理想。另一方面,相似度计算方案中会涉及到多个权重因子的赋值,传统方法采用经验值或通过手工调试设置权重因子的值,这些方法费时费力且效果不佳。
技术实现思路
针对以上两个问题,本申请研究一种基于遗传算法和新型相似度计算方案的协同过滤算法,算法将每个用户的个体评分均值与方差充分利用到物品的相似度计算方案中,并用于基于物品推荐的协同过滤算法中。此外,算法利用遗传算法自动调整相似度计算公式中的权重值,并通过遗传算法控制推荐算法建模过程中的平均绝对偏差值。一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法,适用于评分范围较小或者评分情况小的情况,包括以下步骤:S1,收集用户对物品的原始评分;S2,计算每个用户的平均评分习惯,将用户对物品的评分转换成喜欢与不喜欢,获得用户对物品的一个偏好矩阵;S3,计算物品与物品之间的相似度:引入向量来统计对任意两个物品喜欢的组合情况各自出现的次数,及给定权向量表示在用户评分中各种组合情况的重要程度,通过向量及权向量的函数计算两个物品x,y的相似度;S4,根据预测的分数对物品排序,将前N个物品线上推荐给目标用户。其中,两个物品x,y的相似度通过下列公式计算得出,其中且wi∈[0,1]。一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法,适用于用户评分范围较大或者取值情况比较多的情况,包括以下步骤:S1,收集用户对物品的原始评分;S2,利用用户对物品的历史评分均值和方差来判断用户的评分习惯,进而计算出用户对物品的偏好集合;S3,计算物品与物品之间的相似度:引入向量来统计对任意两个物品喜欢的组合情况各自出现的次数,及给定权向量表示在用户评分中各种组合情况的重要程度,通过向量及权向量的函数计算两个物品x,y的相似度;S4,根据预测的分数对物品排序,将前N个物品线上推荐给目标用户。其中,用户对物品的偏好集合通过下列公式计算得出,其中是指用户u对物品i的偏好程度;avgu用户u的平均评分;varu是用户u的评分方差;参数λ为可以根据需要进行设置;p是偏好集合里的最差偏好度,P偏好集合中的最高偏好度。p和P都是可以量化的整数;Z是整数集合;如果则让如果则其中,两个物品x,y的相似度通过下列公式计算得出,基于遗传算法和新型相似度计算策略的协同过滤推荐算法,所述的权向量的选择包括将权向量编码成遗传算法中的个体,随机初始产生一定数量的权向量然后评估每个在训练数据集上的平均绝对偏差,接着通过遗传算子产生新的子代个体,逐代优化从而发现适合数据集的权向量所述的遗传算法依靠适应度函数的大小来区分每个个体的优劣。确定适应度函数包括以下步骤:S1,利用式3获得训练物品集中每对物品之间的相似度;S2,通过相似度值获得物品i最相似的k个物品,N(i);S3,对于训练集中的每个用户u,通过式5预测用户u在物品i上的评分;分别为物品i和j的平均评分,为用户u对物品j的实际评分,k为i,j两个物品同时被评价的用户个数;S4,利用式6计算遗传算法中的个体在训练集上的适应值函数:遗传算子包括选择、交叉和变异。通过实验对比和结果分析表明,本专利提出的基于遗传算法和新型相似度计算策略的协同过滤推荐算法在推荐准确度、召回率等指标上都有明显的提高。附图说明图1遗传算法中的染色体编码方式;图2基于遗传算法和新型相似度计算策略的协同过滤推荐算法总体框架图;图3各种算法在MovieLens(1M)数据集上的随着近邻物品个数(K-Neighbors)变化的MAE值对比;图4各种算法在Yahoo!Music数据集上的随着近邻物品个数(K-Neighbors)变化的MAE值对比;图5各种算法在Yahoo!Movie数据集上的随着近邻物品个数(K-Neighbors)变化的MAE值对比;图6各种算法在MovieLens(1M)数据集上的随着推荐物品数量变化的准确度对比;图7各种算法在Yahoo!Music数据集上的随着推荐物品数量变化的准确度对比;图8各种算法在Yahoo!Movie数据集上的随着推荐物品数量变化的准确度对比;图9各种算法在MovieLens(1M)数据集上的随着推荐物品数量变化的召回率对比;图10各种算法在Yahoo!Music数据集上的随着推荐物品数量变化的召回率对比;图11各种算法在Yahoo!Music数据集上的随着推荐物品数量变化的召回率对比。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本专利技术进一步详细说明。假设,某个小型购物系统中,只有五个用户(u1,u2,…,u5)和九个项目(i1,i2,…,i9),用户对物品的评分范围是1-5,评分矩阵如表1所示。我们通过下面的步骤来计算物品与物品之间的相似度。表1用户的原始评分矩阵假设,某个小型购物系统中,只有五个用户(u1,u2,…,u5)和九个项目(i1,i2,…,i9),用户对物品的评分范围是1-5,评分矩阵如表1所示。我们通过下面的步骤来计算物品与物品之间的相似度。表1用户的原始评分矩阵i1i2i3i4i5i6i7i8i9本文档来自技高网
...
基于遗传算法和新型相似度计算策略的协同过滤推荐算法

【技术保护点】
一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法,其特征在于,适用于评分范围较小或者评分情况小的情况,包括以下步骤:S1,收集用户对物品的原始评分;S2,计算每个用户的平均评分习惯,将用户对物品的评分转换成喜欢与不喜欢,获得用户对物品的一个偏好矩阵;S3,计算物品与物品之间的相似度:引入向量

【技术特征摘要】
1.一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法,其特征在于,适用于评分范围较小或者评分情况小的情况,包括以下步骤:S1,收集用户对物品的原始评分;S2,计算每个用户的平均评分习惯,将用户对物品的评分转换成喜欢与不喜欢,获得用户对物品的一个偏好矩阵;S3,计算物品与物品之间的相似度:引入向量来统计对任意两个物品喜欢的组合情况各自出现的次数,及给定权向量表示在用户评分中各种组合情况的重要程度,通过向量及权向量的函数计算两个物品x,y的相似度;S4,根据预测的分数对物品排序,将前N个物品线上推荐给目标用户。2.根据权利要求1所述的基于遗传算法和新型相似度计算策略的协同过滤推荐算法,其特征在于,所述的两个物品x,y的相似度通过下列公式计算得出,其中且wi∈[0,1]3.一种基于遗传算法和新型相似度计算策略的协同过滤推荐算法,其特征在于,适用于用户评分范围较大或者取值情况比较多的情况,包括以下步骤:S1,收集用户对物品的原始评分;S2,利用用户对物品的历史评分均值和方差来判断用户的评分习惯,进而计算出用户对物品的偏好集合;S3,计算物品与物品之间的相似度:引入向量来统计对任意两个物品喜欢的组合情况各自出现的次数,及给定权向量表示在用户评分中各种组合情况的重要程度,通过向量及权向量的函数计算两个物品x,y的相似度;S4,根据预测的分数对物品排序,将前N个物品线上推荐给目标用户。4.根据权利要求3所述的基于遗传算法和新型相似度计算策略的协同过滤推荐算法,其特征在于,所述的用户对物品的偏好集合通过下列公式计算得出,其中是指用户u对物品i的偏好程度;avgu用户u的平均评分;varu是用户u的评分方差;参数λ为可以根据需要进行设置;p是偏好集合里的最差偏好度,P偏好集合中的最高偏好度。p和P都是可以量化的整数;Z是整数集合;如果则让如果则5.根据权利要求4所述的基于遗传算法和新...

【专利技术属性】
技术研发人员:肖菁罗明陈洁敏朱佳
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1