一种基于分步动态填充缓解推荐系统数据稀疏性的方法技术方案

技术编号：19481468 阅读：24 留言：0更新日期：2018-11-17 10:41

本发明专利技术请求保护一种基于分步动态填充缓解推荐系统数据稀疏性的方法。方法首先对用户行为数据预处理，建立用户—美食商家评分矩阵；其次，选取目标用户计算用户相似度，选取相似度大于阈值α的用户作为目标用户的预选相似邻居用户；然后，计算用户共同评分差均值，选取共同评分差均值小于阈值β的预选邻居用户作为最终的相似邻居用户，利用邻居用户对评分矩阵做第一步填充；最后，对评分矩阵中剩下的未填充数据，同样采用相似度阈值法和共同评分差均值来选取相似商家，并利用相似商家对评分矩阵做第二步填充。本发明专利技术在一定程度上缓解了美食商家推荐系统中评分矩阵的稀疏性问题，提高了推荐系统的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于分步动态填充缓解推荐系统数据稀疏性的方法
本专利技术属于美食推荐
，尤其涉及一种基于分步动态填充缓解推荐系统数据稀疏性的方法。
技术介绍
随着互联网技术的迅猛发展，数据规模的爆炸式增长，带来了严重的“信息过载”问题。如何快速有效地从纷繁复杂的数据中获取有价值的信息成为了当前大数据发展的关键难题。为了解决该难题，个性化推荐算法被广泛研究，其中最常见的是协同过滤算法。在美食商家推荐领域，由于网站上的美食商家数量巨大，但只有很少的用户愿意给去过的美食商家评分，所以造成了用户—美食商家评分数据矩阵的极大稀疏，导致基于协同过滤算法得到的商家推荐列表不够准确。因此，如何对稀疏的用户—美食商家评分矩阵进行准确的预填充是美食推荐算法首要解决的问题。
技术实现思路
本专利技术旨在解决以上现有技术的问题。提出了一种提高推荐准确度的基于分步动态填充缓解推荐系统数据稀疏性的方法。本专利技术的技术方案如下：一种基于分步动态填充缓解推荐系统数据稀疏性的方法，其包括以下步骤：步骤1、对用户行为数据进行预处理，选取与美食商家及美食用户相关的信息，得到用户—美食商家评分矩阵；步骤2、利用建立的用户—美食商家评分矩阵，为每个用户和每个美食商家构建历史评分记录集合，同时构建用户集合，按照用户的评分商家数从大到小对用户集合中的用户排序；步骤3、设置用户相似度阈值α和用户历史共同评分差均值阈值β；步骤4、按用户在用户集合中的顺序，选取一个目标用户；根据用户—美食商家评分矩阵，计算其余用户与目标用户的相似度；选取与目标用户相似度大于α的用户构建目标用户的预选相似邻居用户集；步骤5、计算目标...

【技术保护点】
1.一种基于分步动态填充缓解推荐系统数据稀疏性的方法，其特征在于，包括以下步骤：步骤1、对用户行为数据进行预处理，选取与美食商家及美食用户相关的信息，得到用户—美食商家评分矩阵；步骤2、利用建立的用户—美食商家评分矩阵，为每个用户和每个美食商家构建历史评分记录集合，同时构建用户集合，按照用户的评分商家数从大到小对用户集合中的用户排序；步骤3、设置用户相似度阈值α和用户历史共同评分差均值阈值β；步骤4、按用户在用户集合中的顺序，选取一个目标用户；根据用户—美食商家评分矩阵，计算其余用户与目标用户的相似度；选取与目标用户相似度大于α的用户构建目标用户的预选相似邻居用户集；步骤5、计算目标用户与各预选相似邻居用户的历史共同评分差均值，若两个用户历史本身没有共同评分商家，则他们的共同评分差均值为+∞；选取共同评分差均值小于β的预选邻居用户构造最终的相似邻居用户集；步骤6、利用目标用户的相似邻居用户集对用户—美食商家评分矩阵进行第一步填充；步骤7、对评分矩阵中剩下的未填充数据，同样采用相似度阈值法和共同评分差均值来选取最相似商家，并利用相似商家集来对用户—美食商家评分矩阵进行第二步填充。

【技术特征摘要】
1.一种基于分步动态填充缓解推荐系统数据稀疏性的方法，其特征在于，包括以下步骤：步骤1、对用户行为数据进行预处理，选取与美食商家及美食用户相关的信息，得到用户—美食商家评分矩阵；步骤2、利用建立的用户—美食商家评分矩阵，为每个用户和每个美食商家构建历史评分记录集合，同时构建用户集合，按照用户的评分商家数从大到小对用户集合中的用户排序；步骤3、设置用户相似度阈值α和用户历史共同评分差均值阈值β；步骤4、按用户在用户集合中的顺序，选取一个目标用户；根据用户—美食商家评分矩阵，计算其余用户与目标用户的相似度；选取与目标用户相似度大于α的用户构建目标用户的预选相似邻居用户集；步骤5、计算目标用户与各预选相似邻居用户的历史共同评分差均值，若两个用户历史本身没有共同评分商家，则他们的共同评分差均值为+∞；选取共同评分差均值小于β的预选邻居用户构造最终的相似邻居用户集；步骤6、利用目标用户的相似邻居用户集对用户—美食商家评分矩阵进行第一步填充；步骤7、对评分矩阵中剩下的未填充数据，同样采用相似度阈值法和共同评分差均值来选取最相似商家，并利用相似商家集来对用户—美食商家评分矩阵进行第二步填充。2.根据权利要求1所述的基于分步动态填充缓解推荐系统数据稀疏性的方法，其特征在于，所述步骤1中的用户行为数据预处理过程如下：步骤1.1：对从点评网站中获得用户行为数据，只选取美食商家及其用户的相关信息；步骤1.2：建立用户—美食商家评分矩阵，(1)从总的数据中筛选出与美食商家及美食用户相关的信息；(2)用这些信息来建立用户—美食商家评分矩阵。3.根据权利要求1所述的基于分步动态填充缓解推荐系统数据稀疏性的方法，其特征在于，所述步骤2具体过程如下：步骤2.1：为每个用户构建用户的历史评分记录集合；为每个商家构建商家的历史评分记录集合；步骤2.2：构建用户集合，统计每个用户的评分商家个数，按照用户评分商家个数从大到小对用户集合中的用户排序。4.根据权利要求1所述的基于分步动态填充缓解推荐系统数据稀疏性的方法，其特征在于，所述步骤4中构建目标用户的预选相似邻居用户集过程如下：步骤4.1：按用户在用户集合中的顺序，取一个用户作为目标用户；步骤4.2：利用用户—美食商家评分矩阵，通过Pearson皮尔逊相关系数公式来计算其余用户与目标用户的相似度；步骤4.3：选取与目标用户相似度大于α的用户构建目标用户的预选相似邻居用户集p_N(u)。5.根据权利要求4所述的基于分步动态填充缓解推荐系统数据稀疏性的方法，其特征在于，所述Pearson皮尔逊相关系数计算公式如下：其中，simu,v表示用...

【专利技术属性】
技术研发人员：黄梅根，王渝，周理含，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人