当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于混合推荐的新型音乐评分矩阵填充算法制造技术

技术编号:32855518 阅读:53 留言:0更新日期:2022-03-30 19:25
本发明专利技术公开了一种基于混合推荐的新型音乐评分矩阵填充算法。所述方法步骤包括:首先使用基于内容的推荐算法预测并填充评分矩阵,再基于物品的协同过滤算法预测评分,采用皮尔森相关系数计算相似度,并将相似度排序筛选相似度最高的前p个邻近物品,计算目标用户可能的评分,并填充到音乐评分矩阵中;再基于用户的协同过滤方法填充评分矩阵,采用余弦相似度计算相似度,并按照排序选取相似度最高的前20个评分信息进行填充;本发明专利技术创新性地在音乐推荐领域混合三种推荐方式进行评分填充,即采用基于内容的推荐算法及基于物品的协同过滤和基于用户的协同过滤算法预测评分,其中采用皮尔森相关系数相似度,有效缓解音乐推领域存在的数据稀疏问题。的数据稀疏问题。的数据稀疏问题。

【技术实现步骤摘要】
一种基于混合推荐的新型音乐评分矩阵填充算法


[0001]本专利技术涉及一种基于混合推荐的新型音乐评分矩阵填充算法,具体包括在音乐评分矩阵数据稀疏的条件下,混合使用基于内容的推荐及基于物品的协同过滤算法以及基于用户的协同过滤的填充音乐评分矩阵的方法。

技术介绍

[0002]互联网的普及给用户带来大量的信息,但同时也产生信息过载的问题。推荐系统可以从海量数据中快速、准确地为用户提供个性化服务,有效解决信息过载问题.协同过滤是目前推荐系统领域应用较广泛、较成功的方法之一。根据处理评分矩阵中信息方法的不同,协同过滤主要分为基于内存的协同过滤和基于模型的协同过滤,协同过滤根据目标用户的邻近用户的评分信息预测目标用户对未评分物品的评分,将预测评分较高的物品推荐给目标用户。在现实推荐系统中,数据通常较稀疏,相对于庞大的物品集合,用户仅评价其中很少一部分物品,造成用户间共同评分的物品数量更少,甚至为零。因此在稀疏数据环境下,协同过滤无法为目标用户选取可靠的邻近用户,影响推荐精度。针对数据稀疏问题,学者们提出多种基于内存的协同过滤算法,用于提高推荐质量。Kim根据用户创建的标签信息获取用户的喜好,用于提供个性化推荐。Ahmadian等提出基于多角度可靠性度量提高用户评分信息的方法,增加可靠性较低的用户的评分信息,并重新计算可靠性较低的评分,缓解数据稀疏性问题。孙小华根据用户评分均值、评分众数等填写评分矩阵中的空值,但填充结果单一。张凯涵等充分利用信任信息填充专家评分,但只考虑用户的社交信息。Bellogin等根据用户的正反馈信息选取邻近用户,根据“warm”用户生成个性化推荐,但需要的额外信息不具备完整性。Ma等提出缺失评分填充算法,综合考虑用户与物品的信息填充矩阵。基于内存的协同过滤算法通过寻找邻近用户及邻近物品进行推荐,这种推荐系统实现起来简单有效,但数据规模较大时限制算法性能。
[0003]针对现有方法存在的问题,本文提出面向稀疏数据的混合推荐算法,即基于内容的推荐算法以及基于物品的协同过滤和基于用户的协同过滤的混合算法,首先使用基于内容的推荐系统进行评分矩阵的填充,再使用基于物品的协同过滤,利用皮尔森相关系数计算物品间相似度,提取目标用户对未评分物品的邻近物品的评分记录,结合物品间相似度计算用户对未评分物品可能的评分,将得到的评分填充到评分矩阵中。然后使用基于用户的协同过滤,利用余弦相似度计算用户间相似度,找到目标用户的邻近用户,选择邻近用户共同评分数量最多的物品,结合目标用户与其邻近用户间相似度及邻近用户的评分记录再一次填充矩阵,最后预测评分并产生推荐。
[0004]基于内容的推荐算法首先构建歌曲数据模型,然后通过歌曲的数据发现歌曲间的相似度。因为歌曲A和歌曲C是相同的类型。因此,推荐算法认为两者相似度较高,而歌曲A和歌曲B具有较低的相似度。在计算用户的推荐结果时,用户喜欢听音乐A,则推荐算法给该用户推荐与歌曲A具有较高相似度的歌曲B。
[0005]基于物品的协同过滤,该算法思想如下:一个用户a喜欢项目m,那么该用户喜欢与
m相似的项目的概率很大。举个音乐的例子:对于歌曲M和歌曲N,喜欢听歌曲M的用户均喜欢听歌曲N,而喜欢听歌曲N的用户大部分都喜欢听歌曲M,因此电影歌曲M和歌曲N具有较高的相似度。在基于项目的协同过滤推荐算法为用户丙进行推荐时,将用户丙喜欢歌曲M最相似的歌曲作为候选结果推荐给用户丙。
[0006]基于用户的协同过滤推荐算法的提出是推荐系统里较早的,1992年提出后用到邮件过滤系统,后来又被用于新闻过滤,到目前为止都是推荐系统中十分经典的算法之一。算法来源于:如果两个人a和b喜好相类似,那么把b喜欢的物品推荐给a被认为是一个可靠的行为。以音乐为例,用户甲与用户丙同时喜欢歌曲p和歌曲X,则基于用户的协同过滤推荐算法认为用户甲和用户丙相似度较高。而用户乙喜欢歌曲q,与用户丙看的不一样,所有用户丙和用户乙相似度较低。在对用户丙计算推荐结果时采用用户甲喜欢而用户丙没有听过的歌曲Y为候选项推荐给用户丙。

技术实现思路

[0007]专利技术目的:在现实推荐系统中,数据通常较稀疏,相对于庞大的物品集合,用户仅评价其中很少一部分物品,造成用户间共同评分的物品数量更少,甚至为零。因此在稀疏数据环境下,协同过滤无法为目标用户选取可靠的邻近用户,影响推荐精度。针对上述挑战,本专利技术使用基于内容的推荐算法及基于物品的协同过滤和基于用户的协同过滤算法预测评分,创新性地混合三种推荐方式并用于音乐推荐,首次采用了皮尔森相关系数计算物品相似度,有效提高当前环境下音乐推荐的精确度,有效解决音乐推荐系统中存在的数据稀疏问题。
[0008]本文提出面向稀疏数据的混合推荐算法,即混合使用基于内容的推荐算法以及基于物品的协同过滤和基于用户的协同过滤算法。首先使用基于内容的推荐算法进行音乐评分矩阵的填充,再使用基于物品的协同过滤,利用皮尔森相关系数计算物品间相似度,提取目标用户对未评分物品的邻近物品的评分记录,结合物品间相似度计算用户对未评分物品可能的评分,将得到的音乐评分填充到评分矩阵中。然后使用基于用户的协同过滤,利用余弦相似度计算用户间相似度,找到目标用户的邻近用户,选择邻近用户共同评分数量最多的物品,结合目标用户与其邻近用户间相似度及邻近用户的评分记录再一次填充矩阵,最后预测评分并产生推荐。
[0009]技术方案:为了实现上述目的,本专利技术采用如下的技术方案:
[0010]第一方面,采用基于内容的推荐算法填充评分矩阵,包括以下步骤:
[0011](1)首先采用皮尔森相关系数计算物品间相似度。
[0012](2)将相似度按照从高到低排序,筛选与每个物品相似度最高的前p个邻近物品。
[0013](3)计算目标用户可能的评分,并填充到原始评分矩阵中。
[0014]第二方面:采用基于物品的协同过滤算法填充评分矩阵,包括以下步骤:
[0015](1)首先采用皮尔森相关系数计算物品间相似度。
[0016](2)将相似度按照从高到低排序,筛选与每个物品相似度最高的前p个邻近物品。
[0017](3)结合原始评分矩阵中目标用户对未评分物品的邻近物品的评分信息与物品间相似度,计算目标用户可能的评分,并填充到原始评分矩阵中。
[0018]第三方面,采用基于用户的协同过滤第三次填充矩阵,包括以下步骤:
[0019](1)采用余弦相似度计算用户间相似度。
[0020](2)将相似度按照从高到低排序。
[0021](3)选取与目标用户相似度最高的前20个邻近用户的评分信息再次进行填充。
[0022]本专利技术通过使用基于内容的推荐算法和基于物品的协同过滤和基于用户的协同过滤算法填充评分矩阵,为解决音乐评分数据的稀疏性提供了一种新型的思路,同时在计算物品相似度时,创新性地采用了皮尔森相关系数进行相似度计算,提高了准确率。在真实应用中,本专利技术能够将基于内容的推荐算法和基于物品和用户的协同过滤高效地结合起来,显著改善了原始音乐评分数据稀疏性的问题。...

【技术保护点】

【技术特征摘要】
1.一种基于混合推荐的新型音乐评分矩阵填充算法,其特征在于创新性地混合三种推荐方式,使用基于内容的推荐算法以及基于物品的协同过滤和基于用户的协同过滤填充音乐评分矩阵,同时在计算物品相似度时采用了皮尔森相关系数进行计算,同时采用余弦相似度进行用户相似度计算;算法主要包括以下步骤:步骤一:使用基于内容的推荐方法填充评分矩阵,首先采用皮尔森相关系数计算内容间的相似度,然后将相似度按从高到低排序,计算可能的评分,并填充评分矩阵;步骤二:使用基于物品的协同过滤算法进行第二次填充评分矩阵,首先采用皮尔森相关系数计算物品间相似度,然后按照相似度从高到低排序,筛选与每个物品相似度最高的前p个邻近物品,结合原始音乐评分矩阵中目标用户对未评分物品的邻近物品的评分信息与物品间相似度,计算目标用户可能的评分,并填充到音乐评分矩阵中;步骤三:使用基于用户的协同过滤算法进行第三次填充评分矩阵,首先采用余弦相似度计算用户间相似度并按照从高到低排序,选取与目标用户相似度最高的前20个邻近用户的音乐评分信息进行填充。2.根据权利要求1所述的一种基于混合推荐的新型音乐评分矩阵填充算法,其特征在于采用皮尔森相关系数计算物品间相似度:其中,U
i
、U
j
分别表示已对物品i和物品j评分的用户集合,r
u,i
表示用户u对物品i的评分,计算物品间的相似度,然后按照从高到低排序,筛选与每个物品相似度最高的前p个邻近物品;结合原始评分矩阵中目标用户对未评分物品的邻近物品的评分信息与物品间相似度,计算目标用户可能的评分,并填充到原始音乐评分矩阵中;对于目标用户u未评分的物品i,首先提取与物品i相似度最...

【专利技术属性】
技术研发人员:沙道鑫韩立新
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1