System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及协同过滤推荐算法,尤其涉及一种基于改进协同过滤及惩罚标签评分的多样化推荐方法。
技术介绍
1、在大数据时代,用户在互联网上面对大量的信息和选择,导致他们难以处理和解决这些问题,推荐系统应运而生,它也是帮助用户更有效地使用信息,解决信息过载问题,提高用户满意度、信息利用效率,增加用户对平台粘性的重要控制手段和方法,推荐算法的目标主要以准确性、召回率、f1值为主,但不同平台,不同内容以及不同需求的前提下,不同推荐算法对其的推荐结果也会产生不同的影响,以提高用户满意度和增强用户参与度为主,同时着眼考虑推荐结果的多样性也一直是推荐系统领域研究的重大热点之一。
2、协同过滤算法推荐算法中最具代表性的算法之一,“人以类聚,物以群分”,协同过滤算法的核心思想是利用用户或物品之间的相似性来进行推荐。协同过滤的优势在于不需要事先对物品或用户进行特征工程,而是通过分析用户的行为数据来计算相似性。随着混合推荐算法的不断尝试,目前推荐算法有了更多的改进方法和混合模型等,如使用svd奇异值分解,引入内容信息,深度学习模型,神经网络模型,知识图谱等,这些算法旨在提高协同过滤算法在诸如电商推荐,电影音乐推荐、社交媒体、新闻推荐、在线广告等不同推荐场景下的性能、准确度等。虽然协同过滤技术在很多大型网站上都得到了很好的运用,但是随着信息数据规模的不断扩大,用户数量和物品数量不断增加,传统的协同过滤技术开始出现了一系列的明显问题:
3、(1)基于用户的协同过滤算法(usercf)根据用户兴趣和行为进行推荐,无需物品信息,对新用
4、(2)基于物品的协同过滤算法(itemcf)根据用户过去的行为和偏好,能够提供个性化的推荐,同时itemcf可以根据用户行为进行推荐,缓解了冷启动问题,同时对长尾(不常见)物品也有较好的支持,且无需用户信息;但是依旧无法解决用户-物品互动数据稀疏性问题,完全不考虑用户对不同物品的偏好程度,虽然注重了“个性化”,但是却依然容易受到物品热度的影响,导致一些物品会被过度推荐,而其他物品却被忽略,影响推荐效果;且itemcf倾向于推荐热门物品,这可能导致长尾物品被忽略,推荐结果缺乏多样性。
5、目前很多有一些方案通过数据填充、基于模型的方法、特征工程等手段增加数据密度,在一定程度上解决了数据稀疏性问题;也有利用物品的属性、标签等信息进行推荐来缓解冷启动问题的方法,但它们的侧重点均是强化某一方向的推荐,没有考虑到实际推荐中的用户推荐准确度和内容多样性的平衡需求。
技术实现思路
1、本专利技术的目的在于解决现有技术中的问题。
2、本专利技术解决其技术问题所采用的技术方案是:提供一种基于改进协同过滤及惩罚标签评分的多样化推荐方法,包括:
3、获取推荐对象相关数据并构建用户-物品交互矩阵,推荐对象相关数据包括用户日志和物品数据,用户-物品交互矩阵包括用户对物品的使用及使用时间,所述使用包括访问和评分;
4、根据用户-物品交互矩阵计算用户相似度和物品相似度,基于用户相似度生成基于用户的推荐列表,基于物品相似度生成基于物品的推荐列表;
5、基于预设权重,融合基于用户的推荐列表和基于物品的推荐列表,获取融合推荐列表;
6、收集物品的标签,使用标签评分算法计算标签热门程度并对融合推荐列表中的物品根据标签热门程度进行分数削减,生成最终的top-k推荐列表。
7、优选的,所述用户-物品交互矩阵表示为
8、;
9、其中,矩阵中的元素riu表示用户i对物品u的交互情况,m表示用户的数量,n表示物品的数量。
10、优选的,用户相似度采用皮尔逊相关系数、余弦相似度或jaccard相似度来表示。
11、优选的,用户相似度表示为
12、;
13、其中,分别为用户i和j的所有交互数据的集合,m(k)为使用过第k项物品的用户集合;和则分别表示用户i和用户j使用第k项物品的时间,m(k)、和均通过用户-物品交互矩阵获得;系数是时间衰减因子,其数值取值范围默认设置为[0,1]。
14、优选的,物品相似度采用余弦相似度表示。
15、优选的,物品相似度采用调整过的余弦相似度,表示为
16、;
17、其中,表示同时对物品u和v有过评分的用户,表示用户对所有评分过的物品的均值,和均通过用户-物品交互矩阵获得。
18、优选的,所述融合基于用户的推荐列表和基于物品的推荐列表,表示为;
19、其中, 表示基于用户i及其访问过的物品集合产生的融合推荐列表,为用户i构建的基于用户的推荐预测列表,为基于物品集合构建的基于物品的推荐预测列表,系数为加权因子,其数值取值范围[0,1]。
20、优选的,所述使用标签评分算法计算标签热门程度并对融合推荐列表中的物品根据标签热门程度进行分数削减,包括以下步骤:
21、收集物品数据里的标签,构建标签-物品的关系矩阵;
22、计算表示用户i对标签t的喜欢程度,表示为
23、;
24、其中,表示用户i对物品u的评分,表示物品u与标签t的相关度,p为平滑因子,则为物品u的所有标签评分均值;
25、根据计算标签的热门程度,并对融合推荐列表中的物品根据热门程度进行评分减少,并重新排序生成最终的top-k推荐列表。
26、优选的,所述根据计算标签的热门程度,具体为:对于标签t,计算所有的和作为热门程度,。
27、本专利技术具有如下有益效果:
28、(1)融合基于用户和基于物品的协同过滤算法的优势,综合利用用户和物品的交互信息,提高推荐的准确性,有利于提高推荐的准确性;用户的历史行为数据往往是稀疏的,而基于物品的协同过滤算法可以利用物品之间的相似性来填补缺失值,从而缓解稀疏性问题,有利于解决数据稀疏性问题;针对新用户先通过内容分析方法对物品进行特征提取和相似度计算,然后根据用户的个人信息和偏好,推荐与其兴趣相关的物品,同时由于存在标签,系统可以先根据用户个人信息和偏好预测的标签,从系统中匹配相应的内容标签,然后推荐与这些标签相关的物品,解决了冷启动问题;
29、(2)增加对于热门标签的判断,平衡推荐结果,提高推荐系统的多样性;同时,区分出热门标签也可以让系统知道大多数人可能喜欢什么,为新用户也能提供一个相对的入门推荐;合理调节热门标签在推荐列表中的权重,保持推荐准确率和新颖性的平衡,可以使推荐系统既能为用户展示时下热门的本文档来自技高网...
【技术保护点】
1.一种基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,所述用户-物品交互矩阵表示为
3.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,用户相似度采用皮尔逊相关系数、余弦相似度或Jaccard相似度来表示。
4.根据权利要求3所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,用户相似度表示为
5.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,物品相似度采用余弦相似度表示。
6.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,物品相似度采用调整过的余弦相似度,表示为
7.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,所述融合基于用户的推荐列表和基于物品的推荐列表,表示为
8.根据权利要求7所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在
9.根据权利要求8所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,所述根据计算标签的热门程度,具体为:对于标签t,计算所有的和作为热门程度,i∈[1,m]。
...【技术特征摘要】
1.一种基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,所述用户-物品交互矩阵表示为
3.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,用户相似度采用皮尔逊相关系数、余弦相似度或jaccard相似度来表示。
4.根据权利要求3所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,用户相似度表示为
5.根据权利要求1所述的基于改进协同过滤及惩罚标签评分的多样化推荐方法,其特征在于,物品相似度采用余弦相似度表示。
6.根据权利要求1所述...
【专利技术属性】
技术研发人员:邓凡,王佳斌,颜鹏贵,吕晟,林熙隆,
申请(专利权)人:华侨大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。