多因素影响的兴趣点推荐方法技术

技术编号:33923114 阅读:12 留言:0更新日期:2022-06-25 21:19
本发明专利技术是公开了一种一种多因素影响的兴趣点推荐方法,首先从用户签到相似度,好友相似度,类别偏好相似度三个角度综合考虑计算用户间相似度;其次将得到的三个相似度结合到一起求出用户相似度矩阵,并规范拉普拉斯矩阵;然后将特征向量组成新的特征空间进行聚类运算,最后融合四种因素的总评分来推荐用户兴趣点。本发明专利技术旨在解决推荐过程中计算量大、推荐效率低的问题,在应对不同用户时,计算用户对不同用户的偏好值,提高推荐效果。提高推荐效果。提高推荐效果。

【技术实现步骤摘要】
多因素影响的兴趣点推荐方法


[0001]本专利技术涉及兴趣推荐
,具体是一种多因素影响的兴趣点推荐方法。

技术介绍

[0002]随着互联网发展,各类信息越来越多,如何进行有效的信息获取及展示成为用户和平台共同关注的问题,而有效的推荐可帮我们进行信息过滤,成为解决这项问题的重要手段。
[0003]近年来,基于位置的服务平台的出现及广泛使用,催生了一种新的异质信息网络,基于位置的社交网络LBSN,它与传统社交网络的主要区别在于用户通过LBSN分享的内容现在都与真实地理位置有某种联系,并且可以向用户提供众多与位置相关的服务。
[0004]协同过滤算法是一种典型的基于用户社会关系的推荐方法,具有简单,可解释的优点,通常使用用户兴趣点交互信息,如用户对兴趣点的评分或签到信息,获得用户对兴趣点的偏好。然而LBSN中拥有的兴趣点、用户信息较少,用户

兴趣点签到矩阵又是极其稀疏的,所以传统协同过滤推荐算法的推荐效率和准确率较低。
[0005]传统推荐系统需要遍历所有用户的位置数据,带来了巨大的计算负担,从而导致这些推荐系统效率低下。并且大多数推荐方法仅考虑LBSN中少数几种语义信息,很多语义信息没有被利用。
[0006]从上述分析可以看出传统协同过滤推荐算法虽然简单可解释,但推荐效率和准确率较低,内容推荐算法虽然解决了冷启动问题,但是语义信息利用率低。

技术实现思路

[0007]本专利技术的目的是提出一种多因素影响的兴趣点推荐方法,结合聚类方法、协同过滤算法和内容推荐系统的优点,无需计算无关兴趣点的相关数据,提高了推荐效率,计算用户对不同用户的偏好值,提高推荐效果。
[0008]本专利技术目的可以通过采用如下技术方案达到:
[0009]基于多因素影响的兴趣点推荐方法,包括以下步骤:
[0010]融合异质信息网络LBSN中的用户签到类别,好友关系,用户签到频率建立用户间相似度矩阵。使用谱聚类方法,最小化不同簇之间用户的相似度,同时最大化簇内所有用户之间的相似度,对用户进行聚类,聚类个数通过本征间隙法得到,由同一类用户访问过的兴趣点得到用户的待推荐集合。
[0011]从用户签到相似度,好友相似度,类别偏好相似度三个角度综合考虑计算用户间相似度。用户之间的共同签到次数可以反映用户对兴趣点的偏好程度,使用余弦相似度计算用户的签到相似度,使用杰卡德相似系数计算用户好友相似度。用户与其好友通常有共同的签到兴趣点,可以用两用户所拥有的共同好友个数来计算其相似度。首先根据用户的社交关系数据,构造用户

用户关系矩阵F。其中每个元素F
u,u'
表示两个用户之间是否存在社交关系。为了防止好友数量过少带来的不良影响,引入签到好友机制。
[0012]用户对不同类别兴趣点的偏好,可以反映用户间的相似程度。本文使用词频

逆向文件频率技术计算用户兴趣偏好相似度,这种方法可以评估一个单词在文档中的重要性,使用皮尔森相关系数计算用户兴趣点类别偏好相似度,其更关注样本特征数值的大小,更适合兴趣点类别偏好相似度的计算。
[0013]最后将社交因素、兴趣点地理位置因素、用户访问顺序因素和兴趣点种类因素四种因素融合在统一框架中,针对不同用户的待推荐集合中兴趣点,不同数据集考虑不同的影响因素,得到兴趣点的总吸引力评分,向用户推荐评分较高的兴趣点。
[0014]为了更好地评价方法的性能,选取真实数据集进行数十次运行,判断本专利技术的稳定性,同时因为兴趣点推荐算法一般推荐的都是用户之前从未访问过的兴趣点,所以本文将每个用户访问过的兴趣点从测试数据集删除,以此来模拟真实的推荐过程。
[0015]与现有的专利技术技术对比,本专利技术具有如下优点:
[0016]本专利技术提出的兴趣点推荐方法通过此方法可以大幅缩小在推荐过程中需要考虑的兴趣点范围,减少推荐过程的计算量。在完成对兴趣点的筛选的基础之上,又将多种因素影响力模型相融合,从四个不同角度出发为用户进行兴趣点推荐,以此达到最佳的推荐效果。
附图说明
[0017]图1为本专利技术所述方法的实施步骤流程图
[0018]图2为本专利技术所述方法中LBSN网络结构图
[0019]图3为本专利技术所述方法的多因素混合模块图
[0020]图4为本专利技术所述方法的用户访问顺序模式图
具体实施方式
[0021]下面结合实例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。
[0022]如图1所述为本专利技术的实施步骤示意图,该方法包括以下步骤:
[0023]步骤一、输入待处理的数据集D={x1,x2,

,x
n
}.
[0024]步骤二、使用余弦相似度计算用户u和用户u'之间的签到相似度CheckSim(u,u'),r
u,j
表示用户u在兴趣点i签到频率,L
u
表示用户u访问过得兴趣点集合。
[0025]签到相似度CheckSim(u,u'):
[0026]步骤三、使用杰卡德相似系数计算用户好友相似度,首先根据用户的社交关系数据,构造用户

用户关系矩阵F。其中每个元素F
u,u'
表示两个用户之间是否存在社交关系。引入了签到好友的概念。假如用户u和u'在三个相同的兴趣点进行过签到活动,则我们认为其存在签到好友关系为:
[0027]根据上述的定义,我们可以得到u和u'之间的社交相似度FriSim(u,u'),其中N表示用户的数量。
[0028]使用皮尔森相关系数得到用户间兴趣偏好相似度CatSim(u,u'):
[0029]步骤四、将得到的用户签到相似度、用户社交关系相似度和用户兴趣点类别偏好相似度结合到一起得到用户相似度矩阵W,其中的每个元素W
u,u'
表示用户u和u'的相似度。W
u,u'
=α*CheckSim(u,u')+β*CatSim(u,u')+γ*FriSim(u,u')
[0030]其中参数α、β和γ表示不同的因素所占的比重,且α+β+γ=1。
[0031]步骤五、根据公式得到规范化的拉普拉斯矩阵L
Sysm
[0032]步骤六、计算L
Sysm
的特征值λ={λ1,λ2,λ3,...,λ
n
},从大到小排序。
[0033]步骤七、计算本证间隙序列E={e1,e2,e3,...,e
n
‑1|e
i
=λ
i

λ
i+1
},并寻找本证间隙序列中的第一个极大值,其下标即为聚类个数k,即:
[0034]步骤八、将前k个最小特征值对应的特征向量组成新的特征空间,并将每一行当作一个新的具有k个特征的用户并应用K

means聚类算法得到用户分组结果。
[0035]步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多因素影响的兴趣点推荐方法,包括以下步骤:(1)输入待处理的数据集,使用余弦相似度计算用户u和用户u'之间的签到相似度CheckSim(u,u'),使用杰卡德相似系数计算用户好友相似度,首先根据用户的社交关系数据,构造用户

用户关系矩阵F,其中每个元素F
u,u'
表示两个用户之间是否存在社交关系。为了防止好友数量过少带来的不良影响,引入签到好友的概念。(2)根据好友相似度计算用户之间的社交相似度FriSim(u,u'),文使用词频

逆向文件频率技术表示用户对类别偏好程度,使用皮尔森相关系数,其更关注样本特征数值的大小,而不是相似的特征维度,更适合兴趣点类别偏好相似度的计算,得到用户间兴趣偏好相似度CatSim(u,u'),j将得到的三种相似度结合计算用户相似度矩阵W。(3)计算相似度矩阵对应的拉普拉斯矩阵,并将得到的拉普拉斯矩阵规范化L
Sysm
,然后计算得到拉普拉斯矩阵对应的特征值,进行从大到小的排序,得到排序序列。(4)计算本证间隙序列,并寻找本证间隙序列中的第一个极大值,前k个最小特征值对应的特征向量组成新的特征空间,并将每一行当作一个新的具有k个特征的用户并应用K

means聚类算法得到用户分组结果。(5)针对不同用户的待推荐集合中兴趣点,将兴趣点类别影响力评分、兴趣点地理位置影响力评分、兴趣点访问顺序评分、用户社交关系影响力评分四种因素融合在统一框架中,不同数据集考虑不同的影响因素,得到兴趣点的总吸引力评分,向用户推荐评分较高的兴趣点。2.根据权利要求所述的一种多因素影响的兴趣点推荐方法,其特征在于,步骤(1)中用户u和用户u'之间的签到相似度Chec...

【专利技术属性】
技术研发人员:弋琨万静张兴宾
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1