一种位置社交网络中兴趣点-区域联合推荐方法技术

技术编号:28742258 阅读:26 留言:0更新日期:2021-06-06 16:24
本发明专利技术属于计算机应用技术领域,具体公开了一种位置社交网络中兴趣点

【技术实现步骤摘要】
一种位置社交网络中兴趣点

区域联合推荐方法


[0001]本专利技术属于计算机应用
,具体涉及一种位置社交网络中兴趣点

区域联合推荐方法。

技术介绍

[0002]近年来,随着位置社交网络的飞速发展,诸如Foursquare这样知名的位置社交网络已经吸引了近亿的注册用户,因而产生了大量的用户历史签到记录,而这些数据记录信息在兴趣点推荐领域有着独特且关键的作用。
[0003]目前的兴趣点推荐的基本过程是通过对用户的历史签到信息来推断用户的兴趣点偏好,根据用户的兴趣点偏好进行推荐。在这些用户历史签到数据中,不仅隐含着用户的兴趣点偏好,而且还隐含着用户对于兴趣点所处区域的偏好,该偏好也间接影响用户对该兴趣点的偏好,而在兴趣点推荐领域,人们往往会忽略这样的区域级兴趣,正是忽略了用户的这种区域的签到习惯,导致系统无法捕捉用户真正完整的兴趣点偏好,这也是目前兴趣点推荐技术存在的缺陷。

技术实现思路

[0004]本专利技术的目的在于克服现有技术捕捉用户兴趣不全面的缺陷,充分挖掘现有兴趣点推荐领域忽视的用户的区域级兴趣,在此基础上提出一种构建用户区域级兴趣的方法。具体技术方案如下:
[0005]一种位置社交网络中兴趣点

区域联合推荐方法,包括如下步骤:
[0006]步骤1、用户历史签到数据预处理:
[0007]用户历史签到数据是由一系列五元组记录l构成,每个五元组l包含用户ID、兴趣点ID、经度、纬度、访问频率;在对数据集进行预处理时,挑选了至少被10个不同的用户访问过的兴趣点以及签到过至少15个不同的兴趣点的用户构成数据集的主体;
[0008]步骤2、构建区域级兴趣特征矩阵R:
[0009]针对处理后的签到数据集,来构建区域级兴趣特征矩阵,该矩阵可以反映用户对兴趣点所在区域的兴趣,将是下一步骤区域级兴趣建模的输入;
[0010]步骤3、建模区域级兴趣:
[0011]将区域级兴趣特征矩阵作为输入,通过逻辑矩阵分解技术建模后,将学习到用户特征向量和兴趣点特征向量,通过这两者向量的点积运算即可获得用户的区域级兴趣偏好;
[0012]步骤4、添加区域动态权重:
[0013]针对用户对区域的重视程度的差异,将利用DBSCAN聚类算法来获取区域级兴趣动态权重,结合区域级兴趣偏好来表示用户的真实区域偏好;
[0014]步骤5、合并用户个人兴趣与区域兴趣:
[0015]在捕捉区域级兴趣的同时,也不能忽视用户对每个兴趣点自身的兴趣,所以融合
个人兴趣能够尽可能的使用户兴趣偏好完整,有助于提高兴趣点推荐的效果;
[0016]步骤6、推荐top

k兴趣点给用户。
[0017]进一步的,所述步骤1具体包括如下步骤:
[0018]步骤1

1首先确定主体,包括用户ID+兴趣点ID,然后将所有数据以主体为键,累加的签到次数为值,即为最基本的数据构成,包括用户ID,兴趣点ID,签到频率;
[0019]步骤1

2、挑选了至少被10个不同的用户访问过的兴趣点以及签到过至少15个不同兴趣点的用户来构成数据集的主体,最终根据数据集构建的字典H的记录格式为{[用户ID,兴趣点ID]:签到频率}。
[0020]进一步的,所述步骤2具体包括如下步骤:
[0021]步骤2

1、首先定义一个概念,将兴趣点以自己的地理位置为圆心,半径为r所构成的的圆形地理区域称为该兴趣点的逻辑区域,在此逻辑区域中,用户访问的其他兴趣点的个数将影响用户对该兴趣点逻辑区域的兴趣;
[0022]步骤2

2、矩阵构建:
[0023]步骤2
‑2‑
1、根据步骤1中得到的数据集,构建兴趣点集合G(g1,g2,g3,

,g
n
)以及兴趣点ID与其经纬度坐标对应的字典M{g
i
:[long_i,lat_i]},集合G中包含不重复的所有的兴趣点,字典M中记录着兴趣点ID以及对应的经纬度坐标;
[0024]步骤2
‑2‑
2、通过haversine距离公式计算每个兴趣点与目标兴趣点的距离,距离阈值设置为10km,并且在计算距离的同时,通过字典X保存每个目标兴趣点与之对应的距离在阈值内的其他兴趣点的集合;当所有距离计算完后,字典X即可构建完成,其数据记录格式为{目标兴趣点ID:集合S},其中集合S中的兴趣点与该目标兴趣点之间距离小于等于距离阈值;
[0025]步骤2
‑2‑
3、初始化区域级兴趣特征矩阵R,通过上述的字典X构建矩阵R,具体公式为:
[0026][0027]R
ui
表示矩阵R中用户u对兴趣点i所在区域的偏好;其中X
i
表示目标兴趣点i逻辑区域内的兴趣点集合,而Y
u
表示用户u访问过的兴趣点集合,X
i
∩Y
u
即表示用户在目标兴趣点的逻辑区域内访问过的兴趣点集合,α为区域补偿因子,同一个用户在对于相同大小的逻辑区域以及相同的已访问兴趣点数量的情况下,用户的区域级兴趣也会受到逻辑区域中兴趣点分布密集或是稀疏的影响;逻辑区域中的兴趣点越稀疏,表明用户对该区域越感兴趣,相反的,逻辑区域中的兴趣点非常密集,表明用户对该区域的兴趣相比于稀疏区域的兴趣要小。
[0028]进一步的,步骤3

1假设l
ij
表示用户i选择与兴趣点j所在逻辑区域进行交互的事件(即用户i喜欢并会去访问兴趣点j所在的逻辑区域),并且设置β
i
和β
j
分别为用户偏置向量和兴趣点偏置向量,用户i访问兴趣点j所在逻辑区域的概率P(l
ij
|u
i
,h
j

i

j
)为:
[0029][0030]其中u
i
是用户i的潜在向量,h
j
是兴趣点j所在的逻辑区域的潜在向量,该概率P即可表示为用户对兴趣点所在区域的偏好得分;
[0031]步骤3

2最后通过解决以下优化问题来学习上述公式中的参数U、H、β:
[0032][0033]通过随机梯度下降的迭代方式来优化该目标函数即可学习所需参数,最后通过学习后的参数U、H、β来表示用户的区域级兴趣,即P(l
ij
|u
i
,h
j

i

j
)。
[0034]进一步的,步骤4

1、将利用密度聚类的方法间接转化动态权重,采用两个参数:扫描区域半径eps和包含最小兴趣点数量MinPts:
[0035]步骤4
‑1‑...

【技术保护点】

【技术特征摘要】
1.一种位置社交网络中兴趣点

区域联合推荐方法,其特征在于包括如下步骤:步骤1、用户历史签到数据预处理:用户历史签到数据是由一系列五元组记录l构成,每个五元组l包含用户ID、兴趣点ID、经度、纬度、访问频率;在对数据集进行预处理时,挑选了至少被10个不同的用户访问过的兴趣点以及签到过至少15个不同的兴趣点的用户构成数据集的主体;步骤2、构建区域级兴趣特征矩阵R:针对处理后的签到数据集,来构建区域级兴趣特征矩阵,该矩阵可以反映用户对兴趣点所在区域的兴趣,将是下一步骤区域级兴趣建模的输入;步骤3、建模区域级兴趣:将区域级兴趣特征矩阵作为输入,通过逻辑矩阵分解技术建模后,将学习到用户特征向量和兴趣点特征向量,通过这两者向量的点积运算即可获得用户的区域级兴趣偏好;步骤4、添加区域动态权重:针对用户对区域的重视程度的差异,将利用DBSCAN聚类算法来获取区域级兴趣动态权重,结合区域级兴趣偏好来表示用户的真实区域偏好;步骤5、合并用户个人兴趣与区域兴趣:在捕捉区域级兴趣的同时,也不能忽视用户对每个兴趣点自身的兴趣,所以融合个人兴趣能够尽可能的使用户兴趣偏好完整,有助于提高兴趣点推荐的效果;步骤6、推荐top

k兴趣点给用户。2.根据权利要求1所述的一种位置社交网络中兴趣点

区域联合推荐方法,其特征在于:所述步骤1具体包括如下步骤:步骤1

1首先确定主体,包括用户ID+兴趣点ID,然后将所有数据以主体为键,累加的签到次数为值,即为最基本的数据构成,包括用户ID,兴趣点ID,签到频率;步骤1

2、挑选了至少被10个不同的用户访问过的兴趣点以及签到过至少15个不同兴趣点的用户来构成数据集的主体,最终根据数据集构建的字典H的记录格式为{[用户ID,兴趣点ID]:签到频率}。3.根据权利要求2所述的一种位置社交网络中兴趣点

区域联合推荐方法,其特征在于:所述步骤2具体包括如下步骤:步骤2

1、首先定义一个概念,将兴趣点以自己的地理位置为圆心,半径为r所构成的的圆形地理区域称为该兴趣点的逻辑区域,在此逻辑区域中,用户访问的其他兴趣点的个数将影响用户对该兴趣点逻辑区域的兴趣;步骤2

2、矩阵构建:步骤2
‑2‑
1、根据步骤1中得到的数据集,构建兴趣点集合G(g1,g2,g3,

,g
n
)以及兴趣点ID与其经纬度坐标对应的字典M{g
i
:[long_i,lat_i]},集合G中包含不重复的所有的兴趣点,字典M中记录着兴趣点ID以及对应的经纬度坐标;步骤2
‑2‑
2、通过haversine距离公式计算每个兴趣点与目标兴趣点的距离,距离阈值设置为10km,并且在计算距离的同时,通过字典X保存每个目标兴趣点与之对应的距离在阈值内的其他兴趣点的集合;当所有距离计算完后,字典X即可构建完成,其数据记录格式为
{目标兴趣点ID:集合S},其中集合S中的兴趣点与该目标兴趣点之间距离小于等于距离阈值;步骤2
‑2‑
3、初始化区域级兴趣特征矩阵R,通过上述的字典X构建矩阵R,具体公式为:R
ui
表示矩阵R中用户u对兴趣点i所在区域的偏好;其中X
i
表示目标兴趣点i逻辑区域内的兴趣点集合,而Y
u
表示用户u访问过的兴趣点集合,X
i
∩Y
u
即表示用户在目标兴趣点的逻辑区域内访问过的兴趣点集合,α为区域补偿因子,同一个用户在对于相同大小的逻辑区域以及相同的已访问兴趣点数量的情况下,用户的区域级兴趣也会受到逻辑区域中兴趣点分布密集或是稀疏的影响;逻辑区域中的兴趣点越稀疏,表明用户对该区域越感兴趣,相反的,逻辑区域中的兴趣点非常密集,表明用户对该区域的兴趣相比于稀疏区域的兴趣要小。4.根据权利要求3所述的一种位置社交网络中兴趣点

区域联合推荐方法,其特征在于:步骤3

1假设l
ij
表示用户i选择与兴趣点j所在逻辑区域进行交互的事件(即用户i喜欢并会去访问兴趣点j所在的逻辑区域),并且设置β
i
和β
j
分别为用户偏置向量和兴趣点偏置向量,用户i访问兴趣点j所在逻辑区域的概率P(l
ij
|u
i
,h
j

i

j
)为:其中u
i
是用户i的潜在向量,h
j
是兴趣点j所在的逻辑区域的潜在向量,该概率P即可表示为用户对兴趣点所在区域的偏好得分;步骤3

2最后通过解决以下优化问题来学习上述公式中的参数U、H、β:通过随机...

【专利技术属性】
技术研发人员:袁浩徐建
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1