一种基于社区划分和多源信息融合的地点推荐方法技术

技术编号:20117929 阅读:39 留言:0更新日期:2019-01-16 12:05
本发明专利技术公开了一种基于位置的社交网络的地点推荐方法,分为社区划分和地点推荐两个阶段。在社区划分阶段,首先采集位置社交网络中的用户签到信息,剔除签到信息稀疏的用户与地点。以用户之间对共同地点的评分计算用户间的相似度,构建用户相似度网络;然后基于相似度网络划分社区。在地点推荐阶段,融合多源信息产生推荐结果。首先采集位置社交网络中地点被签到的数据,用户签到地点的经纬度坐标,并根据用户历史签到数据推算用户常住地坐标。然后在每个社区内,地理因素、流行指标以及签到数据三者加权组合预测地点评分并产生推荐列表。本发明专利技术通过社区划分和多源信息融合的方式,相比传统方法能够提高推荐精度,降低方法的复杂度。

A method of location recommendation based on community partition and multi-source information fusion

The invention discloses a location-based social network location recommendation method, which is divided into two stages: community division and location recommendation. In the stage of community division, users'check-in information in location-based social networks is collected first, and users and locations with sparse check-in information are eliminated. User similarity network is constructed by calculating the similarity between users according to the score of common place among users, and then community is divided based on similarity network. In the recommendation stage, multi-source information is fused to produce recommendation results. Firstly, the location checked-in data in the location social network is collected, and the longitude and latitude coordinates of the location checked-in are calculated according to the user's history checked-in data. Then, within each community, the weighted combination of geographical factors, epidemic indicators and check-in data predicts the location score and generates a recommendation list. Compared with the traditional method, the proposed method can improve the recommendation accuracy and reduce the complexity of the method by means of community division and multi-source information fusion.

【技术实现步骤摘要】
一种基于社区划分和多源信息融合的地点推荐方法
本专利技术涉及位置的社交网络中的一种基于社区发现的地点推荐系统,属于推荐系统和移动社交领域。
技术介绍
随着网络信息的日益激增,如何寻找用户需要的有效信息已经成为迫切需要解决的问题。而推荐系统的应用可以有效地解决这个问题,为用户主动推送其感兴趣的事物,如朋友,位置,娱乐项目等。通过与移动社交网络的结合,获取用户的大量属性信息,如性别,年龄,爱好等,使得推荐系统能够准确地预测用户感兴趣的事物。近年来,随着位置社交网络的兴起,用户的数据信息得到了极大的丰富,可以轻易地获取到用户的签到信息,推荐系统得到了进一步的发展,因而基于位置的社交网络的地点推荐系统成为研究的热点。现有基于位置的社交网络的地点推荐系统存在如下问题:第一、传统的协同过滤方法,对每一个用户的推荐都要遍历整个网络,加大了计算复杂度。第二、通过地理距离过滤数据提高效率的方法,需要大量的先验信息,无法实现自适应过滤。
技术实现思路
鉴于上述现有地点推荐系统的缺陷,本专利技术的目的旨在致力于提供一种基于社区划分和多源信息融合的地点推荐方法,解决推荐效率提升的问题。本专利技术实现上述目的的技术解决方案概述为:一种基于社区划分和多源信息融合的地点推荐方法,其特征在于,所述方法包括:步骤1:社区划分阶段;步骤1-1:从位置社交网络中获得包含用户、地点以及地点评分的签到数据,从中剔除签到次数少于a次的用户,以及被签到次数少于b次的地点,最终得到的数据含有s个用户,用户集合表示U={u1,u2,…,us},t个地点,地点集合表示为L={l1,l2,…,lt},共计w条信息,每条信息包含用户、地点和评分三元组,表示为(ui,lp,lp),其中ui表示用户i,lp表示地点p,lp表示用户ui对地点lp的评分;步骤1-2:根据签到数据,以用户之间对相同地点签到的评分,通过余弦相似度计算得到用户之间的签到相似度权值,计算出s个用户两两之间的签到相似度,构建用户签到相似性网络Gc=<U,A>,A=[aij]s×s表示用户i和j之间签到相似性的权重矩阵;步骤1-3:根据用户签到相似度识别出不同的社区,社区集合表示为C={c1,c2,…,cm},其中ci代表第i个社区;步骤2:地点推荐阶段;步骤2-1:从位置社交网络中得到每个地点被用户签到的数据以及每个地点的经纬度坐标,地点i被用户签到情况集合并表示为Ki={k1,k2,…,ks},kj表示用户j对该地点的签到次数,地点i的经纬度坐标表示为loci=(lati,loni);步骤2-2:根据每个用户j的历史签到数据,推测该用户的常住地坐标,表示为hj=(latj,lonj);步骤2-3:根据用户常住地坐标以及地点坐标,统计地点被签到可能性与该地点距离用户常住地的距离分布关系,并运用函数拟合工具拟合幂律分布关系式:y=a·xb,其中x表示地点与用户常住地的距离,y则表示该地点被用户签到的可能性,其中a和b是拟合参数;步骤2-4:在划分的社区内,根据地点与用户常住地的距离获得地点被签到的可能性,作为对地点的预测评分;步骤2-5:在划分的社区内,根据用户签到相似度,利用协同过滤方法对目标用户未签到地点进行评分预测;步骤2-6:在划分的社区内,根据地点被签到数据,统计该地点在社区内被用户签到的次数并标准化,作为地点在社区内的流行度,然后将地点流行度作为对地点评分的预测,对目标用户未签到地点进行评分预测;步骤2-7:在划分的社区内,将地理距离、协同过滤及地点流行度三者加权组合,产生最终的评分预测,利用Top-N方法选出N个评分最高的地点推荐给目标用户。本专利技术步骤1-2包括:利用余弦相似度计算用户i和j签到相似性其中Li和Lj分别表示用户i和用户j的签到地点集合;Lij表示用户i和用户j之间共有的签到地点集合。本专利技术步骤1-3中识别出不同的社区包括两个阶段:假设一个具有s个节点的位置签到网络,在第一个阶段,针对单独节点对于每个节点i,考虑与它的邻居节点j基于模块度增益进行社区融合;其中模块度Q定义如下:其中i,j∈U,i≠j,aij表示用户i与用户j之间的相似性权值,zi=∑j∈S,j≠iaij,h=∑i∈Uzi,定为预期的用户i与用户j之间的相似度,表示用户i所在的社区,如果用户i,j在同一社区,则否则为0,对s个节点依次重复执行,直到不再有模块度增益产生,获得局部最佳模块度;在第二个阶段,初始化过程针对社区融合定义成一个超级节点,两个不同社区融合之间节点的连接表示成两个超级节点的连接,而连接的权重是两个社区融合之间所有节点的边的权重之和,同一个社区融合之间节点的边表示成超级节点的自循环连接;初始化完成后,网络转成是多个超级节点的状态,以重复第一阶段的方法进行迭代处理,直至模块度稳定后获得最优解,完成所有用户的社区划分。本专利技术步骤2-2包括:区域划分为若干个格子,针对每个用户j的历史签到数据,然后获取落在其中签到次数最多的格子,并取其中签到坐标的平均值为用户j常住地坐标,表示为hj=(latj,lonj)。本专利技术步骤2-4包括:根据拟合的地点被签到概率与地点距离用户常住地距离的函数关系,则预测的用户i对地点l评分g(ui,l)采用g(ui,l)=a·d(ui,l)b推测,其中d(ui,l)表示用户ui的常住地距离地点l的距离。本专利技术步骤2-5包括:在划分社区后,在每个社区cm中,针对社区内的用户ui,预测对未签到地点l的评分为:根据签到相似度网络Gc,利用协同过滤推荐方法获得推荐结果。本专利技术步骤2-6包括:在划分的社区内,根据地点l被签到数据统计该地点在社区内被用户签到的次数,并归一化表示地点流行度:其中tl代表社区内地点l被签到的次数,tmin代表该社区内地点被签到的最少次数,tmax代表社区内地点被签到的最多次数。本专利技术步骤2-7包括:基于多源信息融合的地点推荐将地理距离、协同过滤及地点流行度三者加权组合,产生最终的评分预测:f(ui,l)=α·c(ui,l)+β·g(ui,l)+γ·pl,其中α+β+γ=1,0≤α,β,γ≤1,代表三种因素各自对最终地点推荐的影响力;最终,根据预测的地点评分,选择Top-N个未签到地点推荐给目标用户,产生推荐列表。本专利技术地点推荐方法的应用,较之于传统此类系统具有突出的实质性特点和显著的有益效果,具体来看:采用的社区划分方法,使得社区内部联系紧密,过滤了无关的用户与地点数据,然后在社区内进行地点推荐,相对与传统协同过滤算法而言,缩小了地点推荐的范围,提高了推荐效率。融合地理距离、地点流行度及签到数据三种信息建立地点推荐模型,减少了数据稀疏对地点推荐的影响,提高了地点推荐的精度。附图说明图1为本专利技术地点推荐方法的实现系统示意图。图2为本专利技术方法中社区划分的方法示意图具体实施方式以下结合说明书附图对本专利技术创造作进一步详细说明。其中使用的主要符号及其含义包括:本专利技术致力于提供一种基于社区划分和多源信息融合的地点推荐方法。如图1所示概述来看,该方法分为社区划分和地点推荐两个阶段。在社区划分阶段,通过对基于位置的社交网络中的用户签到信息的采集,剔除有效性差的数据,获得有效的用户签到数据。然后利用余弦相似度公式,以用户之间对共同签到地点本文档来自技高网...

【技术保护点】
1.一种基于社区划分和多源信息融合的地点推荐方法,其特征在于,所述方法包括:步骤1:社区划分阶段;步骤1‑1:从位置社交网络中获得包含用户、地点以及地点评分的签到数据,从中剔除签到次数少于a次的用户,以及被签到次数少于b次的地点,最终得到的数据含有S个用户,用户集合表示U={u1,u2,…,us},t个地点,地点集合表示为L={l1,l2,…,lt},共计w条信息,每条信息包含用户、地点和评分三元组,表示为

【技术特征摘要】
1.一种基于社区划分和多源信息融合的地点推荐方法,其特征在于,所述方法包括:步骤1:社区划分阶段;步骤1-1:从位置社交网络中获得包含用户、地点以及地点评分的签到数据,从中剔除签到次数少于a次的用户,以及被签到次数少于b次的地点,最终得到的数据含有S个用户,用户集合表示U={u1,u2,…,us},t个地点,地点集合表示为L={l1,l2,…,lt},共计w条信息,每条信息包含用户、地点和评分三元组,表示为其中ui表示用户i,lp表示地点p,表示用户ui对地点lp的评分;步骤1-2:根据签到数据,以用户之间对相同地点签到的评分,通过余弦相似度计算得到用户之间的签到相似度权值,计算出s个用户两两之间的签到相似度,构建用户签到相似性网络Gc=<U,A>,A=[aij]s×s表示用户i和j之间签到相似性的权重矩阵;步骤1-3:根据用户签到相似度识别出不同的社区,社区集合表示为C={c1,c2,…,cm},其中ci代表第i个社区;步骤2:地点推荐阶段;步骤2-1:从位置社交网络中得到每个地点被用户签到的数据以及每个地点的经纬度坐标,地点i被用户签到情况集合并表示为Ki={k1,k2,…,ks},kj表示用户j对该地点的签到次数,地点i的经纬度坐标表示为loci=(lati,loni);步骤2-2:根据每个用户j的历史签到数据,推测该用户的常住地坐标,表示为hj=(latj,lonj);步骤2-3:根据用户常住地坐标以及地点坐标,统计地点被签到可能性与该地点距离用户常住地的距离分布关系,并运用函数拟合工具拟合幂律分布关系式:y=a·xb,其中x表示地点与用户常住地的距离,y则表示该地点被用户签到的可能性,其中a和b是拟合参数;步骤2-4:在划分的社区内,根据地点与用户常住地的距离获得地点被签到的可能性,作为对地点的预测评分;步骤2-5:在划分的社区内,根据用户签到相似度,利用协同过滤方法对目标用户未签到地点进行评分预测;步骤2-6:在划分的社区内,根据地点被签到数据,统计该地点在社区内被用户签到的次数并标准化,作为地点在社区内的流行度,然后将地点流行度作为对地点评分的预测,对目标用户未签到地点进行评分预测;步骤2-7:在划分的社区内,将地理距离、协同过滤及地点流行度三者加权组合,产生最终的评分预测,利用Top-N方法选出N个评分最高的地点推荐给目标用户。2.根据权利要求1所述基于社区划分和多源信息融合的地点推荐方法,其特征在于,所述步骤1-2包括:利用余弦相似度计算用户i和j签到相似性其中Li和Lj分别表示用户i和用户j的签到地点集合;Lij表示用户i和用户j之间共有的签到地点集合。3.根据权利要求1所述基于社区划分和多源信息融合的地点推荐方法,其特征在于,所述步骤1-3中识...

【专利技术属性】
技术研发人员:张博王玉峰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1