基于签到数据的地点推荐方法及装置制造方法及图纸

技术编号:24035962 阅读:30 留言:0更新日期:2020-05-07 01:54
本发明专利技术公开了一种基于签到数据的地点推荐方法及装置,所述方法包括:采用多中心发现算法确定用户的活跃区域;根据确定的所述活跃区域计算被推荐地点和用户已签到地点之间的相似度即地理接近度;对用户地点签到矩阵即UL矩阵按照时间段进行分割,得到用户‑地点‑时间矩阵即ULT矩阵,根据所述ULT矩阵计算地点之间的相似度即时间感知的地点相似度;将所述地理接近度和所述时间感知的地点相似度进行融合,计算地点相似度,并根据所述地点相似度进行地点推荐。

Location recommendation method and device based on sign in data

【技术实现步骤摘要】
基于签到数据的地点推荐方法及装置
本专利技术涉及计算机
,尤其涉及一种基于签到数据的地点推荐方法及装置。
技术介绍
随着无线网络、移动设备和Web2.0等技术的不断发展,基于地理位置的社交网络正在变得越来越流行。与传统的社交网络相比,基于地理位置的社交网络加入了“地点”这一关键维度,使得线上用户与线下地点之间、线上虚拟世界与线下真实物理世界之间产生了关联关系。在基于地理位置的社交网络中,用户会产生一类重要的数据:签到数据,它是用户在含有GPS的移动设备(如手机等)中记录下何时到达某个地点时所产生的一种数据。这类数据的重要性在于它同时含有用户活动的时间和空间方面的信息。签到数据被广泛地用于研究用户的活动行为、影响用户识别、社区发现等;但是,签到数据最为重要的应用还是它可以作为地点推荐的数据源。地点推荐,又叫做兴趣点推荐,顾名思义就是向用户推荐他们可能感兴趣的地点。地点推荐在电子商务中具有重要的作用,因为相关研究表明,地点推荐能够提高用户使用移动端服务的意愿,对被推荐地点起到广告营销的效果,从而提高对应地点商户和移动端APP运营公司的盈利。近年来,地点推荐研究受到了学术界的广泛关注,机器学习和推荐系统领域的相关专家们在IEEE、ACM和AAAI等相关的权威学术会议上对地点推荐问题的本质、理论、建模进行了深入地探索和研究,提出了一系列基于签到数据的地点推荐的相关方法。在基于签到数据的地点推荐中,协同过滤是最为常用的一类技术。协同过滤方法以用户-地点签到矩阵为基础,主要包括三个步骤:①相似度计算:根据相关的签到矩阵计算用户(或地点)之间的相似度;②近邻选择:选择与用户(或地点)最相似的K个用户(或地点);③签到数预测:根据已知的签到数,以及用户(或地点)之间的相似度,计算用户对未知地点的签到数。最后,选择签到数最高的N个地点作为推荐结果。以上三个步骤中,相似度的计算最为关键;在进行地点推荐时,计算用户(或地点)之间的相似度必须要考虑用户签到行为的空间和时间效应:空间效应,相关研究表明,用户的移动轨迹在空间上总是集中于几个区域,我们将其称之为用户的“活跃区域”,用户都倾向于在其活跃区域,或距离其活跃区域不远的区域活动。时间效应,时间效应主要表现在三个方面:①周期性,用户的签到行为出一定的周期规律,周期有一天或一周等;②连续性,在相近的时间内,用户的签到偏好是相似的,例如早上6、7、8点,都可能出现在餐厅附近。③不一致性,不同时间段用户表现出不同的签到偏好,例如早、中、晚出现在餐厅附近,下午3、4点出现在咖啡厅附近。现有的地点推荐方法已经开始考虑空间和时间效应在用户签到行为中的重要作用。在空间效应方面,有三个代表性的模型:幂律分布模型、高斯分布模型和核密度估计模型,这三个模型都可以用来建模用户签到行为的空间特性。在时间效应方面,主要是在考虑用户签到行为的周期性的基础上,建模用户签到行为的连续性和不一致性,然后将其融合到矩阵分解等技术中产生推荐结果。现有的地点推荐技术很少同时融合空间和时间效应产生推荐结果,尽管有少量的融合技术,但也存在以下缺陷:(一)没有提供一个有机的融合机制将空间效应和时间效应融入到地点推荐技术中。(二)在空间效应方面,没有考虑用户的活跃区域和签到频率在地点推荐中的重要作用。(三)在时间效应方面,缺少一个通用的时间分割方法和解决时间分割所带来的稀疏性问题的机制。
技术实现思路
本专利技术实施例提供一种基于签到数据的地点推荐方法及装置,用以解决现有技术中的上述问题。本专利技术实施例提供一种基于签到数据的地点推荐方法,包括:采用多中心发现算法确定用户的活跃区域;根据确定的所述活跃区域计算被推荐地点和用户已签到地点之间在空间方面的相似度即地理接近度;对用户地点签到矩阵即UL矩阵按照时间段进行分割,得到用户-地点-时间矩阵即ULT矩阵,根据所述ULT矩阵计算地点之间在时间方面的相似度即时间感知的地点相似度;将所述地理接近度和所述时间感知的地点相似度进行融合,计算地点相似度,并根据所述地点相似度进行地点推荐。优选地,采用多中心发现算法确定用户的活跃区域具体包括:步骤1,对于某个用户,首先选择一个该用户签到次数最多的地点作为聚类的第一个中心;然后将与该中心距离小于d的所有地点纳入到同一个聚类中;如果聚类中地点的签到数占总签到数的比例大于θ,则确定该聚类为用户的一个活跃区域,步骤2,重复步骤1,直到聚类结束,确定用户的所有活跃区域。优选地,根据确定的所述活跃区域计算被推荐地点和用户已签到地点之间在空间方面的相似度即地理接近度具体包括:根据公式1计算用户在已签到地点lc的条件下访问地点lr的概率:Prob(lr|lc)=a×dist(lr,lc)b公式1;其中,dist(·,·)表示两个地点之间的距离,a、b为待调参数,根据经纬度计算地球上两点之间的距离采用Haversine公式即公式2计算:其中,R是地球的半径,和是地点l1和l2的纬度,λ1和λ2是地点l1和l2的经度;如果已签到地点lc属于用户的某个活跃区域,则记作r(lc),根据公式3计算地理接近度:其中,lr为被推荐地点,Prob(lr|lc)是用户在已签到地点lc的条件下访问地点lr的概率,表示活跃区域的签到数,CL表示总签到数;如果已签到地点lc不属于用户的任何活跃区域,根据公式4计算地理接近度:其中,Clc表示在地点lc的签到数。优选地,对用户地点签到矩阵即UL矩阵按照时间段进行分割,得到用户-地点-时间矩阵即ULT矩阵,根据所述ULT矩阵计算地点之间在时间方面的相似度即时间感知的地点相似度具体包括:根据公式5计算时间感知的地点相似度:其中,表示时间段t下,用户u在地点l的签到数,m为用户的总数。优选地,在根据公式5计算时间感知的地点相似度之前,所述方法进一步包括:根据公式6计算时间段ti和tj之间的差距:其中ti、tj为一天中的任选的两个时间点;根据公式7,针对地点计算时间段之间的相似度:根据公式8在考虑用户签到行为的周期性、连续性和不一致性的条件下计算时间相似度:其中,λ为待调参数,L表示所有地点的集合,时间段ti和tj之间的相似度为负指数形式;根据公式9计算稀疏ULT矩阵中需要被填补的未知元素:使用未知元素对ULT矩阵进行填补,并将未知元素带入到公式5进行计算。优选地,将所述地理接近度和所述时间感知的地点相似度进行融合,计算地点相似度具体包括:根据公式10计算地点相似度;Sim(li,lj)=α×Prox(li,lj)+(1-α)×SimT(li,lj)公式10;其中,Prox(li,lj)和SimT(li,lj)分别表示地理接近度和时间感知的地点相似度,α待调参数,0<α<1本文档来自技高网
...

【技术保护点】
1.一种基于签到数据的地点推荐方法,其特征在于,包括:/n采用多中心发现算法确定用户的活跃区域;/n根据确定的所述活跃区域计算被推荐地点和用户已签到地点之间在空间方面的相似度即地理接近度;/n对用户地点签到矩阵即UL矩阵按照时间段进行分割,得到用户-地点-时间矩阵即ULT矩阵,根据所述ULT矩阵计算地点之间在时间方面的相似度即时间感知的地点相似度;/n将所述地理接近度和所述时间感知的地点相似度进行融合,计算地点相似度,并根据所述地点相似度进行地点推荐。/n

【技术特征摘要】
1.一种基于签到数据的地点推荐方法,其特征在于,包括:
采用多中心发现算法确定用户的活跃区域;
根据确定的所述活跃区域计算被推荐地点和用户已签到地点之间在空间方面的相似度即地理接近度;
对用户地点签到矩阵即UL矩阵按照时间段进行分割,得到用户-地点-时间矩阵即ULT矩阵,根据所述ULT矩阵计算地点之间在时间方面的相似度即时间感知的地点相似度;
将所述地理接近度和所述时间感知的地点相似度进行融合,计算地点相似度,并根据所述地点相似度进行地点推荐。


2.如权利要求1所述的方法,其特征在于,采用多中心发现算法确定用户的活跃区域具体包括:
步骤1,对于某个用户,首先选择一个该用户签到次数最多的地点作为聚类的第一个中心;然后将与该中心距离小于d的所有地点纳入到同一个聚类中;如果聚类中地点的签到数占总签到数的比例大于θ,则确定该聚类为用户的一个活跃区域,
步骤2,重复步骤1,直到聚类结束,确定用户的所有活跃区域。


3.如权利要求1所述的方法,其特征在于,根据确定的所述活跃区域计算被推荐地点和用户已签到地点之间在空间方面的相似度即地理接近度具体包括:
根据公式1计算用户在已签到地点lc的条件下访问地点lr的概率:
Prob(lr|lc)=a×dist(lr,lc)b公式1;
其中,dist(·,·)表示两个地点之间的距离,a、b为待调参数,根据经纬度计算地球上两点之间的距离采用Haversine公式即公式2计算:



其中,R是地球的半径,和是地点l1和l2的纬度,λ1和λ2是地点l1和l2的经度;
如果已签到地点lc属于用户的某个活跃区域,则记作r(lc),根据公式3计算地理接近度:



其中,lr为被推荐地点,Prob(lr|lc)是用户在已签到地点lc的条件下访问地点lr的概率,表示活跃区域的签到数,CL表示总签到数;
如果已签到地点lc不属于用户的任何活跃区域,根据公式4计算地理接近度:



其中,C1c表示在地点lc的签到数。


4.如权利要求1所述的方法,其特征在于,对用户地点签到矩阵即UL矩阵按照时间段进行分割,得到用户-地点-时间矩阵即ULT矩阵,根据所述ULT矩...

【专利技术属性】
技术研发人员:张博程静段锐杨云祥郭静张雪莹
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1