基于签到时间间隔模式的连续兴趣点推荐方法技术

技术编号:20622689 阅读:29 留言:0更新日期:2019-03-20 14:28
本发明专利技术涉及一种基于签到时间间隔模式的连续兴趣点推荐方法,属于推荐系统领域;根据每个用户的签到数据,综合个性化偏好、地理距离偏好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合偏好,采用三阶张量模型来对连续签到行为进行建模;并构建一个概率模型,通过将签到时间间隔偏好视为潜在变量,来学习用户对兴趣点的综合偏好程度;在参数学习阶段,设计了期望最大化算法来优化概率模型的参数,最终实现了为用户推荐接下来要访问的兴趣点的任务;张量及矩阵中信息缺失的补充,采用张量/矩阵分解算法实现。对比现有技术,本发明专利技术方法有效解决了用户‑兴趣点签到矩阵的稀疏性问题,为用户提供准确高效的连续兴趣点推荐服务。

A Continuous Interest Point Recommendation Method Based on Check-in Interval Mode

The present invention relates to a continuous interest point recommendation method based on check-in time interval pattern, which belongs to the field of recommendation system. According to the check-in data of each user, the user's personalized preference, geographic distance preference and check-in time interval preference are combined to form the user's comprehensive preference for the next interest point to visit, and the third-order tensor model is used to carry out the continuous check-in behavior. Modeling; Constructing a probabilistic model to learn the comprehensive preference degree of users for interest points by considering the check-in time interval preference as a potential variable; Designing an expectation maximization algorithm to optimize the parameters of the probabilistic model in the parameter learning stage, and finally realizing the task of recommending the next interest points to users; Supplementing the missing information in tensors and matrices. It is implemented by tensor/matrix decomposition algorithm. Compared with the existing technology, the method of the invention effectively solves the sparse problem of the user's interest point check-in matrix, and provides an accurate and efficient continuous interest point recommendation service for users.

【技术实现步骤摘要】
基于签到时间间隔模式的连续兴趣点推荐方法
本专利技术涉及一种连续兴趣点推荐方法,具体涉及一种基于签到时间间隔模式的连续兴趣点推荐方法,属于推荐系统领域。
技术介绍
近年来,基于位置的社交网络(Location-basedSocialNetworks,LBSNs),如Foursquare、Gowalla、GeoLife等,得到了快速的发展,使得用户可以在线分享他们的签到体验。兴趣点推荐变得更加重要和实用,其不仅可以帮助用户发现喜爱的兴趣点,而且有利于企业获得更多的目标客户。目前,已经有很多研究机构开展了对兴趣点推荐任务的研究。然而,由于每个用户的签到数据是高度稀疏的,实现准确的兴趣点推荐任务是具有挑战性的。当前的研究工作将所有签到数据作为一个整体来考虑,用户签到行为的序列性信息通常被忽视。用户签到行为的序列性对于兴趣点推荐是至关重要的,因为人们的移动方式往往呈现出序列性的模式,在构建兴趣点推荐模型的时候应该根据用户的当前位置进行推荐。因此,很多研究人员开展了对连续兴趣点推荐任务的研究。本专利技术的连续兴趣点推荐旨在预测用户接下来要访问的兴趣点,当前的研究工作通过融合位置社交网络中的各种情景信息,特别是时间效应,来建模用户对兴趣点的偏好。目前,存在很多工作研究了时间效应对连续兴趣点推荐产生的影响。一种方法是简单地探索人类移动模式的时间周期性,其依据的是人们往往在同一时间段周期性访问某些类型的兴趣点,例如早晨上班去办公室,晚上下班回家。另一种方法是考虑连续签到的时间属性,并利用个性化马尔科夫链分解模型和个性化排序度量嵌入算法来实现连续兴趣点推荐。特别地,最近的研究工作建模了用户随着时间推移的兴趣偏好,并在特定时间段内进行兴趣点推荐,该方法可以通过枚举所有可能的时间间隔来估计用户签到的具体时间。此外,当前的研究工作主要利用签到的时间戳(绝对时间),例如星期一上午或星期六晚上9点,来提升推荐系统的系统。然而,这种将用户行为模式统一建模的方式,隐含地假设了所有的签到行为都遵循相同的模式。事实上,不同职业的用户有着不同的办公时间,其相应的行为模式也是不同的,但是当前的研究工作并没有考虑到用户行为模式的多样性。因此,连续签到之间的时间间隔反映出了,人们在时间上的行为模式有着更多的灵活性,而且用户的签到行为存在着多个签到时间间隔模式,这种签到时间间隔模式对连续兴趣点推荐有着重要影响。
技术实现思路
本专利技术的目的在于提供一种基于签到时间间隔模式的连续兴趣点推荐方法,该方法通过建模用户在签到时间间隔模式影响下的行为模式,并计算用户在兴趣点之间的转移概率,根据转移概率为用户推荐接下来要访问的兴趣点集合,向用户提供准确高效的连续兴趣点推荐服务。本专利技术的思想是根据每个用户的签到数据,综合个性化偏好、地理距离偏好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合偏好,设计过程中采用三阶张量模型来对连续签到行为进行建模。并构建一个概率模型,通过将签到时间间隔偏好视为潜在变量,来学习用户对兴趣点的综合偏好程度。在参数学习阶段,我们设计了期望最大化算法(ExpectationMaximization,EM)来优化概率模型的参数,最终实现了为用户推荐接下来要访问的兴趣点的任务。张量及矩阵中信息缺失的补充,通常采用张量/矩阵分解算法实现。本专利技术的目的是通过以下技术方案实现的:一种基于签到时间间隔模式的连续兴趣点推荐方法,包括以下步骤:每一个用户的原始数据如下所示:其中,每行代表一个用户,i=1,2,…,n,共n个用户;每列代表一个时间点,t=1,2,…,T,T为总时间,元素值lij为用户ui在时间点tj时所在的兴趣点;步骤一、计算用户转移频率矩阵根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq:其中,转移频率freqij的值按下述方式设置:在时间段T内若存在从兴趣点li转移到兴趣点lj的情况,其值为频率;若在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中,i,j=1,2,…,m,共m个兴趣点;步骤二、整合多个用户的地点转移数据为频率张量χ根据每个用户的频率矩阵Mfreq,将所有用户的频率矩阵组合起来,整合成转移频率张量χ,其由I,J,U三个维度构成,U表示用户维度;I表示当前兴趣点维度;J表示下一个兴趣点维度;如图1所示,其中,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量χ中的非零元素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的转移频率,k=1,2,…,n;步骤三、计算用户签到时间间隔矩阵根据每个用户在不同时间点所处的地点,计算出每个用户位于所有的兴趣点的签到时间间隔,得到该用户从兴趣点li转移到兴趣点lj的签到时间间隔,所有兴趣点的签到时间间隔组合起来构成用户签到时间间隔矩阵Mspan:其中,时间间隔Sij的值描述如下:在时间段T内若存在从兴趣点li转移到兴趣点lj的情况,则其值为平均时间间隔;在时间段T内若不存在从兴趣点li转移到兴趣点lj的情况,则其值为0;其中i,j=1,2,…,m,共m个兴趣点;步骤四、整合多个用户的签到时间间隔数据形成张量Z根据每个用户的签到时间间隔矩阵Mspan,将所有用户的签到时间间隔矩阵组合起来,整合成签到时间间隔张量Z,其由I,J,U三个维度构成,如图2所示,其中,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量Z中的非零元素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的签到时间间隔,k=1,2,…,n;步骤五、对用户个性化偏好进行建模1)获取缺失的用户个性化偏好:对转移频率张量χ使用成对交互张量分解(PairwiseInteractionTensorFactorization,PITF)算法进行分解,得到的分解向量,包括:表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量;表示用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;表示当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示用户-当前兴趣点关系矩阵中用户的潜在因素向量;表示用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量;u表示当前用户;i表示当前兴趣点;j表示下一个兴趣点;将分解得到的向量按照成对交互张量分解(PairwiseInteractionTensorFactorization,PITF)算法进行重组,从而得到包括缺失数据在内的所有用户在各个地点的个性化转移频率估计值2)获取缺失的地理距离偏好:地理距离偏好sp(di,j)表示用户在访问当前兴趣点i之后,接下来去访问相距di,j千米的兴趣点j的地理距离偏好,表示如下:其中,ρ为参数,其最优值将在步骤七确定;di,j表示从当前兴趣点i到下一兴趣点j的地理距离;为di,j的倒数;3)获取缺失的时间间隔偏好:对时间间隔张量Z使用PITF算法进行分解,得到的分解向量,包括:用户-下一个兴趣点关系矩阵中用户的潜在因素向量;用户-下本文档来自技高网
...

【技术保护点】
1.一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:包括以下步骤:步骤一、计算用户转移频率矩阵根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq:

【技术特征摘要】
1.一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:包括以下步骤:步骤一、计算用户转移频率矩阵根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq:其中,转移频率freqij的值按下述方式设置:在时间段T内存在从兴趣点li转移到兴趣点lj的情况,其值为频率;在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中,i,j=1,2,…,m,共m个兴趣点;步骤二、整合多个用户的地点转移数据为频率张量χ根据每个用户的频率矩阵Mfreq,将所有用户的频率矩阵组合起来,整合成转移频率张量χ,其由I,J,U三个维度构成,U表示用户维度;I表示当前兴趣点维度;J表示下一个兴趣点维度;I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量χ中的非零元素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的转移频率,k=1,2,…,n;步骤三、计算用户签到时间间隔矩阵根据每个用户在不同时间点所处的地点,计算出每个用户位于所有的兴趣点的签到时间间隔,得到该用户从兴趣点li转移到兴趣点lj的签到时间间隔,所有兴趣点的签到时间间隔组合起来构成矩阵Mspan:其中,时间间隔Sij的值描述如下:在时间段T内存在从兴趣点li转移到兴趣点lj的情况,其值为平均时间间隔;在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中i,j=1,2,…,m,共m个兴趣点;步骤四、整合多个用户的签到时间间隔数据形成张量Z根据每个用户的签到时间间隔矩阵Mspan,将所有用户的签到时间间隔矩阵组合起来,整合成签到时间间隔张量Z,其由I,J,U三个维度构成,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量Z中的非零元素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的签到时间间隔,k=1,2,…,n;步骤五、对用户个性化偏好进行建模1)获取缺失的用户个性化偏好:对转移频率张量χ使用成对交互张量分解PITF算法进行分解,得到的分解向量,包括:表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量;表示用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;表示当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示用户-当前兴趣点关系矩阵中用户的潜在因素向量;表示用户-当前兴趣点关...

【专利技术属性】
技术研发人员:礼欣江明明石雨
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1