当前位置: 首页 > 专利查询>浙江大学专利>正文

基于移动轨迹中停留点的用户群体行为规律检测方法技术

技术编号:14468366 阅读:66 留言:0更新日期:2017-01-20 23:43
本发明专利技术公开了一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法首先接收来自数据采集器的多用户轨迹数据;其次从轨迹数据中提取停留地点序列,并将其变换为代表用户日程行为的地点偏好向量;然后提取日程行为向量,并利用加权平均法计算日程行为模式向量;最后基于日程行为模式计算用户间相似度,采用Kmeans聚类算法检测用户群体的行为规律模式。本发明专利技术采用基于停留点的日程行为模式计算用户间相似度,解决了用户停留区域不重叠的问题,可有效检测到用户群体的行为规律模式。

【技术实现步骤摘要】

本专利技术涉及一种用户群体行为规律检测方法,更具体地说,涉及一种基于移动轨迹中停留点的用户群体行为规律检测方法
技术介绍
近年来,利用轨迹数据挖掘用户行为规律受到了越来越多的关注。长期的行为规律反映了用户的生活习惯,是一种高层次的上下文信息,可帮助位置感知应用更好地适应其用户的需求。例如,推荐系统可根据用户行为规律向其推荐朋友、地点或其它位置相关信息。信息推送系统可向具有相似生活规律的用户推送和分享相关信息。基于加速度传感器等检测的用户短期行为(如吃饭、散步等),无法反映其长期的行为规律和生活习惯;基于相似访问地点序列计算用户行为相似度的方法,由于依赖于不同用户停留区域的交叠,无法对无访问交叠的用户(如生活在不同城市的用户)相似度进行度量;基于反向地理编码技术将用户的物理轨迹转化为语义轨迹,然后从语义轨迹中提取出序列模式,基于最长语义轨迹模式度量用户行为相似度的方法,虽然解除了对用户访问区域交叠的限制,但其局限于对用户短期运动行为的分析,并且用户访问地点的个性化语义(如家、工作地点等)无法通过反向地理编码得到;而且用户行为具有多样性和复杂性,单靠数据很难把握其趋势和规律性。因此,关于利用轨迹数据有效挖掘及展示用户行为,计算用户行为相似度进而检测用户群体行为规律的技术有待深入研究与探讨。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于移动轨迹中停留点的用户群体行为规律检测方法,本专利技术能够有效地度量用户行为相似度,检测用户行为规律。本专利技术的目的是通过以下技术方案来实现的:一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法包括以下内容:步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过一定阈值,则该区域视为一个停留地点;步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i分别表示停留时间超过5小时、3小时、1小时、0小时的停留点个数;步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i表示用户平均每天各个停留时间段的停留点的个数;步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。本专利技术所述的基于移动轨迹中停留点的用户群体行为规律检测方法,可挖掘用户的长期行为规律,度量无区域交叠的用户行为相似度。与现有技术相比,本专利技术具有如下技术效果:1、由于用户每天大部分时间在某些地点停留,所以本专利技术从停留地点的角度表示用户行为,可以挖掘用户长期行为规律和生活习惯,具有更强的实际应用价值;2、本专利技术不基于停留地点的地理空间特征度量用户相似度,因此可以度量无停留区域交叠的用户间行为的相似度,进而检测用户群体行为规律,适用范围广;3、本专利技术不涉及反向地理编码技术将用户的地理轨迹转化为语义轨迹,可以解决停留地点的个性化语义(如家、工作地点等)无法得到的问题,检测的准确率更高;附图说明图1是停留地点检测流程图;图2是用户群体行为规律检测流程图;图3是表示用户群体行为规律的折线图。图4是表示用户群体行为规律的折线图。图5是表示用户群体行为规律的折线图。图6是表示用户群体行为规律的折线图。具体实施方式以下结合附图对本专利技术作进一步详细说明。如图2所示,本专利技术给出了一种基于移动轨迹中停留点的用户群体行为规律检测方法,本专利技术所述的检测方法,包括以下步骤:步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,如图1所示,其中Ts为时间阈值,Ds为距离阈值,i,j为定位点编号,N为轨迹点个数。当用户在某个区域内停留时间超过一定阈值时,则该区域视为一个停留地点。首先给定时间阈值为Ts,空间阈值为Ds,i从第一个定位点开始,计算下一个定位点j与i之间的距离,若小于空间阈值Ds,则j转移到下一个定位点,否则计算j与i之间的时间间隔,若小于时间阈值Ts,则i转移到第i+1个定位点开始新一轮的检测,否则检测到一个停留点,该停留点的位置为i~j之间的点的中心位置,并且i转移到定位点j开始新一轮的检测,直到i为最后一个定位点。这样就将轨迹数据转化为停留点序列;步骤3,由于一般用户每天大部分时间在某些地点停留,其某一天的行为可被看作是不同时间段在不同地点的停留,因此将一天划分为24个小时,将用户每天的停留地点序列转换为地点偏好向量该向量代表用户k一天的日程行为,向量中的元素v1t表示用户k在t时刻的停留地点标号;步骤4,由于用户一天的行为可抽象化为在多少个地点停留以及各个地点的停留时间长短,因此对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间,并计算得到日程行为向量向量中的元素a1i分别表示用户k一天内停留时间超过5小时、3小时、1小时、0小时的停留地点个数;步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量。由于用户长期的行为规律可看作用户每天行为的平均,因此对得到的日程行为向量采用加权平均法计算日程行为模式向量向量中元素r1×i表示用户k平均每天各个停留时间段的停留点的个数;步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,以日程行为模式向量表示每个用户的长期行为规律;步骤7,以得到的日程行为模式向量为特征,利用欧式距离计算两两用户间行为相似性,向量Rm、Rn分别表示用户m、n的日程行为模式向量,并采用Kmeans算法对用户进行聚类,得到用户的行为规律模式。本专利技术所述检测方法采取的技术方案是:对接收到的多个用户的轨迹数据进行停留点检测,然后针对每个用户,将停留点序列变换为地点偏好向量,并提取日程行为向量,采用加权平均的方法得到日程行为模式向量,最后使用Kmeans聚类算法检测用户群体的行为规律。本专利技术中停留点检测方法的时间阈值和空间阈值可根据轨迹数据类型与实际应用需求进行设置,因此可适应不同的应用场景。本专利技术的效果可以通过以下实际的实验来验证:本专利技术收集了某市区211辆电动自行车5个星期的轨迹数据,数据包含电动车编号ID、时间timestamp、经度longitude、纬度latitude。图3-6展示了表示用户群体行为规律模式的折线图。图中横坐标表示停留时间长短,纵坐标表示停留点个数。从图中可看出,实验中的211个用户的行为规律可分为四类,各类间差异性大而同一类内差异性小。图3表示的用户群体,其行为规律为一天中停留点个数较多,而且停留时间差异较大;图4表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为2个,其余停留时间范围内的停留点个数很少,该类用户可推断为有固定工作地的上班族;图5表示的用户本文档来自技高网...

【技术保护点】
一种基于移动轨迹中停留点的用户群体行为规律检测方法,其特征在于,该方法可以包括以下步骤:步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过阈值,则该区域视为一个停留地点;步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i(i=1,2,3,4)分别表示停留时间超过5小时、3小时、1小时、0小时的停留点个数;步骤5,对用户每天的停留点序列重复步骤3‑4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i(i=1,2,3,4)表示用户平均每天停留时间超过5小时、3小时、1小时、0小时的停留点的个数;步骤6,对所有用户的轨迹数据重复步骤2‑5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。...

【技术特征摘要】
1.一种基于移动轨迹中停留点的用户群体行为规律检测方法,其特征在于,该方法可以包括以下步骤:步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过阈值,则该区域视为一个停留地点;步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,...

【专利技术属性】
技术研发人员:贾晓霞程鹏陈积明
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1