基于手机信令的用户活动空间识别方法技术

技术编号:22333725 阅读:14 留言:0更新日期:2019-10-19 12:57
本发明专利技术公开了一种基于手机信令的用户活动空间识别方法,该识别方法通过采用时空聚类模型实现用户的活动点自动识别,建立了离散的停留点之间的关联性,提高了停留点分组的准确性;并且,通过建立用户的活动规律指标实现居住、工作和其它活动目的的识别提高了用户活动规律的真实性和准确性;此外,通过该识别方法对用户的活动规律进行识别进而实现用户的居住、工作和其它活动目的的识别,在提高了用户活动规律的真实性和准确性的同时还可有利于动态掌握用户的活动规律和活动目的降低居民出行调查成本,使得交通需求预测更为准确;还能有利于提升城市空间规划中居住用地、岗位用地、各类公服设施等规划布局建设的科学性。

User activity space identification method based on mobile signaling

【技术实现步骤摘要】
基于手机信令的用户活动空间识别方法
本专利技术涉及一种基于手机信令的用户活动空间识别方法。
技术介绍
现有技术在用户的职住地发现中主要基于手机信令的用户活动规律挖掘目前主要是根据固定的空间单元边界(如商圈、公园、居住小区)统计用户在该区域内多日累计活动频率、活动时长。目前常用的聚类算法是通过寻找密度相连对象的最大集合,在一定空间范围下找到密度相连的离散空间数据的最大集合实现数据的聚类分组。在现有用户活动规律挖掘技术中,只能针对固定时段和固定区域识别,并且受到划定监测区域大小和基站信号飘移的影响。利用传统的聚类模型算法进行用户的活动识别、分组时没有考虑到空间范围限制,识别的结果会出现空间的错误延伸,一些停留位置较远的活动会错误的识别为同一活动。
技术实现思路
本专利技术的目的是提供一种基于手机信令的用户活动空间识别方法,以解决现有目前的用户活动空间识别方法识别误差大的问题。为解决上述技术问题,本专利技术提供一种基于手机信令的用户活动空间识别方法,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的活动规律进行标记。进一步地,所述用户停留点Pj包括用户编号、停留点编号、停留点位置、停留点起止时间。进一步地,步骤S3具体包括以下步骤:S31:遍历留点关系模型中的停留点Pj和邻域集合{Pi},使邻域集合{Pi}按照其包含的停留点Pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点Aj,同时将活动点Aj位置标记为停留点Pj位置,并记录停留点Pj的邻域集合{Pi};S32:清除停留点关系模型中的包含停留点个数最多的邻域集合{Pi}中的所有停留点Pj;S33:重复步骤S31和S32,直至遍历完当前用户的所有核心对象,得到{Aj}组合即为活动点分组。进一步地,根据聚类分组结果建立用户活动的活动规律指标所采用的方法具体包括:遍历每位用户当月的所有的活动点Aj,计算每个活动点分组{Aj}中邻域集合{Pi}与全月每天的白天时段、夜间时段和全日时段的交集时长作为活动点Aj在当日的白天停留时长、夜间停留时长和全日停留时长;若停留时长大于等于预设预置阈值则对应的时段累加天数计数加1。进一步地,根据所述活动规律指标对用户的活动规律进行标记所采用的具体方法包括:若用户的某一活动点较该用户当月其它所有活动点全日停留时长最大且夜间停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则可标记该活动点为居住活动点;若用户的某一活动点较该用户当月其它所有活动点全日停留时长第二大且白天停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则标记该活动点为工作活动点。本专利技术的有益效果为:该识别方法通过采用时空聚类模型实现用户的活动点自动识别,建立了离散的停留点之间的关联性,提高了停留点分组的准确性;并且,通过建立用户的活动规律指标实现居住、工作和其它活动目的的识别提高了用户活动规律的真实性和准确性;此外,通过该识别方法对用户的活动规律进行识别进而实现用户的居住、工作和其它活动目的的识别,在提高了用户活动规律的真实性和准确性的同时还可有利于动态掌握用户的活动规律和活动目的降低居民出行调查成本,使得交通需求预测更为准确;还能有利于提升城市空间规划中居住用地、岗位用地、各类公服设施等规划布局建设的科学性。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本专利技术一个实施例的结构示意图;具体实施方式如图1所示的基于手机信令的用户活动空间识别方法,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;其中,所述用户停留点Pj包括用户编号、停留点编号、停留点位置、停留点起止时间。S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;其中,邻域集合{Pi}为以用户停留点Pj为圆心、半径为r范围内的其它停留点信息组合,半径r可具体设为500m。S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的活动规律进行标记。根据本申请的一个实施例,上述步骤S3具体包括以下步骤:S31:遍历留点关系模型中的停留点Pj和邻域集合{Pi},使邻域集合{Pi}按照其包含的停留点Pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点Aj,同时将活动点Aj位置标记为停留点Pj位置,并记录停留点Pj的邻域集合{Pi};S32:清除停留点关系模型中的包含停留点个数最多的邻域集合{Pi}中的所有停留点Pj;S33:重复步骤S31和S32,直至遍历完当前用户的所有核心对象,得到{Aj}组合即为活动点分组。根据聚类分组结果建立用户活动的活动规律指标所采用的方法具体包括:遍历每位用户当月的所有的活动点Aj,计算每个活动点分组{Aj}中邻域集合{Pi}与全月每天的白天时段、夜间时段和全日时段的交集时长作为活动点Aj在当日的白天停留时长(09:00-17:00)、夜间停留时长(20:00–06:00)和全日停留时长;若停留时长大于等于预设预置阈值则对应的时段累加天数计数加1。根据本申请的一个实施例,根据所述活动规律指标对用户的活动规律进行标记所采用的具体方法包括:若用户的某一活动点较该用户当月其它所有活动点全日停留时长最大且夜间停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则可判断该活动点为居住活动点;若用户的某一活动点较该用户当月其它所有活动点全日停留时长第二大且白天停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则判断该活动点为工作活动点。基于原始的手机信令在不同时间识别出的用户停留行为位置是离散的空间数据,即使用户的停留目的地、活动目的一致,它们的空间位置也并不重合无法进一步分析用户的活动规律和识别用户的出行目的。本申请通过对用户长时间累积的停留数据按照用户的活动目的进行分类,比如居住、工作、休闲娱乐地或办事等活动,掌握居民某类活动的频率、时长等规律;通过建立时空聚类模型,将用户在不同时间发生停留数据根据空间位置特征进行聚类分组,将符合规则的停留点组合成一个活动点,通过长时间跟踪训练,基于用户停留位置分布采用时空聚类算法实现每一类居民活动的聚类分组,并建立每类活动的出现频率和累积停留时长等活动规律指标,通过用户的活动规律进而实现用户的居住、工作和其它活动目的的识别。最后说明的是,以上实施例仅用以说明本专利技术的技术方案而非限制,尽管参照较佳实施例对本专利技术进行了详细说明,本领域的普通技术人员应当理解,可以对本专利技术的技术方案进行修改或者等同替换,本文档来自技高网...

【技术保护点】
1.一种基于手机信令的用户活动空间识别方法,其特征在于,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的活动规律进行标记。

【技术特征摘要】
1.一种基于手机信令的用户活动空间识别方法,其特征在于,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的活动规律进行标记。2.根据权利要求1所述的基于手机信令的用户活动空间识别方法,其特征在于,所述用户停留点Pj包括用户编号、停留点编号、停留点位置、停留点起止时间。3.根据权利要求1或2所述的基于手机信令的用户活动空间识别方法,其特征在于,步骤S3具体包括以下步骤:S31:遍历留点关系模型中的停留点Pj和邻域集合{Pi},使邻域集合{Pi}按照其包含的停留点Pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点Aj,同时将活动点Aj位置标记为停留点Pj位置,并记录停留点Pj的邻域集合{Pi};S32:清除停留点关系模型中的包含停留...

【专利技术属性】
技术研发人员:赵必成唐小勇高志刚张建嵩
申请(专利权)人:重庆市交通规划研究院
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1