System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于监督学习的城市短期访客识别方法、装置及存储介质制造方法及图纸_技高网
当前位置: 首页 > 专利查询>同济大学专利>正文

基于监督学习的城市短期访客识别方法、装置及存储介质制造方法及图纸

技术编号:41123826 阅读:7 留言:0更新日期:2024-04-30 17:50
本发明专利技术涉及手机信令大数据挖掘技术领域,尤其是涉及一种基于监督学习的城市短期访客识别方法、装置及存储介质。获取用户手机信令数据集后,从中提取用户驻留特征数据,将该用户驻留特征数据输入训练好的监督学习模型,获取访客识别结果,用户手机信令数据集包括训练数据集,监督学习模型利用访客标记和从训练数据集中提取的用户驻留特征数据完成训练,访客标记通过训练数据集获取。与现有技术相比,本发明专利技术具有在大范围对手机信令数据应用监督学习实现访客识别,提高识别效率的同时保证精确性,可解释性更强等优点。

【技术实现步骤摘要】

本专利技术涉及手机信令大数据挖掘,尤其是涉及一种基于监督学习的城市短期访客识别方法、装置及存储介质


技术介绍

1、人口流动对人口格局、城市发展产生深远影响。在常住居民之外,短期停留的外来人口同样使用城市公共服务和资源。这些因经济交流、旅游、医疗等活动带来的短期人口流动对城市公共服务设施配置、基础设施建设、土地开发等带来越来越大的挑战,这一点在理论研究和规划实践中都成为共识。

2、在传统的交通和旅游规划中,通常采用抽样问卷调查方式获取访客出行信息,这种方法费时、费工,并且能获取的样本数量有限。手机信令数据由于其采集成本低、样本量大、覆盖范围广的特点,通过借助基站定位,可以快速方便获取大量居民出行有关的信息。手机信令数据如今在出行需求分析以及交通模型补充等方面有了大量的理论研究与实际应用,其为访客识别和活动研究提供了最全面、详细的信息,其时空精度高于传统的交通和旅游行业统计数据。

3、现有的基于手机信令的访客识别技术主要包括:基于简单规则的识别和基于无监督学习的识别方法。前者基于简单规则的识别方法依赖于明确清晰的访客人群定义,利用敏感性分析确定指标阈值,有时会为了明确的人群分类而给出较为复杂的规则。后者基于非监督学习的访客识别是通过选择合适的特征,利用聚类等方法对人群进行划分,按照人群的出行特点对聚类结果进行解释,但这类方法存在的主要问题是聚类参数的选择会对人群的划分和聚类结果的可解释性带来影响,同时还会存在一些无法解释的人群类别。

4、监督学习的方法近年来也被用于这类真实标签未知条件下的人群识别,主要实现方法是基于小数据集对人群进行标注,利用一些监督学习方法开展训练。当前监督学习的方法难以在单个城市的手机信令数据上应用,主要在于缺少访客的标注作为训练输入。因此,如何有效实现大范围信令数据的访客识别,提高识别精确性,成为本领域需要解决的问题。


技术实现思路

1、本专利技术的目的就是为了克服上述现有技术存在的识别规则复杂、难以在大范围区域中的手机信令数据上应用监督学习实现访客识别的缺陷而提供一种基于监督学习的城市短期访客识别方法、装置及存储介质。

2、本专利技术的目的可以通过以下技术方案来实现:

3、根据本专利技术的第一方面,提供一种基于监督学习的城市短期访客识别方法,包括以下步骤:

4、数据获取步骤,获取用户手机信令数据集,并从中提取用户驻留特征数据;

5、访客识别步骤,基于所述用户驻留特征数据,利用训练好的监督学习模型获取访客识别结果;

6、其中,所述用户手机信令数据集包括训练数据集,所述监督学习模型利用访客标记作为因变量、从训练数据集中提取的用户驻留特征数据作为自变量完成训练,所述访客标记通过所述训练数据集获取。

7、作为优选的技术方案,所述访客标记的获取过程包括:

8、基于所述训练数据集,匹配坐标,并筛选有效数据;

9、基于所述有效数据,提取所述训练数据集中所有用户的居住地和工作地;

10、判断每个用户的居住地和工作地是否为特征城市:若为是,则不做标记;若为否,则将相应用户标记为访客,所述特征城市为预先设置的。

11、作为优选的技术方案,所述用户驻留特征数据包括每个用户的停留总天数、最长连续停留天数、活动分段数、工作日停留天数、日均活动时长和活动次数。

12、作为优选的技术方案,所述停留总天数为观测时间段内,用户在特征城市内有信令的总天数,所述特征城市为预先设置的。

13、作为优选的技术方案,所述最长连续停留天数为观测时间段内,用户在特征城市内连续出现信令数据的最长天数,所述特征城市为预先设置的。

14、作为优选的技术方案,所述活动分段数为观测时间段内,用户在特征城市内连续活动的次数,所述特征城市为预先设置的。

15、作为优选的技术方案,所述工作日停留天数为观测时间段内,用户在特征城市内且在工作日内出现信令数据的天数,所述特征城市为预先设置的。

16、作为优选的技术方案,所述日均活动时长和活动次数为观测时间段内,用户在特征城市内每日活动的时长和次数平均值,所述特征城市为预先设置的。

17、根据本专利技术的第二方面,提供一种基于监督学习的城市短期访客识别装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现所述的方法。

18、根据本专利技术的第三方面,提供一种存储介质,其上存储有程序,所述程序被执行时实现所述的方法。

19、与现有技术相比,本专利技术具有以下有益效果:

20、1、本专利技术中获取的用户手机信令数据集大小不受限制,用于构建和训练监督学习模型的训练数据集是其一部分,也即,通过获取更大范围的信令数据,可以对访客进行更准确的标注,利用访客标记构建并训练监督学习模型,进而预测访客识别结果,与无监督学习方法模型相比,可解释性更强,与现有的过于明确、复杂的访客识别规则相比,识别规则更简单明了,提高识别效率的同时保证精确性;

21、2、本专利技术通过借助用户的居住地对访客进行标记,训练得到的监督学习模型可以拓展至同城市乃至同类型城市,具有较好的拓展性,可拓展至其他数据集,得到的访客群体可用于分析其活动模式、出行需求等,对于面向实际服务人口的城市交通资源配置和旅游产品设计等有很高的应用价值。

本文档来自技高网...

【技术保护点】

1.一种基于监督学习的城市短期访客识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于监督学习的城市短期访客识别方法,其特征在于,所述访客标记的获取过程包括:

3.根据权利要求1所述的基于监督学习的城市短期访客识别方法,其特征在于,所述用户驻留特征数据包括每个用户的停留总天数、最长连续停留天数、活动分段数、工作日停留天数、日均活动时长和活动次数。

4.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述停留总天数为观测时间段内,用户在特征城市内有信令的总天数,所述特征城市为预先设置的。

5.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述最长连续停留天数为观测时间段内,用户在特征城市内连续出现信令数据的最长天数,所述特征城市为预先设置的。

6.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述活动分段数为观测时间段内,用户在特征城市内连续活动的次数,所述特征城市为预先设置的。

7.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述工作日停留天数为观测时间段内,用户在特征城市内且在工作日内出现信令数据的天数,所述特征城市为预先设置的。

8.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述日均活动时长和活动次数为观测时间段内,用户在特征城市内每日活动的时长和次数平均值,所述特征城市为预先设置的。

9.一种基于监督学习的城市短期访客识别装置,包括存储器、处理器,以及存储于所述存储器中的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的方法。

10.一种存储介质,其上存储有程序,其特征在于,所述程序被执行时实现如权利要求1-8中任一所述的方法。

...

【技术特征摘要】

1.一种基于监督学习的城市短期访客识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于监督学习的城市短期访客识别方法,其特征在于,所述访客标记的获取过程包括:

3.根据权利要求1所述的基于监督学习的城市短期访客识别方法,其特征在于,所述用户驻留特征数据包括每个用户的停留总天数、最长连续停留天数、活动分段数、工作日停留天数、日均活动时长和活动次数。

4.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述停留总天数为观测时间段内,用户在特征城市内有信令的总天数,所述特征城市为预先设置的。

5.根据权利要求3所述的基于监督学习的城市短期访客识别方法,其特征在于,所述最长连续停留天数为观测时间段内,用户在特征城市内连续出现信令数据的最长天数,所述特征城市为预先设置的。

6.根据权利要求3所述的基于监督学习的城市...

【专利技术属性】
技术研发人员:李振铭段征宇
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1