一种基于手机数据的精细尺度城市人群数量预测方法技术

技术编号:17940402 阅读:155 留言:0更新日期:2018-05-15 20:39
本发明专利技术公开了一种基于手机数据的精细尺度城市人群数量预测方法,其整体步骤为:手机定位数据时空重构;空间搜索邻域设定;人工神经网络模型构建;空间单元人群数量预测;人群数量预测结果精度评估。本发明专利技术突破了现有技术中仅考虑单一空间单元人群数量时间相关性的局限性,以及对较长时期人群数量历史数据的依赖,实现了精细时空尺度下的城市人群数量近实时预测,该预测结果可为探索城市居民活动规律、优化公共资源配置、协助城市交通诱导、制定公共安全应急预案等提供科学依据。

A fine scale urban population prediction method based on mobile phone data

The invention discloses a fine scale urban population quantity prediction method based on mobile phone data. Its overall steps are: spatial and temporal reconstruction of mobile location data, space search neighborhood setting, artificial neural network model construction, space unit population prediction, and the accuracy evaluation of population number prediction results. The invention breaks through the limitation of the time dependence of the number of people in the single space unit and the dependence on the number of people in a long period of time, and realizes the near real-time prediction of the number of urban population in the fine space and time scale. The result can be used to explore the law of urban residents' activities and optimize the public capital. Scientific basis is provided for source allocation, assistance in urban traffic guidance, and formulation of public safety contingency plans.

【技术实现步骤摘要】
一种基于手机数据的精细尺度城市人群数量预测方法
本专利技术涉及一种预测方法,尤其涉及一种基于手机数据的精细尺度城市人群数量预测方法。
技术介绍
精细尺度下,城市中每个空间单元上的人群数量随时间的发展变化均可视为一个时间序列。因此,现有的精细尺度城市人群数量预测问题,大多基于时间序列分析方法,转化为单一空间单元人群数量时间序列的预测问题。现有的时间序列分析方法主要包括两类:参数模型和非参数模型:参数模型形式简单明确,该模型由一些参数表达,假设函数形式已给定,仅需估计其中未知参数。当模型参数假设成立时,预测精度较高;相对于参数模型,非参数模型更具灵活性,该模型不是事先假定函数形式,而是从历史数据中获取因变量与自变量之间的关系进而建立一个近似模型。总的来说,参数模型和非参数模型在精细尺度城市人群数量预测方面都具有一定的应用价值。然而,基于时间序列分析方法的城市人群数量预测研究存在两个方面的局限性:第一,现有基于时间序列分析方法的人群数量预测过程中仅考虑单一空间单元上的人群数量时间相关性,未考虑不同空间单元之间的人群数量空间相关性,限制了精细尺度城市人群数量预测方法的精度;第二,现有基于时间序列分析方法的人群数量预测过程中依赖于较长时期人群数量的历史数据,限制了精细尺度城市人群数量预测方法的响应速度。
技术实现思路
为了解决上述技术所存在的不足之处,本专利技术提供了一种基于手机数据的精细尺度城市人群数量预测方法。为了解决以上技术问题,本专利技术采用的技术方案是:一种基于手机数据的精细尺度城市人群数量预测方法,其整体步骤为:步骤一、手机定位数据时空重构;步骤二、空间搜索邻域设定;步骤三、人工神经网络模型构建;步骤四、空间单元人群数量预测;步骤五、人群数量预测结果精度评估。进一步地,步骤一中手机定位数据时空重构的具体方法为:以手机基站的平均空间距离为边长划分规则网格空间单元、以手机定位数据采样的平均时间间隔为时长划分等长时段,对手机定位数据进行时空重构,从而统计生成各时段内、各空间单元上的城市人群数量观测值,以及针对任意两个相邻时段、从前一时段到后一时段流入任一空间单元的人群空间分布特征。任一时段内,若某个手机用户的采样点多于一个,则选择停留时间最长的采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点有且仅有一个,则选择该采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点缺失,则选择上一时段该手机用户所在空间单元作为该用户在该时段所在空间单元。进一步地,步骤二中空间搜索邻域设定的具体方法为:基于步骤一所获得的从前一时段ti到后一时段ti+1流入任一空间单元gc的人群空间分布特征,以gc为中心、以gc的网格边框为初始空间搜索邻域,并对该空间搜索邻域不断进行向外等比扩张,直至由该空间搜索邻域内流入gc的人群数量累计百分比占所有流入gc人群数量的95%时,记录该空间搜索邻域范围的大小;依次扫描所有时段、所有空间单元,选取最大的范围,将其设定为空间搜索邻域,并由此设定该空间搜索范围以内的所有空间单元gm与中心空间单元gc之间具有时空相关性。进一步地,步骤三中人工神经网络模型构建的具体方法为:Ⅰ、采用公式一表示不同空间单元之间的时空相关性的函数关系:其中,表示中心空间单元gc在ti+1时段的人群数量预测值,表示空间单元gm在ti时段的人群数量观测值,gm为位于gc的空间搜索邻域内的所有空间单元;f表示和之间的函数关系;Ⅱ、将步骤Ⅰ中的输入数据代入人工神经网络中,进行网络模型的构建,具体为:将人工神经网络结构分为三层:第一层为输入层,输入数据为第二层为隐藏层,用于建立输入与输出之间的函数映射关系;第三层为输出层,输出数据为进一步地,步骤四中空间单元人群数量预测包括模型训练和模型预测两个阶段:模型训练阶段:基于步骤一生成的ti-1和ti时段内所有空间单元城市人群数量观测值,以及步骤三构建的人工神经网络模型,进行模型训练;模型预测阶段:基于已训练模型,以及步骤一生成的ti时段内所有空间单元城市人群数量观测值,进行模型预测,预测结果为ti+1时段内所有空间单元城市人群数量预测值。进一步地,步骤五中人群数量预测结果精度评估的具体方法为:基于步骤四生成的不同时段、不同空间单元的人群数量预测结果,采用统计方法,从时空分布、人口规模、多时间尺度的角度,进行模型预测精度分析。本专利技术突破了现有技术中仅考虑单一空间单元人群数量时间相关性的局限性,以及对较长时期人群数量历史数据的依赖,实现了精细时空尺度下的城市人群数量近实时预测,该预测结果可为探索城市居民活动规律、优化公共资源配置、协助城市交通诱导、制定公共安全应急预案等提供科学依据。附图说明图1为本专利技术的整体流程示意图。图2为步骤二中空间搜索邻域设定的效果展示图。图3为步骤三中人工神经网络模型的构建过程示意图。具体实施方式下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1所示的一种基于手机数据的精细尺度城市人群数量预测方法,其整体步骤如下:步骤一、手机定位数据时空重构:该步骤的目的是将该手机定位数据集合中所有手机用户的采样点离散化地分布至各时段及各空间单元。以手机基站的平均空间距离为边长划分规则网格空间单元、以手机定位数据采样的平均时间间隔为时长划分等长时段,对手机定位数据进行时空重构。具体地,任一时段内,若某个手机用户的采样点多于一个,则选择停留时间最长的采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点有且仅有一个,则选择该采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点缺失,则选择上一时段该手机用户所在空间单元作为该用户在该时段所在空间单元。基于本步骤,可统计生成各时段内、各空间单元上的城市人群数量观测值,以及针对任意两个相邻时段、从前一时段到后一时段流入任一空间单元的人群空间分布特征。步骤二、空间搜索邻域设定;该步骤的目的是为步骤三中的输入数据设定一个空间搜索邻域。基于步骤一所获得的从前一时段ti到后一时段ti+1流入任一空间单元gc的人群空间分布特征,以gc为中心、以gc的网格边框为初始空间搜索邻域,并对该空间搜索邻域不断进行向外等比扩张,直至由该空间搜索邻域内流入gc的人群数量累计百分比占所有流入gc人群数量的95%时,记录该空间搜索邻域范围的大小,如图2所示。依次扫描所有时段、所有空间单元,选取最大的范围,将其设定为空间搜索邻域,并由此设定该空间搜索范围以内的所有空间单元gm与中心空间单元gc之间具有时空相关性。步骤三、人工神经网络模型构建;该步骤的目的是通过构建一个人工神经网络模型,以建立不同空间单元之间的时间、空间相关性。首先,采用公式一表示不同空间单元之间的时空相关性的函数关系,该函数的目的在于采用周围空间单元gm在上一时刻ti的人群数量观测值去推断中心空间单元gc在下一时段ti+1的人群数量预测值,该分析方法综合了人群数量在空间、以及时间上的相关性,从而可以显著提高精细尺度城市人群数量预测精度;该结果预测是通过输入到人工神经网络中进行机器学习实现的;其中,表示中心空间单元gc在ti+1时段的人群数量预测值,表示空间单元gm在ti时段的人群数量观测值,f表示和之间的函数关系;gm为位于g本文档来自技高网...
一种基于手机数据的精细尺度城市人群数量预测方法

【技术保护点】
一种基于手机数据的精细尺度城市人群数量预测方法,其特征在于:所述方法的整体步骤为:步骤一、手机定位数据时空重构;步骤二、空间搜索邻域设定;步骤三、人工神经网络模型构建;步骤四、空间单元人群数量预测;步骤五、人群数量预测结果精度评估。

【技术特征摘要】
1.一种基于手机数据的精细尺度城市人群数量预测方法,其特征在于:所述方法的整体步骤为:步骤一、手机定位数据时空重构;步骤二、空间搜索邻域设定;步骤三、人工神经网络模型构建;步骤四、空间单元人群数量预测;步骤五、人群数量预测结果精度评估。2.根据权利要求1所述的基于手机数据的精细尺度城市人群数量预测方法,其特征在于:所述步骤一中手机定位数据时空重构的具体方法为:以手机基站的平均空间距离为边长划分规则网格空间单元、以手机定位数据采样的平均时间间隔为时长划分等长时段,对手机定位数据进行时空重构,从而统计生成各时段内、各空间单元上的城市人群数量观测值,以及针对任意两个相邻时段、从前一时段到后一时段流入任一空间单元的人群空间分布特征。3.根据权利要求2所述的基于手机数据的精细尺度城市人群数量预测方法,其特征在于:任一时段内,若某个手机用户的采样点多于一个,则选择停留时间最长的采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点有且仅有一个,则选择该采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点缺失,则选择上一时段该手机用户所在空间单元作为该用户在该时段所在空间单元。4.根据权利要求2或3所述的基于手机数据的精细尺度城市人群数量预测方法,其特征在于:所述步骤二中空间搜索邻域设定的具体方法为:基于步骤一所获得的从前一时段ti到后一时段ti+1流入任一空间单元gc的人群空间分布特征,以gc为中心、以gc的网格边框为初始空间搜索邻域,并对该空间搜索邻域不断进行向外等比扩张,直至由该空间搜索邻域内流入gc的人群数量累计百分比占所有流入gc人群数量的95%时,记录该空间搜索邻域范...

【专利技术属性】
技术研发人员:陈洁裴韬陆锋李明晓程诗奋
申请(专利权)人:中国科学院地理科学与资源研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1