一种基于时间序列分析的城市迁移指数分析预测方法技术

技术编号:38686332 阅读:14 留言:0更新日期:2023-09-02 22:59
本发明专利技术公开了一种基于时间序列分析的城市迁移指数分析预测方法,属于动态人员人口迁移行为预测技术领域;包括:步骤S1,基于人口迁移数据库动态更新城市经济水平信息数据,并分为训练数据和测试数据,作为初始数据;步骤S2,对初始数据进行数据预处理得到不同维度的数据,并得到迁入数据和迁出数据,计算得到迁移指数;步骤S3,进行特征提取获得不同维度的特征数据;步骤S4,筛选可用维度;步骤S5,基于残差序列进行平稳性检验,选定模型并进行拟合,得到时间序列模型;步骤S6,对时间序列模型进行预测估计,得到预测迁移指数。上述技术方案的有益效果是:本发明专利技术建立了日常城市数据移入、移出机制,能动态管理人口迁入、迁出信息。迁出信息。迁出信息。

【技术实现步骤摘要】
一种基于时间序列分析的城市迁移指数分析预测方法


[0001]本专利技术涉及动态人员人口迁移行为预测
,尤其涉及一种基于时间序列分析的城市迁移指数分析预测方法。

技术介绍

[0002]城市人口迁移指数是一种衡量城市人口迁移规模和趋势的指标,研究城市人口迁移指数的背景可以追溯到人类社会城市化的历史,随着人口增长和城市化进程的加速,城市人口迁移已经成为一个重要的社会现象,影响着城市的经济、社会和环境发展。
[0003]现有技术中,掌握实有人口基础信息、快递、铁路、航运、旅店、上海市统计局相关数据,需要一种基于时间序列分析,预测城市人口迁移指数的方法和模型,解决大城市面临的动态人员人口迁移行为预测的问题。

技术实现思路

[0004]本专利技术的目的在于,提供一种基于时间序列分析的城市迁移指数分析预测方法,解决以上技术问题;
[0005]一种基于时间序列分析的城市迁移指数分析预测方法,包括:
[0006]步骤S1,基于人口迁移数据库动态更新城市经济水平信息数据,将所述城市经济水平信息数据分为训练数据和测试数据,并作为初始数据;
[0007]步骤S2,对所述初始数据进行数据预处理得到不同维度的数据,并基于所述不同维度的数据得到迁入数据和迁出数据,基于所述迁入数据和迁出数据计算得到迁移指数;
[0008]步骤S3,对所述不同维度的数据进行特征提取,获得不同维度的特征数据;
[0009]步骤S4,基于所述特征数据的维度与所述迁移指数的相关性筛选可用维度;
[0010]步骤S5,通过残差序列方法进行平稳性检验,选定模型并进行拟合,得到时间序列模型;
[0011]步骤S6,对所述时间序列模型进行预测估计,得到预测迁移指数。
[0012]优选地,步骤S1中所述城市经济水平信息数据包括:就业数据、房屋租赁/房价数据、城市治安数据、生活成本数据。
[0013]优选地,所述就业数据包括新增就业岗位、全市就业人数、职工基本养老保险参保人数、求职人数、海内及海外的人才引进人数;
[0014]所述房屋租赁/房价数据包括全市住房租赁价格、新建商品住宅价格、二手住宅销售价格;
[0015]所述生活成本数据包括人均可支配收入,人均消费支出,居民消费价格指数。
[0016]优选地,步骤S2包括:
[0017]步骤S21,对所述初始数据进行校验处理,所述校验处理包括数据总量,非空数据量;
[0018]步骤S22,对校验后的数据进行异常数据剔除,得到剔除后的数据;
[0019]步骤S23,将剔除后的数据汇总到所有维度,通过所述迁入数据和迁出数据来计算所述迁移指数,计算式为:
[0020]迁移数据=(迁入人数

迁出人数)/总人数
[0021]优选地,步骤S4中通过计算所述特征数据的维度的各个维度值与指数的皮尔逊系数、卡方值和维度间的皮尔逊系数来筛选可用维度。
[0022]优选地,步骤S5包括:
[0023]步骤S51,模型特征根的倒数的模小于1,符合平稳性要求,再运用BG检验对所述残差序列的自相关性进行检验,判定所述残差序列存在自相关性;
[0024]步骤S52,通过计算得到所述模型的T统计量、F统计量伴随概率P值都大于5%,判定所述残差序列是平稳序列;
[0025]步骤S53,基于赤池信息量准则,判定所述平稳序列属于AR(p)、MA(q)、ARMA(p,q)模型,并确定阶数p,q;
[0026]步骤S54,对所述模型定阶,并且当q=2、p=2时,赤池信息量准则的值最小,选用ARMA(2,2)模型进行拟合,得到所述时间序列模型。
[0027]优选地,步骤S6中预测估计的区间为近一年的每月数据。
[0028]优选地,步骤S6之后还包括步骤S7,基于所述测试数据对所述时间序列模型进行检验。
[0029]本专利技术的有益效果是:由于采用以上技术方案,本专利技术建立了日常城市数据移入、移出机制,能动态管理人口迁入、迁出信息。
附图说明
[0030]图1是本专利技术的较佳的实施例中基于时间序列分析的城市迁移指数分析预测方法的示意图;
[0031]图2是本专利技术的较佳的实施例中特征提取模块的示意图;
[0032]图3是本专利技术的较佳的实施例中基于时间序列分析的城市迁移指数分析预测方法的步骤示意图;
[0033]图4是本专利技术的较佳的实施例中步骤S2的具体示意图;
[0034]图5是本专利技术的较佳的实施例中步骤S5的具体示意图。
[0035]附图中:1、城市经济水平信息数据;11、就业数据;12、房屋租赁/房价数据;13、城市治安数据;14、生活成本数据;21、训练数据;22、测试数据;3、数据预处理;4、特征提取模块;5、相关性检验;51、维度筛选;6构建模型;61、时间序列分析;7、预测迁移指数。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0038]下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。
[0039]一种基于时间序列分析的城市迁移指数分析预测方法,如图1、图2、图3所示,包括:
[0040]步骤S1,基于人口迁移数据库动态更新城市经济水平信息数据1,将城市经济水平信息数据1分为训练数据21和测试数据22,并作为初始数据;
[0041]步骤S2,对初始数据进行数据预处理得到不同维度的数据,并基于不同维度的数据得到迁入数据和迁出数据,基于迁入数据和迁出数据计算得到迁移指数;
[0042]步骤S3,对不同维度的数据进行特征提取,获得不同维度的特征数据;
[0043]步骤S4,基于特征数据的维度与迁移指数的相关性筛选可用维度;
[0044]步骤S5,通过残差序列方法进行平稳性检验,选定模型并进行拟合,得到时间序列模型;
[0045]步骤S6,对时间序列模型进行预测估计,得到预测迁移指数7。
[0046]具体地,本专利技术提供了一种基于时间序列分析的城市迁移指数分析预测方法,主要应用于动态人员人口迁移行为预测,根据实时预测判定迁移指数,建立日常城市数据移入移出机制,动态管理相关迁入迁出信息。
[0047]进一步具体地,根据上海市统计局公开的统计数据构建而成的人口迁移专题库数据,从而构建人口迁移指标体系,城市经济水平信息数据1包括第一、二、三产业生产总值;批发零售、建筑业、交通运输仓储和邮政业、住宿和餐饮业、信息传输软件和信息技术服务业,金融业、房地产业、租赁和商业服务业等,经过数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时间序列分析的城市迁移指数分析预测方法,其特征在于,包括:步骤S1,基于人口迁移数据库动态更新城市经济水平信息数据,将所述城市经济水平信息数据分为训练数据和测试数据,并作为初始数据;步骤S2,对所述初始数据进行数据预处理得到不同维度的数据,并基于所述不同维度的数据得到迁入数据和迁出数据,基于所述迁入数据和迁出数据计算得到迁移指数;步骤S3,对所述不同维度的数据进行特征提取,获得不同维度的特征数据;步骤S4,基于所述特征数据的维度与所述迁移指数的相关性筛选可用维度;步骤S5,通过残差序列方法进行平稳性检验,选定模型并进行拟合,得到时间序列模型;步骤S6,对所述时间序列模型进行预测估计,得到预测迁移指数。2.根据权利要求1所述的基于时间序列分析的城市迁移指数分析预测方法,其特征在于,步骤S1中所述城市经济水平信息数据包括:就业数据、房屋租赁/房价数据、城市治安数据、生活成本数据。3.根据权利要求2所述的基于时间序列分析的城市迁移指数分析预测方法,其特征在于,所述就业数据包括新增就业岗位、全市就业人数、职工基本养老保险参保人数、求职人数、海内及海外的人才引进人数;所述房屋租赁/房价数据包括全市住房租赁价格、新建商品住宅价格、二手住宅销售价格;所述生活成本数据包括人均可支配收入,人均消费支出,居民消费价格指数。4.根据权利要求1所述的基于时间序列分析的城市迁移指数分析预测方法,其特征在于,步骤S2包括:步骤S21,对所述初始数据进行校验处理,所述校验处理包括数据总量,非空数据量;步...

【专利技术属性】
技术研发人员:吴颖健王琳琳谭锐石鑫
申请(专利权)人:上海市大数据股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1