【技术实现步骤摘要】
一种建筑物尺度动态人口估算方法及系统
[0001]本专利技术涉及地理信息科学和城市规划领域,具体来说,本专利技术涉及一种建筑物尺度动态人口估算方法及系统
。
技术介绍
[0002]精细尺度的人口空间分布数据是城市规划
、
设施配置
、
应急救灾等的重要基础支撑
。
目前,人口数据获取手段主要为人口普查,虽然人口普查数据具有准确性等优势,但存在更新周期长
、
空间分辨率低
、
耗时费力等不足
。
精细空间尺度规则单元人口数据主要有格网人口和建筑物人口两类,格网尺度人口虽然具有计算简便等优势,但往往会造成对自然地物的分割,且并不能代表人类真实聚居载体等缺点,在各类应用的适用性方面存在不足
。
建筑物是人类活动的基本单元和主要载体,以建筑物为基本单元描述人口的空间分布,具有真实性
、
高可用性等特点,建筑物尺度的动态人口数据具有广泛的应用前景
。
因此,建筑物尺度的人口空间分布估算可以弥补传统统计调查耗时费力
、
难以快速获取等不足,且相较格网人口数据等具有更高的可用性
。
[0003]建筑尺度的人口空间估算,现有技术主要使用多智能体模型和基于机器学习的人口估算方法,多智能体模型的决策过程和决策结果依赖翔实的数据,由于相关精细尺度的输入数据较难获取,且有些数据对精细人口分布特征的刻画作用稍弱,所以存在一定困难
。
基于机器学习 ...
【技术保护点】
【技术特征摘要】
1.
一种建筑物尺度动态人口估算方法,其特征在于,包括:获取目标区域中包含预设第一特征的实时数据;将所述实时数据输入至预设的随机森林模型,以使所述随机森林模型根据所述实时数据,对目标区域进行建筑物尺度动态人口的估算;其中,所述随机森林模型是根据目标区域中包含预设第二特征的数据训练获得,所述第一特征是在所述随机森林模型训练过程中通过对所述第二特征进行特征筛选确定,所述第二特征包括目标区域的建筑
、
交通
、
人口数据,所述第二特征是根据所述目标区域中影响建筑尺度人口分布的静态数据和动态数据进行特征提取获得
。2.
如权利要求1所述的一种建筑物尺度动态人口估算方法,其特征在于,所述第二特征是根据所述目标区域中影响建筑尺度人口分布的静态数据和动态数据进行特征提取获得,具体为:获取目标区域中影响建筑尺度人口分布的静态数据和动态数据;通过地理信息系统从所述静态数据中提取所述目标区域的建筑物基底面积
、
建筑物高度
、
建筑物体积
、
所述建筑物到最邻近道路的距离
、
所述建筑物周围的路网密度
、
所述建筑物到最邻近水系的距离
、
所述建筑物到最邻近建筑物的距离
、
所述建筑物周围的
POI
核密度值,作为静态特征;所述静态数据包括:所述目标区域中的建筑物以及建筑物周围的路网
、
水系数据;将所述静态特征和从所述动态数据中提取的动态特征,作为所述第二特征;其中,所述动态数据包括:所述目标区域中的月度
NPP/VIIRS
夜间灯光数据
、
交通数据和
LBS
数据
。3.
根据权利要求2所述的一种建筑物尺度动态人口估算方法,其特征在于,所述从所述动态数据中提取的动态特征,具体为:将所述目标区域的建筑物该月所在位置的夜间灯光强度值减去所述目标区域的该月最小夜间灯光强度值后,除以所述目标区域的该月最大与最小夜间灯光强度值之差获得所述目标区域的标准化月度夜间灯光强度;根据所述交通数据提取所述目标区域出租车每次行程的起讫点,构建出行特征向量并结合所述目标区域的建筑物分布状况,在所述地理信息系统中提取所述建筑物周围的出租车出行特征向量起讫点核密度值;根据所述建筑物的面积占所在
LBS
网格中总建筑面积的比例分配该网格中的
LBS
人口值,提取所述建筑物的
LBS
人口值;根据地图软件中的交通拥堵指数数据,提取路网的交通拥堵指数值;将所述标准化月度夜间灯光强度
、
建筑物周围的出租车出行特征向量起讫点核密度值
、
建筑物的
LBS
人口值和路网的交通拥堵指数值,作为所述动态特征
。4.
如权利要求3所述的一种建筑物尺度动态人口估算方法,其特征在于,所述随机森林模型是根据目标区域中包含预设第二特征的数据训练获得,具体为:模型初始化过程,以建筑尺度城市实有人口数据建立样本数据集,以所述第二特征作为模型的初始特征,以选取决策数个数
、
最大特征数
、
子数最大深度
、
叶子节点最小样本数
、
采样规则
、
子树划分评价规则
、
袋外估计作为模型的初始参数,构建初始随机森林模型;模型训练过程,根据所述样本数据集对所述初始随机森林模型进行训练,并在训练过程中对所述初始随机森林模型进行特征筛选和超参数优化,获得所述随机森林模型
。
5.
如权利要求4所述的一种建筑物尺度动态人口估算方法,其特征在于,在模型训练过程中,对所述初始随机森林模型进行特征筛选,具体为:所述特征筛选为多轮筛选过程,在每一轮筛选过程中,计算所有参与筛选的特征的重要性,将所述重要性小于预设阈值的特征从所述初始随机森林模型中删除,对剩余特征按所述重要性由小到大进行检索,每次检索到的特征记为待删除特征,将所述待删除特征暂时删除,利用剩下的特征重新构建初始随机森林模型,如果所述重新构建的初始随机森林模型的估算精度下降,则保留所述待删除特征,继续检索下一个特征;否则删除所述待删除特征,停止本轮筛选并进入下一轮筛选;当在一轮筛选中未删除任何特征,则结束特征筛选,所述初始随机森林模型中剩余的特征为所述第一特征;其中,所述特征的重要性的计算过程为:将袋外数据输入所述初始随机森林模型中的所有决策树进行测试,得到初始袋外错误样本数,其中,所述袋外数据为在随机森林模型训练过程中,训练数据中未被采样的数据;将所述袋外数据中的某个特征进行随机置换,将所述置换后的袋外数据输入所述初始随机森林模型中的所有决策树进行测试,得到置换后袋外错误样本数;计算置换前与置换后的袋外数据分类误差平均变化量,获得该特征的重要性
。6.
如权利要求4所述的一种建筑物尺度动态人口估算方法,其特征在于,对所述初始随机森林模型进行超参数优化,具体为:在超参数的取值范围内,使用网格交叉搜索法对超参数不同取值进行排列组合,并利用五折交叉验证的方法验证超参数值改变后模型的性能,最终得到最优的模型超参数组合结果;其中,所述超参数包括:决策树的数量
、
不纯度的衡量指标
、
树的最大深度
、
拆分内部节点所需的最小样本数
、
叶子节点上所需的最小样本数
、
在寻找最佳分裂节点所考虑的最大特征数
。7.
如权利要求1所述的一种建筑物尺度动态人口估算方法,其特征在于,将所述实时数据输入至预设的随机森林模型,以使所述随机森林模型根据所述实时数据,对目标区域进行建筑物尺度动态人口的估算,具体为:以目标区域中的建筑物为单位,输入包含所述第一特征的建筑物数据至所述随机森林模型,所述随机森林模型中的各个决策树根据各个建筑物数据中的第一特征的值以及决策树内部的决策规则,输出对各个建筑物的人口估算结果;所述随机森林模型按照预设的规则整合所述各个决策树输出的结果,得到所述随机森林模型对各个建筑物的人口估算值
。8.
如权利要求1所述的一种建筑物尺度动态人口估算方法,其特征在于,当所述随机森林模型的训练完成后,对所述随机森林模型进行精度评价;当所述人口估算过程完成后,对所述随机森林模型的估算结果进行精度评价,具体为:使用测试数据对所述随机森林模型进行测试,计算测试数据的真实值和估计值之间的决定系数
、
均方根误差和残差,根据所述决定系数
、
均方根误差和残差的值,对所述随机森林模型进行精度评价;将所述随机森林模型的人口估算结果与所述目标区域的街道尺度人口普查数据
、WorldPop
数据集进行比较,以相对误差和平均相对误差作为评价指标,对所述人口估算结果进行精度评价
。9.
一种建筑物尺度动态人口估算系统,其特征在于,包括:获取模块
、
估算模块和训练
模块;其中,所述获取模块用于获取目标区域中包含预设第一特征的实时数据;所述估算模块用于将所述实时数据输入至预设的随机森林模型,以使所...
【专利技术属性】
技术研发人员:刘耿,高金顶,张恒,张晓琴,梁超,张鸿辉,徐光志,杨丽娅,
申请(专利权)人:广东国地资源与环境研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。