【技术实现步骤摘要】
一种基于集成学习的人口空间化方法及系统
[0001]本专利技术涉及人口空间化
,特别是涉及一种基于集成学习的人口空间化方法及系统。
技术介绍
[0002]分解人口普查数据以生成网格化人口密度数据集的过程被称为人口空间化。人口空间化反映人口的空间分布,对公共卫生、城市发展规划和灾害评估管理具有重要意义。人口空间化研究方法主要有:(1)空间插值法;空间插值法(比如面积加权插值法)多用于早期人口空间化研究,对于数据尺度转换较为容易,但难以考虑一个区域内多种影响因素对人口分布的影响。(2)统计模型法;统计模型通过建立回归模型,综合考虑多种影响因素对人口分布的影响,但很难解释人口的各种空间分布影响因素与人口密度的非线性关系。(3) 机器学习模型法;其中最广泛使用的随机森林模型生成的网格化人口密度数据集达到了很高的精度。机器学习模型在人口空间化方法上取得了重大进展,能够分析人口空间化过程中各种人口空间分布影响因素与人口密度之间的非线性关系。然而,出于对人口空间化的科学考虑,生成的网格化人口密度数据集的准确性是非常重要的。尽管随机森林模型有效地承担了人口空间化的过程,但由于单个模型对变量特征的理解有限,模型的准确性仍有很大的提升空间。
技术实现思路
[0003]本专利技术的目的是提供一种基于集成学习的人口空间化方法及系统,能够基于社会经济数据和自然环境数据与人口普查数据完成人口空间化,提高人口空间化的精度。
[0004]为实现上述目的,本专利技术提供了如下方案:
[0005]一种基于集成学习的 ...
【技术保护点】
【技术特征摘要】
1.一种基于集成学习的人口空间化方法,其特征在于,包括:将待研究区域进行栅格化处理,得到多个待研究栅格;确定每个待研究栅格的特征数据;所述特征数据包括:社会经济特征和自然环境特征;将每个待研究栅格的特征数据输入到人口密度预测模型中,得到每个待研究栅格的预测人口密度;所述人口密度预测模型是利用历史研究区域的人口数据和特征数据,对初始人口密度预测模型进行训练得到的;所述初始人口密度预测模型是利用集成算法对GBDT模型、XGBoost模型、LightGBM模型和支持向量机模型进行集成得到的;根据多个待研究栅格的预测人口密度,构建待研究区域的人口空间分布图。2.根据权利要求1所述的一种基于集成学习的人口空间化方法,其特征在于,在所述将所述待研究区域进行栅格化处理,得到多个待研究栅格之前,还包括:将历史研究区域进行栅格化处理,得到多个历史栅格;确定历史研究区域中每个历史栅格的特征数据;获取历史研究区域中多个子区域的面积和人口数量;根据多个子区域的面积和人口数量,确定每个子区域的平均人口密度;将历史研究区域中历史栅格所在子区域的平均人口密度确定为历史栅格期望人口密度;以历史栅格的特征数据为输入,以历史栅格期望人口密度为输出,对初始人口密度预测模型进行训练,得到人口密度预测模型。3.根据权利要求2所述的一种基于集成学习的人口空间化方法,其特征在于,所述以历史栅格的特征数据为输入,以历史栅格期望人口密度为输出,对初始人口密度预测模型进行训练,得到人口密度预测模型,包括:以历史栅格的特征数据为输入,以历史栅格期望人口密度为输出,对GBDT模型进行训练,得到第一模型;以历史栅格的特征数据为输入,以历史栅格期望人口密度为输出,对XGBoost模型进行训练,得到第二模型;以历史栅格的特征数据为输入,以历史栅格期望人口密度为输出,对LightGBM模型进行训练,得到第三模型;将历史研究区域中每个历史栅格的特征数据输入到第一模型中,得到每个历史栅格的第一预测结果;将历史研究区域中每个历史栅格的特征数据输入到第二模型中,得到每个历史栅格的第二预测结果;将历史研究区域中每个历史栅格的特征数据输入到第三模型中,得到每个历史栅格的第三预测结果;连接同一历史栅格的第一预测结果、第二预测结果和第三预测结果作为历史栅格中间特征;以多个历史栅格中间特征为输入,以历史栅格期望人口密度为输出,对支持向量机模型进行训练,得到第四模型;以第一模型、第二模型和第三模型维基模型,以第四模型为元模型,构建人口密度预测模型。
4.根据权利要求3所述的一种基于集成学习的人口空间化方法,其特征在于,所述将每个待研究栅格的特征数据输入到人口密度预测模型中,得到每个待研究栅格的预测人口密度,包括:将每个待研究栅格的特征数据输入到第一模型中,得到每个待研究栅格的第四预测结果;将每个待研究栅格的特征数据输入到第二模型中,得到每个待研究栅格的第五预测结果;将每个待研究栅格的特征数据输入到第三模型中,得到每个待研究栅格的第六预测结果;连接同一待研究栅格的第四预测结果、第五预测结果和第六预测结果作为待研究栅格中间特征;将多个待研究栅格中间特征输入到第四模型中,得到每个待研究栅格的预测人口密度。5.一种基于集成学习的人口空间化系统,其特征在于,包括:第一栅格化处理模块,用于将待研究区域进行栅格化处理,得到多个待研究栅格;第一特征数据确定模块,用于确定每个待研究栅格的特征数据;所述特征数据包括:社会经济特征和自...
【专利技术属性】
技术研发人员:包文轩,宫阿都,赵怡然,陈帅强,巴婉如,
申请(专利权)人:北京师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。