【技术实现步骤摘要】
基于位置大数据的精细时空尺度动态人口预测方法及系统
本专利技术属于互联网检测领域,特别涉及一种基于位置大数据的精细时空尺度动态人口预测方法及系统。
技术介绍
近年来,位置感知大数据的普及使得大范围感知精细尺度个体时空活动成为可能,这为动态人口预测奠定了坚实的数据基础。现有动态人口预测方法主要是利用手机数据或包含地理位置的社交媒体数据,通过构建与真实地面人口之间的加权模型或统计关系,实现城市范围内高时空精度动态人口预测,时间分辨率可达到天乃至小时尺度。从方法上看,可大致分为三类:加权插值法、统计建模法、人工智能建模法。加权插值法基于数据自身或辅助变量,构建简单加权模型来获取人口分布权重[1-4]。统计建模法采用对数线性模型等统计模型,对位置感知大数据与普查人口数据之间的稳健函数关系进行建模[5-8]。人工智能建模法基于机器学习或深度学习模型,对人口分布的时空模式或影响因素进行智能学习,并据此预测动态人口[9-10]。但是,现有动态人口预测方法还存在如下问题:(1)模型尺度下推的适用性问题。现有模型大多是通过在街 ...
【技术保护点】
1.一种基于位置大数据的精细时空尺度动态人口预测方法,其特征在于:包括以下步骤,/n步骤1,对多源数据进行预处理,所述多源数据包括社会感知大数据、遥感影像和GIS数据,获得格网和区县尺度各空间协变量的统计量,所述空间协变量是来自社会感知大数据、GIS数据和遥感影像的空间位置信息相关变量,所述格网的大小采用预设的距离尺度;/n步骤2,识别人类活动格网,包括根据格网尺度指示人类活动存在迹象的相关空间协变量,判断相应区域是否存在人类活动;/n步骤3,构建动态人口密度预测模型,包括在区县尺度上,基于空间协变量和人口统计数据对随机森林和XGBoost两个基模型分别进行训练,然后利用地 ...
【技术特征摘要】
1.一种基于位置大数据的精细时空尺度动态人口预测方法,其特征在于:包括以下步骤,
步骤1,对多源数据进行预处理,所述多源数据包括社会感知大数据、遥感影像和GIS数据,获得格网和区县尺度各空间协变量的统计量,所述空间协变量是来自社会感知大数据、GIS数据和遥感影像的空间位置信息相关变量,所述格网的大小采用预设的距离尺度;
步骤2,识别人类活动格网,包括根据格网尺度指示人类活动存在迹象的相关空间协变量,判断相应区域是否存在人类活动;
步骤3,构建动态人口密度预测模型,包括在区县尺度上,基于空间协变量和人口统计数据对随机森林和XGBoost两个基模型分别进行训练,然后利用地理加权模型,对随机森林和XGBoost的预测结果进行局部加权综合,从而构建25个人口空间降尺度模型,包括1个日尺度人口空间降尺度模型和24个小时尺度人口空间降尺度模型;利用自编码深度残差网络模型,训练得到动态人口密度预测模型,对省级范围内格网尺度动态人口密度初始预测值进行精校正,得到精校正后的省级范围格网尺度动态人口密度;
步骤4,优化超参数及评估模型精度,包括采用机器学习网格搜索技术和经验知识,实现随机森林和XGBoost基模型、地理加权回归模型及自编码深度残差网络模型的超参数优化,并在不同尺度上对动态人口密度预测精度进行评估。
2.根据权利要求1所述基于位置大数据的精细时空尺度动态人口预测方法,其特征在于:步骤1的实现包括以下子步骤,
步骤1.1,分别合成格网尺度地图服务定位请求量和夜光亮度的校正年度平均值;
步骤1.2,在全国范围内创建矢量渔网,将Albers等积圆锥投影和等距圆锥投影分别作为矢量渔网的投影系统,对各空间协变量根据统计量性质进行Albers等积圆锥投影或等距圆锥投影;
步骤1.3,分别对POI和土地利用数据的各子类,按照属性的相似程度进行初步合并;
步骤1.4,对各空间协变量中的路径距离有关变量生成预设空间分辨率的路径距离栅格;
步骤1.5,在格网尺度和区县尺度统计各变量对应的不同类型统计量,包括密度值、平均路径距离和区域平均值;
步骤1.6,采用随机森林算法,通过构建与年末常住人口密度之间的回归关系,分别对空间协变量中POI、土地利用、路网的密度或路径距离进行降维。
3.根据权利要求2所述基于位置大数据的精细时空尺度动态人口预测方法,其特征在于:步骤2的实现包括以下子步骤,
步骤2.1,采用各格网内的相关指标,包括根据步骤1所得格网尺度各空间协变量的统计量中地图服务定位请求量校正值的年中位数,夜光亮度值、微博平台POI签到次数、数字地图POI数量、路网密度、GUF面积、土地利用数据中的人工地表面积和人类居住区面积,分别判断各指标是否大于零,并据此对格网进行二元分类,大于零就为1,否则为0;
步骤2.2,提取所有值为1的格网并集,这些格网表明至少有一个数据源证明该区域存在人类活动,定义为人类活动格网。
4.根据权利要求3所述基于位置大数据的精细时空尺度动态人口预测方法,其特征在于:步骤3的实现包括以下子步骤,
步骤3.1,在区县尺度上,利用各空间协变量和年末常住人口数据,对随机森林和XGBoost两个基模型分别进行训练,然后利用地理加权回归模型,对随机森林和XGBo...
【专利技术属性】
技术研发人员:刘张,杜云艳,易嘉伟,
申请(专利权)人:中国科学院地理科学与资源研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。