一种精细尺度人口数据空间化方法技术

技术编号:23161683 阅读:30 留言:0更新日期:2020-01-21 21:58
一种精细尺度人口数据空间化方法,包括如下步骤:一)从系统待处理区土地利用现状图层中调取土地利用数据;提取出待处理区的行政村边界图层;进行编行码匹配,建立地理信息空间数据库,计算该土地利用类型指数;采用双侧检验的皮尔逊(pearson)相关系数,分析各个村的土地利用类型指数与人口密度的相关关系;二)分别选取IDW方法、多元回归方法和BP神经网络方法对人口数据进行空间化,并选择精度最高的方法进行最终人口数据空间化;三)精度验证。

【技术实现步骤摘要】
一种精细尺度人口数据空间化方法
本专利技术涉及利用电脑技术对指定的地域进行人口数据分析和模拟的
,尤其涉及一种解决精细尺度人口数据空间化方法。
技术介绍
在利用电脑技术对指定地域的人口分布及其相关研究中,常常会遇到小尺度上人口数据部分缺失问题。当前由于村级人口数据获取的成本和技术受限,很多情况下难以获取全员数据,存在村级人口数据的缺失问题。而村级人口空间化能更好的模拟人口在精细尺度上的分布状况。尽管大尺度人口空间化的研究虽有很多,但这些方法无法直接应用于村级精细尺度人口的拟合。关于人口尤其村级人口空间化的研究,现有文献还鲜有涉及。人口空间化研究是人口空间化的前提。在人口分布及其相关研究中,针对待处理区域精细尺度上(如村级)人口数据部分缺失问题,需要利用已知区域的村级人口数据模拟待处理区未知的其它位置(行政村)的人口数据,使人口地图能较客观精细地反映出整个待处理区人口分布的相对稀密状态。国内外学者对人口空间化进行了大量的研究,但针对小尺度上人口空间化方法的研究还较少,具体表现在:人口分布问题涉及人口学、经济学、地理学、社会学等多个学本文档来自技高网...

【技术保护点】
1.一种精细尺度人口数据空间化方法,其特征在于,包括如下步骤:/n一)/n11)、从系统储存的待处理区土地利用现状图层中调取土地利用数据,按照第二次全国土地调查土地分类标准,把土地利用数据所指代土地分为8类:01耕地、02园地、03林地、04草地、20城镇村及工矿用地、10交通运输用地、11水域及水利设施用地、12其他用地,之后进入步骤12);/n12)、提取出待处理区的行政村边界图层,图层包含的基本属性字段包括行政村名称、行政村区划代码,将行政村边界图层作为空间数据,将行政区划代码作为匹配标识关键字段,将行政村社会统计数据作为属性数据导入到行政村图层属性中,基于“行政区划代码”公共字段完成空...

【技术特征摘要】
1.一种精细尺度人口数据空间化方法,其特征在于,包括如下步骤:
一)
11)、从系统储存的待处理区土地利用现状图层中调取土地利用数据,按照第二次全国土地调查土地分类标准,把土地利用数据所指代土地分为8类:01耕地、02园地、03林地、04草地、20城镇村及工矿用地、10交通运输用地、11水域及水利设施用地、12其他用地,之后进入步骤12);
12)、提取出待处理区的行政村边界图层,图层包含的基本属性字段包括行政村名称、行政村区划代码,将行政村边界图层作为空间数据,将行政区划代码作为匹配标识关键字段,将行政村社会统计数据作为属性数据导入到行政村图层属性中,基于“行政区划代码”公共字段完成空间数据与属性数据的匹配,行政村社会统计数据集合包括行政区划代码字段;之后进入步骤13);
13)、进行编行码匹配,建立地理信息空间数据库,地理信息空间数据库包含空间数据和属性数据,空间数据包括土地利用现状数据、行政村边界数据,属性数据包括行政村的社会统计数据;对土地利用现状图层与行政村边界图层进行叠加分析,提取并统计出各村各种土地类型的面积,用每种土地利用类型的面积除以行政村的面积,再乘以100%,即得到该土地利用类型指数;
采用双侧检验的皮尔逊(pearson)相关系数,分析各个村的土地利用类型指数与人口密度的相关关系,计算公式如下:



其中:rxy为皮尔逊(pearson)相关系数;
Xi代表土地利用指数的值,i指的是第几种土地类型,土地类型的顺序可自设,代表了土地利用指数值的平均值;
Yi代表的是人口密度的值,i指的是第几个行政村的人口密度值,各行政村的标号顺序可自设,代表人口密度值的平均值;
rxy即土地利用指数样本的值Xi与人口密度样本的值Yi这两个要素的皮尔逊(pearson)相关系数,rxy的值在[-1,1]之间:rxy>0表示两个要素存在正相关型;rxy<0表示两个要素之间存在负相关性;rxy的绝对值越接近1,则表示两要素之间的关系越密切,越密切代表两者直接的相关性越大;反之,若rxy绝对值越接近0,则表示两者之间关系越不密切;
在0.01显著性水平下,通过检验的土地利用指数为耕地指数、林地指数、城镇村及工矿用地指数和交通用地指数,说明01耕地、03林地、20城镇村及工矿用地、10交通用地是影响人口分布的主要因素;
二)
分别选取IDW方法、多元回归方法和BP神经网络方法对人口数据进行空间化,并选择精度最高的方法进行最终人口数据空间化;
在进行人口数据空间化操作之前,首先将待计算处理的地域划分为500m×500m的格网,然后以格网作为基本空间单元进行人口数据空间化;
人口数据空间化的方法有三种,分别为IDW方法、多元回归方法和BP神经网络方法:
21)在IDW插值方法中,把未通过0.01显著性水平检验的土地利用类型的人口密度设为0,设置栅格图像的空间分辨率与格网单元大小保持一致;
22)在多元回归方法中,把土地利用类型通过划分到每个格网中,选取人口密度值为因变量,耕地指数、林地指数、城镇村及工矿用地指数、交通用地指数为自变量,根据多元线性回归方程计算出每个格网的人口数目,然后以行政村为单位汇总得到缺失的村人口数;
所述多元线性回归方程公式如下:
y1=β0+β1X11+β2X21+β3X31+β4X41+ε
其中,y1为因变量,即人口密度值;β0为回归常数,X11、X21、X31、X41为自变量,X11为耕地指数、X21为林地指数、X31为城镇村及工矿用地指数、X41为交通用地指数,β1、β2、β3、β4为4个自变量的回归系数;ε为随机误差;
23)在BP神经网络方法中,采用的BP神经网络具有3层:一个输入层,一个中间隐含层,一个输出层;输入层包含4个输入节点,分别输入耕地指数、林地指数、城镇村及工矿用地指数、交通用地指数;中间隐含层的激励函数采用Sigmoid函数;输出层的输出结点为...

【专利技术属性】
技术研发人员:王艳慧赵文吉张建辰齐文平
申请(专利权)人:首都师范大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1