一种全国县级单元经济整理与空间化方法技术

技术编号:24579000 阅读:31 留言:0更新日期:2020-06-21 00:48
本发明专利技术提供一种全国县级单元经济整理与空间化方法,涉及数据整理统计技术领域;本方法利用网络爬虫和人工辅助查漏补缺的方式,最大程度地保证了数据的完整准确性和可靠性,同时尽量减少人为操作过程带来的错误;建立了地区名称词典、社会经济指标名称词典;按照实际需求对无数据的区域进行了图形自动合并与属性计算;设计了一套时空属性标注方案,可用于社会经济统计数据的迭代更新和持续完善。利用自动制图可视化方法和技术,结合社会经济常识,进行数据质量检查。通过上面的步骤和方法,收集了全国2011‑2015年县级、地级行政单元的社会经济数据,并进行了空间可视化。

A method of economic arrangement and spatialization of county units in China

【技术实现步骤摘要】
一种全国县级单元经济整理与空间化方法
本专利技术涉及经济统计研究领域,尤其涉及一种全国县级单元经济整理与空间化方法。
技术介绍
随着我国的经济的快速发展,我国综合国力和居民生活水平显著提升,随着社会城市化程度加深,人口数量增加,经济水平提高,但同时也给我国带来了其他方面的各种影响,诸如:自然环境问题,生态建设,人口问题,资源问题,人民生活质量等社会生存发展的问题。而获取全国社会经济发展数据,是进一步分析,解决我国社会经济发展过程中出现的问题的基础在县级单元数据相关研究中,众多学者往往针对的某一省内县域经济空间格局的演化,来分析分析经济差异演化的空间机理和驱动机制。也有学者将县级单元人口数据与自然灾害联系研究新风险因素与传统风险因素间关系[1]等。数据是一切自然科学研究的基础,收集数据是一项细致而严谨的工作,但全国区县数量多,包括31个省,344个地级市和直辖区,2850多个区县,数据量庞大。年鉴种类繁多,收集整理数据过程中存在行政区划边界变动、行政区划名称变动、行政区名称相同、各统计年鉴数据不一致、指标名称在年鉴中有多种命名、不同年鉴指标数据单位不统一、指标数据不存在等各种问题而且下载整理过程繁琐复杂、任务量大,导致众多研究者不愿意干这项“又脏又累”的活,影响数据分析整理结果。
技术实现思路
本专利技术的目的在于提供一种全国县级单元经济整理与空间化方法,从而解决现有技术中存在的前述问题。为了实现上述目的,本专利技术采用的技术方案如下:一种全国县级单元经济整理与空间化方法,包括以下步骤:S1,整理搜集地级市数据;S2,搜集区、县级单元数据;S3,整理搜集到的数据,并对数据进行空间化;空间化,是指将Excel表格中的数据放置到地图或地图空间上的过程,也就是为每个数字找到一个空间位置;S4,对空间化的数据进行分析。优选地,步骤S1之前还包括:S0,分析行政区划和名称的变化,具体包括:A1,行政区划边界变动;A2,行政区划名称变动;A3,行政区名称相同;A4,统计年鉴数据不一致;A5,待搜集指标名称不一致;A6,指标数据缺失。优选地,步骤S2具体包括:S21,采用爬虫程序对CNKI数据库数据进行搜集;S22,根据指标名称字典中指标名称在统计进行时迭代搜索;S23,从其他数据网补充迭代搜索补充数据;S24,对搜集到的数据建立EXCEL时空标注;时空标注方法是向Excel文件插入一行和一列信息,同时用“time_space_attribute”的形式进行标注;S25,对地级市无数据区域进行合并统一;S26,对搜集到的数据批量制图,检查数据准确完整性。优选地,步骤S24所述EXCEL时空标注采用时间、空间和属性的标注方法对EXCEL文件进行标识,包括三种标注方法:时间固定标注法、空间固定标注法以及属性固定标注法。优选地,步骤S25中包括以下情况:B1,区县全部无数据情况合并,合并区县,以地级市数据表示;B2,部分区县无数据,合并无数据区县,用地级市数据减去有数据区域的数据之和;B3,区县所属地级市无数据,对缺值的县级单位边界不做处理。优选地,步骤S26中制备的图包括全国地级单元GDP密度分布图、全国地级单元常住人口密度分布图、全国地级单元城镇人口密度分布图、全国地级单元第一、二、三产业增加值密度分布图、全国地级单元年末人口,乡村人口分布图和相应的全国县级单位的分布图中的至少一种。优选地,步骤S26中检查数据准确完整性的步骤包括:C1,在已制备的图中找出最大值,最小值或某些低值的分布范围,检查最大值最小值是否有异常;C2,快速查看数据缺失值的地理位置,得到无数据区域;C3,判断数据是否出现异常,当高值附近突然出现的低值数据,或低值区域附近突然出现的高值数据,则判定为异常。优选地,步骤S4中对数据的分析包括空间自相关性分析和集中化分析。优选地,所述空间自相关性分析的步骤为:D1,采用LocalMoran’sI统计量来分析每个县级区域与周边地区间的空间差异程度;其中xi表示第i个空间位置上的观测值,为x的平均值,wij是空间二元权重矩阵wn×n的元素,S0是空间权重矩阵w的所有元素之和;D2,根据步骤D1中的公式绘制空间LocalMoran′sI图。优选地,所述集中化分析包括以下步骤:E1,求取待统计区域的基尼系数;E2,按照下列公式计算某指标要素基尼系数:Q=(A1/A2)/(A3/A4)式中,Q为基尼系数;A1为某区县指标值;A2为全国各区县指标总值;A3为某区县土地总面积;A4为全国土地总面积;E3,按基尼系数从大到小的顺序,依次列出全国各区县的国土面积占比和指标数据占比,并计算累计百分比,对排列出的各县区制作洛伦兹曲线,分为六段;E4,对基尼系数值在同一区域的地区用相同标记表示,制作出了空间洛伦兹图。本专利技术的有益效果是:本专利技术提供一种全国县级单元经济整理与空间化方法,本方法利用网络爬虫和人工辅助查漏补缺的方式,最大程度地保证了数据的完整准确性和可靠性,同时尽量减少人为操作过程带来的错误;建立了地区名称词典、社会经济指标名称词典;按照实际需求对无数据的区域进行了图形自动合并与属性计算;设计了一套时空属性标注方案,可用于社会经济统计数据的迭代更新和持续完善。利用自动制图可视化方法和技术,结合社会经济常识,进行数据质量检查。通过上面的步骤和方法,收集了全国2011-2015年县级、地级行政单元的社会经济数据,并进行了空间可视化。附图说明图1是全国县级单元经济整理与空间化方法流程示意图;图2是搜集数据的方法流程示意图;图3是使用excel时空标注法读取标注数据流程示意图;图4是2015年GDP的Lorenz曲线空间分布图;图5是2015年GDP的局部空间相关图;图6是2015年年末人口的Lorenz曲线空间分布图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不用于限定本专利技术。实施例本实施例提供一种全国县级单位社会经济整理与空间化的方法,该方法如图1中流程图所示,包括以下步骤:S0,分析待统计的各地级市行政区划和名称的变化;由于区划名称可能会出现重名或改变的情况,因此在进行正式统计行政区划时需要考虑全面,包括A1,行政区划边界变动;如两个或多个行政区划合并,北京的玄武和崇文区被分别合并进了西城区和东城区;一个行政区被一分为二分别合并到两个不同的地级市,如:安徽巢湖市拆分;一个行政区划一分为二地存在,如:湖北随州市曾都区分裂为曾都区和随县。A本文档来自技高网...

【技术保护点】
1.一种全国县级单元经济整理与空间化方法,其特征在于,包括以下步骤:/nS1,整理搜集地级市数据;/nS2,搜集区、县级单元数据;/nS3,整理搜集到的数据,并对数据进行空间化处理;/nS4,对空间化的数据进行分析。/n

【技术特征摘要】
1.一种全国县级单元经济整理与空间化方法,其特征在于,包括以下步骤:
S1,整理搜集地级市数据;
S2,搜集区、县级单元数据;
S3,整理搜集到的数据,并对数据进行空间化处理;
S4,对空间化的数据进行分析。


2.根据权利要求1所述的全国县级单元经济整理与空间化方法,其特征在于,步骤S1之前还包括:S0,分析判断行政区划和名称的变化,具体包括:
A1,行政区划边界变动;
A2,行政区划名称变动;
A3,行政区名称相同;
A4,统计年鉴数据不一致;
A5,待搜集指标名称不一致;
A6,指标数据缺失。


3.根据权利要求1所述的全国县级单元经济整理与空间化方法,其特征在于,步骤S2具体包括:
S21,采用爬虫程序对CNKI数据库数据进行搜集;
S22,根据指标名称字典中指标名称在统计进行时迭代搜索;
S23,从其他数据网补充迭代搜索补充数据;
S24,对搜集到的数据建立EXCEL时空标注;
S25,对地级市无数据区域进行合并统一;
S26,对搜集到的数据批量制图,检查数据准确完整性。


4.根据权利要求3所述的全国县级单元经济整理与空间化方法,其特征在于,步骤S24所述EXCEL时空标注采用时间、空间和属性的标注方法对EXCEL文件进行标识,包括三种标注方法:时间固定标注法、空间固定标注法以及属性固定标注法。


5.根据权利要求3所述的全国县级单元经济整理与空间化方法,其特征在于,步骤S25中包括以下情况:
B1,区县全部无数据情况合并,合并区县,以地级市数据表示;
B2,部分区县无数据,合并无数据区县,用地级市数据减去有数据区域的数据之和;
B3,区县所属地级市无数据,对缺值的县级单位边界不做处理。


6.根据权利要求3所述的全国县级单元经济整理与空间化方法,其特征在于,步骤S26中批量制图包括全国地级单元GDP密度分布图、全国地级单元常住人口密...

【专利技术属性】
技术研发人员:宋敦江邹秀萍黄宝荣张丛林
申请(专利权)人:中国科学院科技战略咨询研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1