一种基于多渠道数据融合的区域画像构建方法及系统技术方案

技术编号:33387940 阅读:15 留言:0更新日期:2022-05-11 23:03
本发明专利技术提供一种基于多渠道数据融合的区域画像构建方法,通过多渠道采集区域的多维度数据并进行数据预处理;对预处理后的数据进行指标数据计算,确定不同指标体系的特征值;基于得到的特征值进行数据对比以及区域画像。本发明专利技术提供基于多渠道数据融合的一体化的数据解决方案,以海量数据和大数据技术为基础,以宏观分析和微观透视相结合,实现全局可视、智能分析,能够为政府促进区域经济提供支撑,实现以数据驱动经济增长。现以数据驱动经济增长。现以数据驱动经济增长。

【技术实现步骤摘要】
一种基于多渠道数据融合的区域画像构建方法及系统


[0001]本专利技术属于大数据
,特别是涉及到一种基于多渠道数据融合的区域画像构建方法及系统。

技术介绍

[0002]区域画像是一种基于区域的数据模型,包括区域资源、环境保护、区域人口、劳动资料、区域经济在内的多维度数据。为了使各区域指标数据的呈现更为直观明了,辅助决策者快速准确定位区域发展的优劣势情况,需要对区域画像进行构建。

技术实现思路

[0003]本专利技术提出一种基于多渠道数据融合的区域画像构建方法及系统,以海量数据和大数据技术为基础,实现全局可视、智能分析,能够为促进区域发展提供技术支撑。
[0004]为了实现上述目的,本专利技术的技术方案是这样实现的:
[0005]一种基于多渠道数据融合的区域画像构建方法,包括:
[0006]S1、通过多渠道采集区域的多维度数据并进行数据预处理;
[0007]S2、对步骤S1预处理后的数据进行指标数据计算,确定不同指标体系的特征值;
[0008]S3、基于步骤S2得到的特征值进行数据对比以及区域画像。
[0009]进一步的,步骤S1中所述区域的多维度数据包括区域资源、环境保护、区域人口、劳动资料、区域经济的统计数据;所述通过多渠道采集的方法包括根据统计年鉴数据,政府工作报告数据,业务系统数据,网站发布的环境、资源、人口、经济指标数据的各自更新频次进行周期性数据采集。
[0010]进一步的,步骤S1中所述数据预处理的方法包括数据抽取、数据清洗、数据转换、数据存储。
[0011]进一步的,步骤S2的具体方法包括:
[0012]S201、分类分析:
[0013]采用数量指标分组分析法,根据不同维度、不同数量级指标,分别采用单项式分组和组距式分组;根据数据特性不同,采用等距分组和不等距分组的分别处理;
[0014]S201、聚类分析:
[0015]通过对特定分析目的和发展视角所挑选出的指标变量进行聚类分析,把特定指标划分成几个具有明显特征区别的范围;
[0016]S203、特征值提取:
[0017]将步骤S201和S202的分析结果数据进行综合应用,对各不同维度、不同衡量单位、不同规模量级的宏观经济指标进行分析,提取出应用于区域画像需要的变量特征;对不同区域、相同级别、相同维度的指标使用同一特征值,以获得最佳展示效果。
[0018]进一步的,步骤S3的具体方法包括:
[0019]S301、基本维度对比:
[0020]定义一个维度进行数据对比分析,常用一维分类;
[0021]S302、横向对比:
[0022]对于固定时间范围不同区域的一个或一组数据指标进行对比;
[0023]S303、纵向对比:
[0024]对于固定区域不同时间范围的一个或一组数据指标进行对比;
[0025]S304、区域画像:
[0026]不同分类的指标用不同位置和不同颜色表示以示区分,每个分类用一个关键指标通过加粗的方式重点显示,以每个分类的关键指标作为依据,画连接线将关键指标进行连接,产生区域画像轮廓;
[0027]S305、区域分析:
[0028]对区域的5个维度进行综合分析,按照维度的相互关系进行关联分析,挖掘区域经济发展要素。
[0029]本专利技术另一方面还提出了一种基于多渠道数据融合的区域画像构建系统,包括:
[0030]采集模块,通过多渠道采集区域的多维度数据并进行数据预处理;
[0031]特征值模块,对采集模块预处理后的数据进行指标数据计算,确定不同指标体系的特征值;
[0032]区域画像模块,基于特征值模块得到的特征值进行数据对比以及区域画像。
[0033]进一步的,采集模块包括:
[0034]多维度数据划分单元,划分为区域资源、环境保护、区域人口、劳动资料、区域经济的统计数据;
[0035]多渠道采集单元,根据统计年鉴数据,政府工作报告数据,业务系统数据,网站发布的环境、资源、人口、经济指标数据的各自更新频次进行周期性数据采集。
[0036]进一步的,采集模块还包括数据抽取单元、数据清洗单元、数据转换单元、数据存储单元。
[0037]进一步的,特征值模块包括:
[0038]分类分析单元:采用数量指标分组分析法,根据不同维度、不同数量级指标,分别采用单项式分组和组距式分组;根据数据特性不同,采用等距分组和不等距分组的分别处理;
[0039]聚类分析单元:通过对特定分析目的和发展视角所挑选出的指标变量进行聚类分析,把特定指标划分成几个具有明显特征区别的范围;
[0040]特征值提取单元:将分类分析单元和聚类分析单元的分析结果数据进行综合应用,对各不同维度、不同衡量单位、不同规模量级的宏观经济指标进行分析,提取出应用于区域画像需要的变量特征;对不同区域、相同级别、相同维度的指标使用同一特征值,以获得最佳展示效果。
[0041]进一步的,区域画像模块包括:
[0042]基本维度对比单元:定义一个维度进行数据对比分析,常用一维分类;
[0043]横向对比单元:对于固定时间范围不同区域的一个或一组数据指标进行对比;
[0044]纵向对比单元:对于固定区域不同时间范围的一个或一组数据指标进行对比;
[0045]区域画像单元:不同分类的指标用不同位置和不同颜色表示以示区分,每个分类
用一个关键指标通过加粗的方式重点显示,以每个分类的关键指标作为依据,画连接线将关键指标进行连接,产生区域画像轮廓;
[0046]区域分析单元:对区域的5个维度进行综合分析,按照维度的相互关系进行关联分析,挖掘区域经济发展要素。
[0047]与现有技术相比,本专利技术具有如下的有益效果:
[0048]本专利技术设计一种基于多渠道数据融合的区域画像构建方法及系统,提供基于多渠道数据融合的一体化的数据解决方案,以海量数据和大数据技术为基础,实现全局可视、智能分析,能够为政府促进区域经济提供支撑,实现以数据驱动经济增长。
附图说明
[0049]图1是本专利技术实施例的流程示意图;
[0050]图2是本专利技术实施例的通过画像得到的区域发展类型对比图。
具体实施方式
[0051]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0052]下面结合具体实施例对本专利技术做进一步说明。
[0053]本专利技术的具体步骤如图1所示,包括如下:
[0054]步骤一:底层数据提取:数据采集,数据抽取,数据清洗,数据转换,数据存储的过程。
[0055]1.1、多维度数据采集:
[0056]多维度数据采集渠道包括统计年鉴数据、政府工作报告、业务系统数据、网站发布的环境、资源、人口、经济指标等。不同渠道的采集方式不同,如针对统计年鉴数据、政府工作报告,使用数据管理程序进行指标数据的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多渠道数据融合的区域画像构建方法,其特征在于,包括:S1、通过多渠道采集区域的多维度数据并进行数据预处理;S2、对步骤S1预处理后的数据进行指标数据计算,确定不同指标体系的特征值;S3、基于步骤S2得到的特征值进行数据对比以及区域画像。2.根据权利要求1所述的基于多渠道数据融合的区域画像构建方法,其特征在于,步骤S1中所述区域的多维度数据包括区域资源、环境保护、区域人口、劳动资料、区域经济的统计数据;所述通过多渠道采集的方法包括根据统计年鉴数据,政府工作报告数据,业务系统数据,网站发布的环境、资源、人口、经济指标数据的各自更新频次进行周期性数据采集。3.根据权利要求1所述的基于多渠道数据融合的区域画像构建方法,其特征在于,步骤S1中所述数据预处理的方法包括数据抽取、数据清洗、数据转换、数据存储。4.根据权利要求1所述的基于多渠道数据融合的区域画像构建方法,其特征在于,步骤S2的具体方法包括:S201、分类分析:采用数量指标分组分析法,根据不同维度、不同数量级指标,分别采用单项式分组和组距式分组;根据数据特性不同,采用等距分组和不等距分组的分别处理;S201、聚类分析:通过对特定分析目的和发展视角所挑选出的指标变量进行聚类分析,把特定指标划分成几个具有明显特征区别的范围;S203、特征值提取:将步骤S201和S202的分析结果数据进行综合应用,对各不同维度、不同衡量单位、不同规模量级的宏观经济指标进行分析,提取出应用于区域画像需要的变量特征;对不同区域、相同级别、相同维度的指标使用同一特征值,以获得最佳展示效果。5.根据权利要求1所述的基于多渠道数据融合的区域画像构建方法,其特征在于,步骤S3的具体方法包括:S301、基本维度对比:定义一个维度进行数据对比分析,常用一维分类;S302、横向对比:对于固定时间范围不同区域的一个或一组数据指标进行对比;S303、纵向对比:对于固定区域不同时间范围的一个或一组数据指标进行对比;S304、区域画像:不同分类的指标用不同位置和不同颜色表示以示区分,每个分类用一个关键指标通过加粗的方式重点显示,以每个分类的关键指标作为依据,画连接线将关键指标进行连接,产生区域画像轮廓;S305、区域分析:对区域的5个维度进行综合分析,按照维度的相互关系进行关联分析,挖掘区域经济发展要素...

【专利技术属性】
技术研发人员:李明权伺彦伟刘欢欢白文霞张晓马军肖周江涛宿增寿陈扬徐爱华
申请(专利权)人:河北航天信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1