一种区域经济城市指数自动化生成方法及系统技术方案

技术编号:34899454 阅读:15 留言:0更新日期:2022-09-10 14:01
本发明专利技术公开了一种区域经济城市指数自动化生成方法及系统,将区域经济指数的计算过程分模块设计,计算过程自动化实现,减少其他软件的学习成本;对数据进行自动清洗,减少数据清洗处理时间和难度;将计算结果可视化展示,能实现指数发布地区和时间序列的结合。能实现指数发布地区和时间序列的结合。能实现指数发布地区和时间序列的结合。

【技术实现步骤摘要】
一种区域经济城市指数自动化生成方法及系统


[0001]本专利技术涉及数据处理
,具体涉及一种区域经济城市指数自动化生成方法及系统。

技术介绍

[0002]经济学有各种指数发布,指数本身不是统计数据,而是通过一些原始数据在一定的理论基础下,通过一定的公式计算得到的数据。目前应用最广泛的是在金融股票类方面,由沪深指数等,而区域经济指数的发布则是大多数应用于经济学研究,但是目前市面上均以发布指数为主,公布的区域经济指数都是不连续的面板数据(非时间序列),也就是公布某一年的一些地区的指数排名,并且这些指数的计算过程中使用的统计学或者软件也是多样化,市面上并没有一个专门的系统用来计算指数,目前对于区域经济的研究则是更多的发布各种城市指数,通过城市排名展示区域经济发展水平。

技术实现思路

[0003]为此,本专利技术提供一种区域经济城市指数自动化生成方法及系统,以实现区域经济城市指数的自动化生成以及可视化展示。
[0004]为了实现上述目的,本专利技术提供如下技术方案:
[0005]根据本专利技术实施例的第一方面,提出了一种区域经济城市指数自动化生成方法,所述方法包括:
[0006]用户上传数据,根据输入的数据选择不同指数层级下的指标;
[0007]根据选择的指标判断数据是否存在缺失值,若存在,则对缺失值进行补充;
[0008]对数据进行标准化处理,并根据预设指数计算方法进行指数计算;
[0009]对计算得到的指数进行智能分析和可视化展示。
[0010]进一步地,所述方法还包括:
[0011]指数框架设置,包括根据子指数的个数将指数分成多个指数层级,并设置每个层级的指标名称。
[0012]进一步地,所述方法还包括:
[0013]选择指标时将指标拖入不同子指数的正向指标框或负向指标框。
[0014]进一步地,根据选择的指数判断数据是否存在缺失值,具体还包括:
[0015]若存在缺失值,则用户选择数据的类型,包括时间序列数据和非时间序列数据,并根据定性数据含有缺失值或定量数据含有缺失值,选择对应数据处理方式,包括删除缺失指数或者对缺失值进行补充,补充方法包括根据默认方法或者自选方法进行填充。
[0016]进一步地,对缺失值进行补充,具体包括:
[0017]区分缺失数据为定性数据还是定量数据;
[0018]对于定性数据,利用众数填充缺失值;
[0019]对于定量数据,遵循以下步骤:
[0020]首先删除确实比例大于50%的指标;
[0021]然后判断数据集的类型:
[0022]对于非时间序列数据,用热卡填充算法对缺失数据进行填充;
[0023]对于时间序列数据:
[0024]首先按照取值范围统计含有缺失值的指标,并记录每种取值范围下的指标个数;若某区间中的指标个数大于1,用随机森林插补算法进行插补;若某区间中的指标个数=1,如果前3行数据中包含缺失值,处理方法是直接用非缺失值的均值填充,其他缺失数据用移动平均法进行填充,移动步数为3。
[0025]进一步地,所述数据补充方法包括插值法、近邻插补、均值插补、移动平均插补、多变量插补。
[0026]进一步地,所述指数计算方法包括熵权法、优劣解距离法。
[0027]进一步地,所述方法还包括:
[0028]根据指数计算方法计算每个子指数,并对每个子指数的计算结果进行汇总计算得到总指数。
[0029]所述方法还包括:
[0030]对历史分析结果进行汇总比对,并实现指数发布地区和时间序列的结合。
[0031]根据本专利技术实施例的第二方面,提出了一种区域经济城市指数自动化生成系统,所述系统包括:
[0032]指标选择模块,用于用户上传数据,根据输入的数据选择不同指数层级下的指标;
[0033]数据补充模块,用于根据选择的指标判断数据是否存在缺失值,若存在,则对缺失值进行补充;
[0034]指数计算模块,用于对数据进行标准化处理,并根据预设指数计算方法进行指数计算;
[0035]报告生成模块,用于对计算得到的指数进行智能分析和可视化展示。
[0036]本专利技术具有如下优点:
[0037]本专利技术提出的一种区域经济城市指数自动化生成方法及系统,将区域经济指数的计算过程分模块设计,实现计算过程自动化实现,减少其他软件的学习成本;对数据进行自动清洗,减少数据清洗处理时间和难度;将计算结果可视化展示,实现指数发布地区和时间序列的结合。
附图说明
[0038]为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0039]图1为本专利技术实施例1提供的一种区域经济城市指数自动化生成方法的流程示意图;
[0040]图2为本专利技术实施例1提供的一种区域经济城市指数自动化生成方法中缺失值补充流程示意图。
具体实施方式
[0041]以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本专利技术的其他优点及功效,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0042]实施例1
[0043]如图1所示,本实施例提出了一种区域经济城市指数自动化生成方法,该方法包括:
[0044]S100、指数框架设置,包括根据子指数的个数将指数分成多个指数层级,并设置每个层级的指标名称。范围设置为2

4个层级,默认为3个层级。
[0045]S200、用户上传数据,根据输入的数据选择不同指数层级下的指标。
[0046]进一步地,该方法还包括:
[0047]两层结构:若只有“子指数1”中有指标,说明是两层结构。
[0048]三层结构:若不仅“子指数1”中有指标,“子指数2”、“子指数3”等也有指标,说明是三层结构。
[0049]选择指标时将指标拖入不同子指数的正向指标框或负向指标框。
[0050]S300、根据选择的指标判断数据是否存在缺失值,若存在,则对缺失值进行补充。
[0051]具体的,若存在缺失值,则用户选择数据的类型,包括时间序列数据和非时间序列数据,并根据定性数据含有缺失值或定量数据含有缺失值,选择对应数据处理方式,包括删除缺失指数或者对缺失值进行补充,补充方法包括根据默认方法或者自选方法进行填充。数据补充方法包括插值法、近邻插补、均值插补、移动平均插补、多变量插补等。
[0052]缺失值默认填充算法流程如图2所示,具体如下:
[0053]1、区分数据类型,是定量数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种区域经济城市指数自动化生成方法,其特征在于,所述方法包括:用户上传数据,根据输入的数据选择不同指数层级下的指标;根据选择的指标判断数据是否存在缺失值,若存在,则对缺失值进行补充;对数据进行标准化处理,并根据预设指数计算方法进行指数计算;对计算得到的指数进行智能分析和可视化展示。2.根据权利要求1所述的一种区域经济城市指数自动化生成方法,其特征在于,所述方法还包括:指数框架设置,包括根据子指数的个数将指数分成多个指数层级,并设置每个层级的指标名称。3.根据权利要求2所述的一种区域经济城市指数自动化生成方法,其特征在于,所述方法还包括:选择指标时将指标拖入不同子指数的正向指标框或负向指标框。4.根据权利要求1所述的一种区域经济城市指数自动化生成方法,其特征在于,根据选择的指数判断数据是否存在缺失值,具体还包括:若存在缺失值,则用户选择数据的类型,包括时间序列数据和非时间序列数据,并根据定性数据含有缺失值或定量数据含有缺失值,选择对应数据处理方式,包括删除缺失指数或者对缺失值进行补充,补充方法包括根据默认方法或者自选方法进行填充。5.根据权利要求1所述的一种区域经济城市指数自动化生成方法,其特征在于,对缺失值进行补充,具体包括:区分缺失数据为定性数据还是定量数据;对于定性数据,利用众数填充缺失值;对于定量数据,遵循以下步骤:首先删除确实比例大于50%的指标;然后判断数据集的类型:对于非时间序列数据,用热卡填充算法对缺失数据进行填充...

【专利技术属性】
技术研发人员:孙琴
申请(专利权)人:北京搜知数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1