基于大数据城市指标知识图谱的数据处理方法技术

技术编号:40661656 阅读:21 留言:0更新日期:2024-03-18 18:54
本发明专利技术实施例公开了一种基于大数据城市指标知识图谱的数据处理方法,包括:获取目标地区多个历史年份的城市宏观大数据,生成原始指标集;从原始指标集中选取优先级最高的第一城市指标,并确定以所述第一城市指标为前置指标的各第二城市指标,从而生成可用指标集;在所述可用指标集内逐次抽取多个指标组合,分别学习同一年份内各指标组合与所述第一城市指标间的数据关系,确定最佳指标组合和最佳数据模型;返回所述选取第一城市指标的操作,直到所述原始指标集中的城市指标均选取;根据各城市指标对应的最佳指标组合和最佳数据模型,构建以各城市指标为节点的知识图谱。本实施例通过量化形式明确大量城市指标之间的复杂数据关系。

【技术实现步骤摘要】

本专利技术实施例涉及数据挖掘,尤其涉及一种基于大数据城市指标知识图谱的数据处理方法


技术介绍

1、城市宏观静态数据挖掘,是指将数据挖掘方法应用于城市宏观静态数据,揭示城市数据的特征和规律,为城市建设、决策提供数据支撑。

2、当前主流的城市宏观静态数据挖掘手段包括以下几种:

3、数据可视化:将城市的宏观静态数据以图表、地图等形式进行可视化展示,以便直观地理解和分析城市情况。

4、各类统计分析方法:通过统计方法对城市宏观静态数据进行分析,揭示城市数据之间的相关性和规律。

5、各类数据挖掘算法:利用数据挖掘算法对城市宏观静态数据进行深入挖掘,发现隐藏在城市数据中的模式、关联和规律。

6、这些技术手段的共性问题是:所揭示的城市数据特征和数据规律碎片化、结构小,仅涉及单一城市指标或少量城市指标,不能系统性反映大量城市数据的全貌特征和复杂关系。比如,仅能得出与城市基础设施相关的几个因素,当涉及到能源、交通、运输等多类因素时,则无法反映大量城市指标之间的数据关系。


<b>技术实现思路...

【技术保护点】

1.一种基于大数据城市指标知识图谱的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每次循环迭代选取的第一城市指标及其对应的最佳指标组合存储于关系树内;

3.根据权利要求2所述的方法,其特征在于,每次循环迭代生成的第二城市指标存储于第二指标集合;

4.根据权利要求1所述的方法,在所述可用指标集内逐次抽取多个指标组合,基于所述城市宏观大数据构建样本库,分别学习同一年份内各指标组合与所述第一城市指标间的数据关系,并根据学习误差确定用于计算所述第一城市指标的最佳指标组合和最佳数据模型,包括:

5.根据权利要求4所述的方...

【技术特征摘要】

1.一种基于大数据城市指标知识图谱的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每次循环迭代选取的第一城市指标及其对应的最佳指标组合存储于关系树内;

3.根据权利要求2所述的方法,其特征在于,每次循环迭代生成的第二城市指标存储于第二指标集合;

4.根据权利要求1所述的方法,在所述可用指标集内逐次抽取多个指标组合,基于所述城市宏观大数据构建样本库,分别学习同一年份内各指标组合与所述第一城市指标间的数据关系,并根据学习误差确定用于计算所述第一城市指标的最佳指标组合和最佳数据模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述训练完毕后,选取误差最小且大于设定阈值的指标组合和数据模型,作为用于计算...

【专利技术属性】
技术研发人员:范小勇常方哲张羽王聃同高煦明秦坤潘显豪韩瑞东许瑞宁刘雪飞孙旭冯烁
申请(专利权)人:河北省交通规划设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1