基于聚类的空间大数据挖掘系统技术方案

技术编号:22055155 阅读:39 留言:0更新日期:2019-09-07 15:13
本发明专利技术公开了一种基于聚类的空间大数据挖掘系统,该系统包括:数据访问模块、聚类模块、用户交互模块及知识库管理模块;其中,所述数据访问模块负责提供数据访问功能,可作为所述聚类模块及所述用户交互模块两者数据访问接口,同时完成对空间数据库中异构、异质数据的访问;所述聚类模块负责接受所述用户交互模块的数据挖掘任务请求并分析,通过所述数据访问模块获取相应数据并完成聚类分析,最后将相应模型传回给所述用户交互模块;所述用户交互模块负责帮助用户完成选择数据挖掘算法、建模、加载训练数据,完成预测的交互过程;所述知识库管理模块在所述聚类模块及所述用户交互模块之间提供一个透明接口,为空间决策提供有力支持。

Clustering-based Spatial Large Data Mining System

【技术实现步骤摘要】
基于聚类的空间大数据挖掘系统
本专利技术属于大数据挖掘
,涉及一种基于聚类的空间大数据挖掘系统。
技术介绍
随着近几年来土地利用面积的增长越来越快,预测今后几年土地利用情况会更多,但就目前的土地利用情况来说,还存在着不少土地空间资源浪费以及许多土地得不到有效管理的问题。传统的资源管理系统存在着若干问题,例如,数据处理及基础空间还需要很多人机交互的处理工作,平台之间的集成程度、智能水平还不高,系统开发的周期和工作量大,不能科学地为决策者提供决策支持等。因此,社会迫切需要研究出一种高效的人机交互处理且具有高水平人工智能的系统,为土地规划决策者提供一个智能分析工具并借此准确预测未来几年土地利用的发展趋势,从而有效地进行土地规划,提高土地利用率,增加土地的产出。
技术实现思路
本专利技术目的在于提供一种基于聚类的空间大数据挖掘系统,针对传统系统的数据处理和基础空间还需要很多人机交互处理工作、平台之间的集成程度、智能水平还不高,系统开发周期与工作量大,以及不能科学地为决策者提供决策支持等问题,通过利用GIS技术,依据聚类算法并根据发现的知识/规则、建立GIS分析工具的方式,一方面有效地提高GIS的智能化水平,另一方面也为今后地进一步分析、预测类似的数据提供支持,有效地进行了合理的土地规划,提高了土地利用率,增加了土地的产出。为解决上述技术问题,本专利技术采用如下的技术方案:一种基于聚类的空间大数据挖掘系统,该系统包括:数据访问模块、聚类模块、用户交互模块及知识库管理模块;其中,所述数据访问模块负责提供数据访问功能,可作为所述聚类模块及所述用户交互模块两者数据访问接口,同时完成对空间数据库中异构、异质数据的访问;所述聚类模块负责接受所述用户交互模块的数据挖掘任务请求并分析,通过所述数据访问模块获取相应数据并完成聚类分析,最后将相应模型传回给所述用户交互模块;所述用户交互模块负责帮助用户完成选择数据挖掘算法、建模、加载训练数据,完成预测的交互过程;所述知识库管理模块在所述聚类模块及所述用户交互模块之间提供一个透明接口,使用户能够利用得到的知识及时分析、预测,为空间决策提供有力支持。进一步地,所述聚类模块包括聚类分析算法插件、任务调度、模型处理等部分。进一步地,所述用户交互模块包括数据收集/查询编辑、模式表示、聚类原语操作、其他操作等功能。进一步地,所述知识库主要由前提、结论及规则组合;其中,前提和结论为维护知识库的一致性和完整性而设置的,规则是知识库的核心和主体。本专利技术与现有技术相比具有以下的有益效果:本专利技术方案针对传统系统的数据处理和基础空间还需要很多人机交互处理工作、平台之间的集成程度、智能水平还不高,系统开发周期与工作量大,以及不能科学地为决策者提供决策支持等问题,通过利用GIS技术,依据聚类算法并根据发现的知识/规则、建立GIS分析工具的方式,一方面有效地提高GIS的智能化水平,另一方面也为今后地进一步分析、预测类似的数据提供支持,有效地进行了合理的土地规划,提高了土地利用率,增加了土地的产出。附图说明图1是基于聚类的空间大数据挖掘系统的整体框架图。图2是基于聚类的空间大数据挖掘系统的数据访问模块结构示意图。图3是基于聚类的空间大数据挖掘系统的聚类模块结构示意图。图4是基于聚类的空间大数据挖掘系统的用户交互模块结构示意图。图5是基于聚类的空间大数据挖掘系统的知识库管理模块结构示意图。具体实施方式下面结合附图及具体实施例对本专利技术进行更加详细与完整的说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。参照图1,本专利技术一种基于聚类的空间大数据挖掘系统,该系统包括:数据访问模块、聚类模块、用户交互模块及知识库管理模块;其中,所述数据访问模块负责提供数据访问功能,可作为所述聚类模块及所述用户交互模块两者数据访问接口,同时完成对空间数据库中异构、异质数据的访问;所述聚类模块负责接受所述用户交互模块的数据挖掘任务请求并分析,通过所述数据访问模块获取相应数据并完成聚类分析,最后将相应模型传回给所述用户交互模块;所述用户交互模块负责帮助用户完成选择数据挖掘算法、建模、加载训练数据,完成预测的交互过程;所述知识库管理模块在所述聚类模块及所述用户交互模块之间提供一个透明接口,使用户能够利用得到的知识及时分析、预测,为空间决策提供有力支持。首先,数据访问模块主要采用OLEDB技术,完成对空间数据库中异构、异质数据的访问。当访问数据是土地利用数据库时,通过选定的算法,从中找出具有相似土地用途的区域,以便于土地规划,提高土地利用率,增加土地的产出。n维空间的一个点被称为方格(数据立方体),每个方格中存储了其对应的空间信息和属性信息。数据立方体是数据仓库中多维模型的核心,其技术是联机分析处理的核心技术。参照图2,聚类模块包括聚类分析算法插件、任务调度、模型处理等部分;其中,任务调度子模块是流程处理的核心。它接受用户交互模块的数据挖掘任务请求,对该任务加以分析,调用相应的基于聚类分析算法插件,并根据算法插件的要求,通过数据访问模块获取相应数据传回算法插件完成土地利用数据库的聚类分析,最后根据运算结果对该任务对应的数据挖掘模型加以增加、修改、删除、保存等处理,并将相应模型(也可能是预测结果)传回给所述用户交互模块。数据挖掘模型是利用算法在对一组数据分析之后得到的聚集的描述,即规则/知识,方便用户对聚类模型的浏览和查询。参照图3,用户交互模块即数据挖掘系统的GUI界面。包括数据收集/查询编辑、模式表示、聚类原语操作、其他操作等部分。其中,数据收集/查询编辑定义数据挖掘任务相关的训练数据和预测数据用例,进行数据挖掘查询,将数据访问模块的逻辑体现给用户,并根据该逻辑生成算法插件能够识别的数据挖掘聚类原语。模式表示将土地利用聚类结果以人脑可理解的形式展示给用户,构造简单易懂的交互过程,帮助用户完成选择数据挖掘算法、建模、加载训练数据,完成预测的交互过程。将训练数据之间的关系、规则等用图表给出位置的分布。聚类原语操作允许动态地选择数据挖掘聚类算法、调整数据挖掘各输入的权重、修改模型描述、修改已经定义的数据挖掘查询或条件。其他操作包括结果存储、查看知识库(或称数据字典)、联机帮助等。参照图4,知识库管理模块主要功能是在聚类模块和用户交互模块之间提供一个透明接口,使用户能够利用得到的知识及时地对空间数据进行分析、预测,为空间决策提供有力支持。知识库主要由前提、结论和规则3部分组成,前提和结论为维护知识库的一致性和完整性而设置的,规则是知识库的核心和主体。这样,一条规则可描述为如下形式:IF条件项THEN结论项。由聚类算法生成的知识(或模式)组成领域知识库。对于用户来说,应用领域的专家知识知道得越多,对手头数据了解得越多,用户越能成功地评估它的真实结构,从而也越能作出正确的决策。基于聚类的空间大数据挖掘系统的主要特点如下:(1)数据仓库中数据的高质量。利用聚类分析进行数据清理、数据变换和数据集成的预处理过程,构造的空间数据库可为空间数据挖掘提供高质量的、有价值的数据源。(2)算法插件。每一个算法插件是一个基于“即插即用”思想的、符合规范的动态连接库。算法可增加分类、序列、关联等任意种类。这些数据挖掘算法被封装在具有统一的属性本文档来自技高网...

【技术保护点】
1.基于聚类的空间大数据挖掘系统,其特征在于,所述系统包括:数据访问模块、聚类模块、用户交互模块及知识库管理模块;其中,所述数据访问模块负责提供数据访问功能,可作为所述聚类模块及所述用户交互模块两者数据访问接口,同时完成对空间数据库中异构、异质数据的访问;所述聚类模块负责接受所述用户交互模块的数据挖掘任务请求并分析,通过所述数据访问模块获取相应数据并完成聚类分析,最后将相应模型传回给所述用户交互模块;所述用户交互模块负责帮助用户完成选择数据挖掘算法、建模、加载训练数据,完成预测的交互过程;所述知识库管理模块在所述聚类模块及所述用户交互模块之间提供一个透明接口,使用户能够利用得到的知识及时分析、预测,为空间决策提供有力支持。

【技术特征摘要】
1.基于聚类的空间大数据挖掘系统,其特征在于,所述系统包括:数据访问模块、聚类模块、用户交互模块及知识库管理模块;其中,所述数据访问模块负责提供数据访问功能,可作为所述聚类模块及所述用户交互模块两者数据访问接口,同时完成对空间数据库中异构、异质数据的访问;所述聚类模块负责接受所述用户交互模块的数据挖掘任务请求并分析,通过所述数据访问模块获取相应数据并完成聚类分析,最后将相应模型传回给所述用户交互模块;所述用户交互模块负责帮助用户完成选择数据挖掘算法、建模、加载训练数据,完成预测的交互过程;所述知识库管理模块在所述聚类模块及所述用户交互模...

【专利技术属性】
技术研发人员:徐继峰周峻松祁建明陈墩金
申请(专利权)人:广州明领基因科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1