数据挖掘系统及方法技术方案

技术编号:24036634 阅读:12 留言:0更新日期:2020-05-07 02:05
本发明专利技术涉及数据挖掘系统及方法,属于数据挖掘技术领域;所述数据采集单元通过互联网与各大可公开的共享平台连接;所述数据采集单元与数据暂存单元相互配合;所述数据筛选单元与数据分类单元相互配合;所述数据分类单元分别与数据阶段隔离单元、数据重叠处理单元连接;所述数据阶段隔离单与存储单元相互连接,所述数据阶段隔离单元中设有新数据融合单元、新数据替代单元;且缓冲数据清理单元、缓冲数据存储单元与新数据融合单元、新数据替代单元、存储单元连接;数据的收集比较全面,且分领域收集有利于后续的数据筛查;数据按照等级进行划分,按照领域进行划分,后续还按照时间和空间进行隔离存储;系统中可对数据内部整个进行缓冲数据的处理,以及数据补偿处理。

Data mining system and method

【技术实现步骤摘要】
数据挖掘系统及方法
本专利技术涉及数据挖掘系统及方法,属于数据挖掘

技术介绍
数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Associationrulelearning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。在人工智能领域,习惯上又称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。数据挖掘可以与用户或知识库交互。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的步骤会随不同领域的应用而有所变化,每一种数据挖掘技术也会有各自的特性和使用步骤,针对不同问题和需求所制定的数据挖掘过程也会存在差异。此外,数据的完整程度、专业人员支持的程度等都会对建立数据挖掘过程有所影响。这些因素造成了数据挖掘在各不同领域中的运用、规划,以及流程的差异性,即使同一产业,也会因为分析技术和专业知识的涉入程度不同而不同,因此对于数据挖掘过程的系统化、标准化就显得格外重要。如此一来,不仅可以较容易地跨领域应用,也可以结合不同的专业知识,发挥数据挖掘的真正精神。
技术实现思路
本专利技术的目的在于针对现有技术的缺陷和不足,提供一种数据挖掘系统及方法,数据的收集比较全面,且分领域收集有利于后续的数据筛查;数据按照等级进行划分,按照领域进行划分,后续还按照时间和空间进行隔离存储;系统中可对数据内部整个进行缓冲数据的处理,以及数据补偿处理;前后期军队数据进行筛查分类,便于操作时数据的准确挖掘。为实现上述目的,本专利技术采用的技术方案是:所述数据挖掘系统它包含数据采集单元、数据筛选单元、数据分类单元、数据阶段隔离单元、数据重叠处理单元、数据补偿处理单元、缓冲数据清理单元、缓冲数据存储单元、新数据融合单元、新数据替代单元、存储单元、数据统一整合单元、数据输出单元、数据暂存单元;所述数据采集单元通过互联网与各大可公开的共享平台连接;所述数据采集单元与数据暂存单元相互配合;所述数据筛选单元与数据分类单元相互配合;所述数据分类单元分别与数据阶段隔离单元、数据重叠处理单元连接;所述数据阶段隔离单与存储单元相互连接,所述数据阶段隔离单元中设有新数据融合单元、新数据替代单元;所述数据重叠处理单元、数据补偿处理单元相互配合;所述缓冲数据清理单元、缓冲数据存储单元相互配合,且缓冲数据清理单元、缓冲数据存储单元与新数据融合单元、新数据替代单元、存储单元连接;所述数据统一整合单元与数据补偿处理单元和新数据替代单元连接;所述数据输出单元与数据统一整合单元连接。作为优选,所述数据采集单元与各大可公开的共享平台存储系统连接,在采集数据时,根据各大共享平台的规则进行过滤性数据采集。作为优选,所述数据筛选单元根据系统需要进行筛查,并将所有数据分为不同的筛选等级,优质数据模块、中级数据模块、低级数据模块、次级数据模块。作为优选,所述数据分类单元根据类别进行分类,所述类别为不同领域的类别。作为优选,所述数据阶段隔离单元为时间阶段隔离或区域隔离。作为优选,所述新数据融合单元、新数据替代单元与缓冲数据清理单元、缓冲数据存储单元相互配合,所述缓冲数据清理单元、缓冲数据存储单元、新数据融合单元、新数据替代单元均与数据阶段隔离单元、数据重叠处理单元连接,且缓冲数据清理单元、缓冲数据存储单元、新数据融合单元、新数据替代单元与数据分类单元连接,数据在更替后通过数据分类单元重新分类,并重新规划等级。作为优选,所述数据暂存单元为数据替换前后的新旧数据对比存档。作为优选,所述数据统一整合单元为数据在替换后的全新数据整合模块。作为优选,所述数据重叠处理单元与数据阶段隔离单元相互配合,且数据重叠处理单元与缓冲数据清理单元、缓冲数据存储单元连接,可以筛掉多余的重复的数据,并将重叠数据存储在缓冲存储单元。作为优选,所述数据补偿处理单元与数据筛选单元、数据分类单元、数据阶段隔离单元连接,补偿处理是通过筛选、分类或时间空间上的查漏补缺,即从不同的角度去补充得到的数据漏洞。本专利技术所述数据挖掘系统的操作方法是:先粗略的收集所有相关数据--将所有数据存储--对数据进行筛选分类--对数据进行阶段隔离存储--重叠和补偿处理相关数据--新数据的融合与替代--缓冲数据的清理与存储--数据统一整合--数据输出。本专利技术所述的数据挖掘系统及方法,具有以下有益效果:1、数据的收集比较全面,且分领域收集有利于后续的数据筛查;2、数据按照等级进行划分,按照领域进行划分,后续还按照时间和空间进行隔离存储;3、系统中可对数据内部整个进行缓冲数据的处理,以及数据补偿处理;4、前后期军队数据进行筛查分类,便于操作时数据的准确挖掘;5、设计合理,将所有数据优化处理,且在每一数据挖掘阶段均可优化处理,达到较好的数据挖掘准度;6、适用的领域广泛,便于推广应用。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术的系统框图;图2是本专利技术的操作方法流程图;附图标记说明:数据采集单元1、数据筛选单元2、数据分类单元3、数据阶段隔离单元4、数据重叠处理单元5、数据补偿处理单元6、缓冲数据清理单元7、缓冲数据存储单元8、新数据融合单元9、新数据替代单元10、存储单元11、数据统一整合单元12、数据输出单元13、数据暂存单元14。具体实施方式下面结合附图对本专利技术作进一步的说明。参看如图1所示,它包含数据采集单元1、数据筛选单元2、数据分类单元3、数据阶段隔离单元4、数据重叠处理单元5、数据补偿处理单元6、缓冲数据清理单元7、缓冲数据存储单元8、新数据融合单元9、新数据替代单元10、存储单元11、数据统一整合单元12、数据输出单元13、数据暂存单元14;所述数据采集单元1通过互联网与各大可公开的共享平台连接;所述数据采集单元1与各大可公开的共享平台存储系统连接,在采集数据时,根本文档来自技高网
...

【技术保护点】
1.数据挖掘系统及方法,其特征在于:所述数据挖掘系统它包含数据采集单元、数据筛选单元、数据分类单元、数据阶段隔离单元、数据重叠处理单元、数据补偿处理单元、缓冲数据清理单元、缓冲数据存储单元、新数据融合单元、新数据替代单元、存储单元、数据统一整合单元、数据输出单元、数据暂存单元;所述数据采集单元通过互联网与各大可公开的共享平台连接;所述数据采集单元与数据暂存单元相互配合;所述数据筛选单元与数据分类单元相互配合;所述数据分类单元分别与数据阶段隔离单元、数据重叠处理单元连接;所述数据阶段隔离单与存储单元相互连接,所述数据阶段隔离单元中设有新数据融合单元、新数据替代单元;所述数据重叠处理单元、数据补偿处理单元相互配合;所述缓冲数据清理单元、缓冲数据存储单元相互配合,且缓冲数据清理单元、缓冲数据存储单元与新数据融合单元、新数据替代单元、存储单元连接;所述数据统一整合单元与数据补偿处理单元和新数据替代单元连接;所述数据输出单元与数据统一整合单元连接。/n

【技术特征摘要】
1.数据挖掘系统及方法,其特征在于:所述数据挖掘系统它包含数据采集单元、数据筛选单元、数据分类单元、数据阶段隔离单元、数据重叠处理单元、数据补偿处理单元、缓冲数据清理单元、缓冲数据存储单元、新数据融合单元、新数据替代单元、存储单元、数据统一整合单元、数据输出单元、数据暂存单元;所述数据采集单元通过互联网与各大可公开的共享平台连接;所述数据采集单元与数据暂存单元相互配合;所述数据筛选单元与数据分类单元相互配合;所述数据分类单元分别与数据阶段隔离单元、数据重叠处理单元连接;所述数据阶段隔离单与存储单元相互连接,所述数据阶段隔离单元中设有新数据融合单元、新数据替代单元;所述数据重叠处理单元、数据补偿处理单元相互配合;所述缓冲数据清理单元、缓冲数据存储单元相互配合,且缓冲数据清理单元、缓冲数据存储单元与新数据融合单元、新数据替代单元、存储单元连接;所述数据统一整合单元与数据补偿处理单元和新数据替代单元连接;所述数据输出单元与数据统一整合单元连接。


2.根据权利要求1所述的数据挖掘系统及方法,其特征在于:所述数据采集单元与各大可公开的共享平台存储系统连接,在采集数据时,根据各大共享平台的规则进行过滤性数据采集。


3.根据权利要求1所述的数据挖掘系统及方法,其特征在于:所述数据筛选单元根据系统需要进行筛查,并将所有数据分为不同的筛选等级,优质数据模块、中级数据模块、低级数据模块、次级数据模块。


4.根据权利要求1所述的数据挖掘系统及方法,其特征在于:所述数据分类单元根据类别进行分类,所述类别为不同领域的类别。


5.根据权利要求1所述的数据挖掘系统及方法,其特征在于:所述数据阶段隔离单元为...

【专利技术属性】
技术研发人员:王志利
申请(专利权)人:江苏泰盈信息服务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1