一种安全生产大数据挖掘系统技术方案

技术编号:15299946 阅读:130 留言:0更新日期:2017-05-12 02:17
本发明专利技术涉及安全生产技术数据领域,特别涉及一种能够有效及时排查事故隐患、降低事故发生的安全生产大数据挖掘系统,其特征在于数据抽取模块,用于获取数据库中关键数据信息,对每个数据信息进行唯一的编号ID;数据预处理模块,用于对从数据库中获取的数据信息进行预处理的数据预处理模块;数据挖掘模块,用于对数据进行运算然后实现挖掘;数据结构分析模块,用于对数据挖掘模块挖掘出来的结果进行分析;结果输出,用于将分析后的结果显示输出。本发明专利技术与现有技术相比,能够减少人工的参与量,对事故隐患数据库中输入的数据进行多层面、全方位的挖掘处理,并将挖掘结果进一步结构分析后,进行分类、可视化等处理,具有高效率、高准确、高价值等优点。

A large data mining system for safety production

The invention relates to a safety production data field, in particular to a timely investigation of accidents, can effectively reduce production safety accident data mining system, which is characterized in that the data extraction module for obtaining key data information in the database, according to the information of each number number ID only; data preprocessing module, used to gets the data from the database information module of data pretreatment; data mining module used for data operation and implementation of mining; data structure analysis module for mining mining module data were analyzed; the results of the output, for the analysis of the results showed that the output of. Compared with the prior art, can reduce the artificial participation, multi-level, the input accident data in the database a full range of mining, mining and the results further structure analysis, classification and visualization processing, with high efficiency, high accuracy, high value etc..

【技术实现步骤摘要】

本专利技术涉及安全生产技术数据领域,特别涉及一种能够有效及时排查事故隐患、降低事故发生的安全生产大数据挖掘系统
技术介绍
近年来,随着信息技术的高速发展,数据量呈爆炸性增长。安全生产行业数据量增长也呈现出相似的态势,在数据增长过程中发生的事故隐患凸显严重,如何从海量数据中识别出有用的数据,分析潜在事故隐患,已经成为安全生产行业当务之急。目前,安全生产企业事故隐患排查工作主要靠人工,通过数据挖掘人员利用专业知识发现生产中存在的安全隐患,过程显得复杂,因此,这种方式易受到主观因素影响,且很难界定安全与危险状态,可靠性差。可见在整个数据挖掘过程中,由于安全生产事故隐患数据量大、数据类型繁多不一、价值密度低、处理速度慢,人工无法准确在当前条件下对数据内容进行检索和管理,缺乏对来自不同数据源的离散数据集中分析的问题,安全事件数据库信息难以人为管理。且每个数据库之间的衔接、数据传递和交互很容易出现问题,无法保证有价值的数据得到提取,且数据挖掘效率低。通过大数据挖掘系统预测隐患事故,防范事故发生是一个亟待解决的难题。如何实现高效率、高准确、高价值的大数据挖掘?提取有价值的信息?针对以上问题,本专利技术提供了一种安全生产大数据挖掘系统。
技术实现思路
现有安全生产事故隐患排查主要靠人工完成,通过数据挖掘人员利用专业知识发现生产中存在的安全隐患。面对海量数据,人工操作过程复杂,海量数据对比丧失正确性。无法正确的挖掘出有用的信息,很难界定隐患事故的安全与危险状态。针对以上问题,本专利技术提供一种安全生产大数据挖掘系统,以解决现有技术中数据挖掘过程中无法保证数据对比正确性及整个挖掘过程效率低的问题。本专利技术提供一种安全生产大数据挖掘系统,如图1所示大数据挖掘过程包括:数据抽取模块101,用于获取数据库中关键数据信息,对每个数据信息进行唯一的编号ID;数据预处理模块102,用于对从数据库中获取的数据信息进行预处理的数据预处理模块;数据挖掘模块103,用于对数据进行运算然后实现挖掘;数据分析模块104,用于对数据挖掘模块挖掘出来的结果进行分析;输出模块105,用于将分析后的结果显示输出。本专利技术所述数据抽取模块101,利用数据访问接口规定的数据源和访问方法,从不同的平台和不同的应用中抽取数据,存入系统中,为数据挖掘提供数据来源。采用任务平衡和多线程机制进行,并且在抽取到的数据上增加索引。本专利技术所述数据预处理模块102中包括用于填补遗漏的数据值、平滑有噪声的数据、识别或去除异常值的数据清理模块201;用于对数据信息进行编码处理,将数据库中字段的不同取值转换成数码形式,以便于搜索的数据转换模块202;用于将来自多个数据库数据合并到一起的数据集成模块203;用于在不影响最终挖掘结果的情况下减小数据挖掘的范围,以提高效率的数据规约模块204。本专利技术所述数据挖掘模块103设有加权平均法处理模块、卡尔曼滤波处理模块、统计决策处理模块以及神经网络处理模块。本专利技术所述数据分析模块104包括用于获取计算模型输出结果的数据取值模块;用于对数据取值模块获取数据进行有效范围选择的数据选择模块、用于对选择后数据进行聚类分配的聚类分配模块、用于对聚类分配后数据进行分析的数据分析模块以及用于输出数据分析结果的显示输出模块。本专利技术与现有技术相比,能够减少人工的参与量,对事故隐患数据库中输入的数据进行多层面、全方位的挖掘处理,并将挖掘结果进一步结构分析后,进行分类、可视化等处理,具有高效率、高准确、高价值等优点。通过本专利技术安全生产大数据挖掘系统对安全生产事件信息的收集整理、统一存储,从原始安全生产事件信息数据库中发掘高质量的安全数据信息,自动做出响应,根据事故隐患严重程度给用户提供最为准确的安全隐患信息,以最大化的减少隐患的危害对安全生产产生的负面影响。使用户能有效监控和管理其不断扩大的安全事故隐患,而无需配备更多专业安全人员。附图说明图1是根据本专利技术实施例提供的一种安全生产大数据挖掘的过程图。图2是根据本专利技术实施例提供的一种安全生产大数据挖掘预处理框架图。具体实施方式下文与图示本专利技术原理的附图一起提供对本专利技术一个或者多个实施例的详细描述。结合这样的实施例描述本专利技术,但是本专利技术不限于任何实施例。本专利技术的范围仅由权利要求书限定,并且本专利技术涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本专利技术的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本专利技术。下面结合附图对本专利技术作进一步的说明。如附图1大数据挖掘步骤所示,本专利技术提出了一种安全生产大数据挖掘系统,其特征在于数据抽取模块101,用于获取数据库中关键数据信息,对每个数据信息进行唯一的编号ID;数据预处理模块102,用于对从数据库中获取的数据信息进行预处理的数据预处理模块;数据挖掘模块103,用于对数据进行运算然后实现挖掘;数据分析模块104,用于对数据挖掘模块挖掘出来的结果进行分析;结果输出105,用于将分析后的结果显示输出。本专利技术所述数据抽取模块101,利用数据访问接口规定的数据源和访问方法,从不同的平台和不同的应用中抽取数据,存入系统中,为数据挖掘提供数据来源。采用任务平衡和多线程机制进行,并且在抽取到的数据上增加索引。本专利技术所述数据预处理模块102中包括用于填补遗漏的数据值、平滑有噪声的数据、识别或去除异常值的数据清理模块201;用于对数据信息进行编码处理,将数据库中字段的不同取值转换成数码形式,以便于搜索的数据转换模块202;用于将来自多个数据库数据合并到一起的数据集成模块203;用于在不影响最终挖掘结果的情况下减小数据挖掘的范围,以提高效率的数据约束模块204。所述数据清理模块201,填充缺失的值,光滑噪声并识别离群点,纠正数据库中数据的不一致性。第一步偏差检测,清理每个属性的定义域和数据类型、每个属性可接受的值、值的长度范围,查看是否所有的值都落在期望的值域内、属性之间是否存在已知的依赖;第二步纠正偏差,纠正数据的不一致。偏差检测与纠正偏差过程迭代执行。所述数据集成模块202,将多个数据库运行环境中的异构数据进行合并,存放在一致的数据库存储中,属性在不同的数据库中设置相同的名称;设置统一的属性定义域;给定每个属性数据类型和取值范围;给定所有的值都落在期望的值域。所述数据变换模块203,通过将数据库中属性值按比例缩放,使之落入一个特定区间,使用神经网络算法进行分类挖掘,对数据元组中量度的每个属性输入值进行规范化。所述数据规约模块204用于在不影响最终挖掘结果的情况下减小数据挖掘的范围,以提高挖掘效率。其中包括用于通过离散化数值属性以及泛化字符型属性值来规约数据库中元组的元组规约模块;用于在安全生产海量数据挖掘之前,对属性进行分析、删除与分析任务不相关或不重要属性的属性规约。本专利技术所述数据挖掘模块103设有加权平均法处理模块、卡尔曼滤波处理模块、统计决策处理模块以及神经网络处理模块。本专利技术所述数据分析模块104包括用于获取计算模型输出结果的数据取值模块;用于对数据取值模块获取数据进行有效范围选择的数据选择模块、用于对选择后数据进行聚类分配的聚类分配模块、用于对聚类分配后数据进行分析的数据分析模块以及用于输出数据分析结果的显示输出模块。显本文档来自技高网...
一种安全生产大数据挖掘系统

【技术保护点】
一种安全生产大数据挖掘系统,其特征在于数据抽取模块101,用于获取数据库中关键数据信息,对每个数据信息进行唯一的编号ID;数据预处理模块102,用于对从数据库中获取的数据信息进行预处理的数据预处理模块;数据挖掘模块103,用于对数据进行运算然后实现挖掘;数据分析模块104,用于对数据挖掘模块挖掘出来的结果进行分析;输出模块105,用于将分析后的结果显示输出。

【技术特征摘要】
1.一种安全生产大数据挖掘系统,其特征在于数据抽取模块101,用于获取数据库中关键数据信息,对每个数据信息进行唯一的编号ID;数据预处理模块102,用于对从数据库中获取的数据信息进行预处理的数据预处理模块;数据挖掘模块103,用于对数据进行运算然后实现挖掘;数据分析模块104,用于对数据挖掘模块挖掘出来的结果进行分析;输出模块105,用于将分析后的结果显示输出。2.根据权利要求1所述的一种安全生产大数据挖掘系统,其特征在于所述数据抽取模块101,利用数据访问接口规定的数据源和访问方法,从不同的平台和不同的应用中抽取数据,存入系统中,为数据挖掘提供数据来源;采用任务平衡和多线程机制进行,并且在抽取到的数据上增加索引。3.根据权利要求1所述的一种安全生产大数据挖掘系统,其特征在于所述数据预处理模块102中包括用于填补遗漏的数据值、平滑有噪声的数据、识别或去除异常值的数据清理模块201;用于对数据信息进行编码处理,将数据库中字段的不同取值转换成数码形式,以便于搜索的数据转换模块202;用于将来自多个数据库数据合并到一起的数据集成模块203;用于在不影响最终挖掘结果的情况下减小数据挖掘的范围,以提高效率的数据约束模块204。4.根据权利要求3所述一种安全生产大数据挖掘系统,其特征在于包括:数据清理模块201,填充缺失的值,光滑噪声并识别离群点,纠正数据库中数据的不一致性:第一步偏差检测,清理每个属性的定义域和数据类型、每个属性可...

【专利技术属性】
技术研发人员:陈德元王翔
申请(专利权)人:深圳市华威世纪科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1