The invention discloses a large data statistical analysis system, which includes target data acquisition module, data processing module, data standardization module, data recognition and classification module, data statistical analysis module, graphics drawing module, data visualization analysis module and data positioning module. The invention aims at data mining based on target data acquisition module, and then preprocesses data based on Hadoop's fast attribute reduction algorithm of rough set, which improves the analysis efficiency of large-scale data, thus transforming numerous and diverse massive data into available data with information and commercial value, and realizes data visualization analysis based on Tableau Desktop. Thus, the calculation and acquisition of multiple target data are realized, which greatly facilitates the use of staff.
【技术实现步骤摘要】
一种大数据统计分析系统
本专利技术涉及数据分析领域,具体涉及一种大数据统计分析系统。
技术介绍
大数据、云计算、“互联网+”已成为创新发展的新趋势,在大数据条件下,,企业需具备在第一时间洞察数据的变化、感知有问题的数据,并提供有效的安全策略的能力。企业的每个系统就会产生成千上万的数据,虽然现在有很多传统的日志或者其他专业工具能够帮助企业分析这些数据,而传统的安全产品工具却不能给我们带来效率,来自传统IPS/IDS、防火墙/UTM、AV、日志系统的各类信息每天高达数千万条,但传统的产品工具对数据的处理目前仅仅停留在各自割裂的、独立的、简易的图表与简单列示查询的方式,这些数据还没有很好的呈现为可视化的关联,关键数据的提取与关联要靠人工进行逐条甄别。鉴于此,迫切需要设计一种可实现数据自动获取识别分析处理的系统。
技术实现思路
为解决上述问题,本专利技术提供了一种大数据统计分析系统,基于目标数据采集模块进行数据的针对性挖掘,然后基于Hadoop的粗糙集快速属性约简算法进行数据的预处理,提高了大规模数据的分析效率,从而可以将纷繁多样的海量数据转换成具有信息和商业价值的可用数据,基于TableauDesktop实现了数据的可视化分析,从而实现了多种目标数据的计算获取,大大方便了工作人员的使用。为实现上述目的,本专利技术采取的技术方案为:一种大数据统计分析系统,包括:目标数据采集模块,用于进行目标数据的采集;数据处理模块,采用基于Hadoop的粗糙集快速属性约简算法对目标数据进行预处理;数据标准化模块,基于BP神经网络模对完成预处理的目标数据进行标准化处理;数据识别分类模块 ...
【技术保护点】
1.一种大数据统计分析系统,其特征在于,包括:目标数据采集模块,用于进行目标数据的采集;数据处理模块,采用基于Hadoop的粗糙集快速属性约简算法对目标数据进行预处理;数据标准化模块,基于BP神经网络模对完成预处理的目标数据进行标准化处理;数据识别分类模块,基于BP神经网络模型根据特征数据对完成标准化处理的数据进行识别分类;数据统计分析模块,基于数据识别分类模块的识别分类结果进行对应数据统计模型、数据分析模型的调用,并输出对应的统计结果、分析结果;图形绘制模块,用于根据完成标准化处理后的数据生成各种曲线图。
【技术特征摘要】
1.一种大数据统计分析系统,其特征在于,包括:目标数据采集模块,用于进行目标数据的采集;数据处理模块,采用基于Hadoop的粗糙集快速属性约简算法对目标数据进行预处理;数据标准化模块,基于BP神经网络模对完成预处理的目标数据进行标准化处理;数据识别分类模块,基于BP神经网络模型根据特征数据对完成标准化处理的数据进行识别分类;数据统计分析模块,基于数据识别分类模块的识别分类结果进行对应数据统计模型、数据分析模型的调用,并输出对应的统计结果、分析结果;图形绘制模块,用于根据完成标准化处理后的数据生成各种曲线图。2.如权利要求1所述的一种大数据统计分析系统,其特征在于,所述数据标准化模块采用PCA-BP神经网络模型。3.如权利要求1所述的一种大数据统计分析系统,其特征在于,还包括一数据可视化分析模块,基于完成标准化处理后的数据通过TableauDesktop实现数据的可视化分析。4.如权利要求1所述的一种大数据统计分析系统,其特征在于,还包括一数据定位模块,基于完成识别分类...
【专利技术属性】
技术研发人员:滕飞,杜金涛,陆媛媛,王晓红,滕佳含,王红宇,
申请(专利权)人:吉林师范大学,
类型:发明
国别省市:吉林,22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。