当前位置: 首页 > 专利查询>新乡学院专利>正文

一种用于计算机大数据的高效批量处理方法技术

技术编号:31078027 阅读:35 留言:0更新日期:2021-12-01 11:30
本发明专利技术公开了一种用于计算机大数据的高效批量处理方法,涉及数据处理技术领域。本发明专利技术包括步骤一:通过数据采集系统采集用户数据,将采集到的文本、音频、视频以及图片数据导入至大型的分布式数据库中并进行备份源数据;步骤二:对采集到的数据通过数据分类模块进行分类;步骤三:对分类后的数据进行数据预处理,消除异常数据。本发明专利技术通过多个处理器同时处理分类好的数据,且某一个处理器处理完毕后,立刻协助处理其他未完成的处理器,多个处理器相互配合,从而达到一个高效的大数据处理效果,通过系统自身不断的改进优化,得到适合该用户的最优大数据模型,大数据处理能更加精确,解决了现有的大数据批量处理效率低,且处理准确度不高的问题。度不高的问题。

【技术实现步骤摘要】
一种用于计算机大数据的高效批量处理方法


[0001]本专利技术属于数据处理
,特别是涉及一种用于计算机大数据的高效批量处理方法。

技术介绍

[0002]大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,随着云时代的来临,大数据也吸引了越来越多的关注,大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值,批处理是目前大数据分析中对于数据处理的一种基本方法,所谓批处理也称为批处理脚本,是对某对象进行批量的处理,其目的是为了提高系统吞吐量和资源的利用率,目前的大数据批处理,是通过将大数据分批次在同一服务器上依次进行处理,当某一批次的数据处理完成后,另一批次的数据才能被处理,使得部分数据长时间处于等待处理的状态,影响了大数据的批处理进度,从而使大数据的批处理效率较低,大数据作为新的战略资源,在信息领域发挥着重要作用,大数据的检索规模往往达到十亿甚至百亿级,导致传统的查询机制效率低下成为常态,因此,提高大数据的查询效率,降低查询负担成为大数据研究的重要方面,因此有必要对现有技术进行改进,以解决上述问题。

技术实现思路

[0003]本专利技术的目的在于提供一种用于计算机大数据的高效批量处理方法,通过多个处理器同时处理分类好的数据,且某一个处理器处理完毕后,立刻协助处理其他未完成的处理器,多个处理器相互配合,从而达到一个高效的大数据处理效果,通过系统自身不断的改进优化,得到适合该用户的最优大数据模型,大数据处理能更加精确,解决了现有的大数据批量处理效率低,且处理准确度不理想的问题。
[0004]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0005]本专利技术为一种用于计算机大数据的高效批量处理方法,所述方法包括以下步骤:
[0006]步骤一:通过数据采集系统采集用户数据,将采集到的文本、音频、视频以及图片数据导入至大型的分布式数据库中并进行备份源数据,分布式存储提高存储效率,进而提高大数据的处理效率;
[0007]步骤二:对采集到的数据通过数据分类模块进行分类;
[0008]步骤三:对分类后的数据进行数据预处理,消除异常数据,并收集异常数据;
[0009]步骤四:通过处理模块对正常数据进行批量处理,将预处理好的数据通过各自的处理器进行处理,处理器处理时基于数据类型选择合适的大数据模型并调用,利用数据对模型进行计算,对模型参数优化和调整,优化完成后,通过优化后的若干个大数据模型对正
常数据进行处理,当某一个处理器完成数据处理后,通过进度检测模块检测其他处理器的处理进度,然后使已完成处理任务的处理器协助处理进度最慢的处理器工作,同样的,当第二个处理器完成数据处理后,通过进度检测模块检测其他处理器的处理进度,然后使已完成处理任务的处理器协助处理进度最慢的处理器,直至所有数据处理完毕;
[0010]步骤五:在对正常数据处理的同时对异常数据亦进行处理,处理方式同步骤四;
[0011]步骤六:处理好的正常数据和异常数据分布式存储在存储单元内,加密上传至云端,实现数据共享,并通过模型优化模块进一步对大数据模型进行优化,得到更加适合该用户数据的模型;
[0012]步骤七:对处理好的正常数据和异常数据分别进行可视化处理,得到相应的可视化的报表。
[0013]进一步地,所述步骤一中数据采集系统具体的采集方法包括:通过传感器、摄像头和其他智能终端自动采集信号、图片或录像来获取数据;通过网络爬虫或网站公开API等方式从网站上获取数据;通过导入历史数据库数据或对接第三方数据库数据。
[0014]进一步地,所述步骤二中数据分类过程具体包括:按照类别属性将采集到的数据分成文本、音频、视频以及图片四类,然后依据数据类型选择不同的方法,如定序分类法、定距分类法或定比分类法将每一类的数据再分成若干个小类。
[0015]进一步地,所述步骤三中数据预处理具体包括:基于统计模型估计缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来清理数据;通过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据处理的形式。
[0016]进一步地,所述步骤六中大数据模型优化的具体步骤包括:评估模型,通过留出法、N拆交叉验证法或过拟合法对常用指标如AUC、KS、误差率、错误率等进行计算;优化模型,根据计算的常用指标数值调整模型、优化公式、优化算法,得到适合该用户的最优大数据模型。
[0017]进一步地,所述步骤七中数据的可视化处理具体包括:处理好的数据根据数据的类型选择合适的图表并绘制成相应的二维或三维图形,所述二维图形包括柱状图、散点图、饼图、雷达图等动态交互的图形,所述三维图形包括3D航线图、3D散点图、3D柱图等3D动态图形,且该数据可视化处理过程亦可根据用户使用需求进行定制化的服务,如语音播报功能,处理好的数据经分析后得出最后的结论,并通过语音播报单元形成语音,以便用户收听。
[0018]本专利技术具有以下有益效果:
[0019]1、本专利技术通过多个处理器同时处理分类好的数据,且某一个处理器处理完毕后,立刻协助处理其他未完成的处理器,多个处理器相互配合,从而达到一个高效的大数据处理效果,且通过数据分类模块将大数据进行分类,分成若干个小类进一步提高数据处理效率。
[0020]2、本专利技术的大数据处理能更加精确,通过系统自身不断的改进优化,得到适合该用户的最优大数据模型,且各种数据采用不同的模型进行处理,故各种数据的处理亦更加精确。
[0021]3、本专利技术通过对数据进行可视化处理,使得用户可更加方便查看正常数据,从而方便得出结论,亦可根据异常数据,对设备进行改进。
[0022]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。
具体实施方式
[0023]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]实施例1
[0025]一种用于计算机大数据的高效批量处理方法在工业设备上的应用,包括以下步骤:
[0026]步骤一:通过数据采集系统采集工业设备的数据,如通过各个传感器监测设备的运行参数,电流、电压、温度、功率、热量、转速等,通过摄像头拍摄设备运行的图片,通过网络爬虫或网站公开API等方式从网站上获取该工业设备在其他地方的运行数据;通过导入该工业设备的历史数据库数据或对接第三方数据库数据,第三方数据库可为厂家、其他用户或同类产品等,将采集到的文本、音频、视频以及图片数据导入至大型的分布式数据库中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于计算机大数据的高效批量处理方法,其特征在于:所述方法包括以下步骤:步骤一:通过数据采集系统采集用户数据,将采集到的文本、音频、视频以及图片数据导入至大型的分布式数据库中并进行备份源数据;步骤二:对采集到的数据通过数据分类模块进行分类;步骤三:对分类后的数据进行数据预处理,消除异常数据,并收集异常数据;步骤四:通过处理模块对正常数据进行批量处理,将预处理好的数据通过各自的处理器进行处理,处理器处理时基于数据类型选择合适的大数据模型并调用,利用数据对模型进行计算,对模型参数优化和调整,优化完成后,通过优化后的若干个大数据模型对正常数据进行处理,当某一个处理器完成数据处理后,通过进度检测模块检测其他处理器的处理进度,然后使已完成处理任务的处理器协助处理进度最慢的处理器工作,同样的,当第二个处理器完成数据处理后,通过进度检测模块检测其他处理器的处理进度,然后使已完成处理任务的处理器协助处理进度最慢的处理器,直至所有数据处理完毕;步骤五:在对正常数据处理的同时对异常数据亦进行处理,处理方式同步骤四;步骤六:处理好的正常数据和异常数据分布式存储在存储单元内,加密上传至云端,实现数据共享,并通过模型优化模块进一步对大数据模型进行优化,得到更加适合该用户数据的模型;步骤七:对处理好的正常数据和异常数据分别进行可视化处理,得到相应的可视化的报表。2.根据权利要求1所述的一种用于计算机大数据的高效批量处理方法,其特征在于,所述步骤一中数据采集系统具体的采集方法包括:通过传感器、摄像头和其他智能终端自动采集信号、图片或录像来获取数据;通过网络爬虫或网站公开API等方式从网站上...

【专利技术属性】
技术研发人员:赵芳张丽凤
申请(专利权)人:新乡学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1