【技术实现步骤摘要】
一种大数据的云计算数据处理系统
[0001]本专利技术涉及数据处理系统
,具体涉及一种大数据的云计算数据处理系统。
技术介绍
[0002]服务器中的大数据(B i g Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。在信息时代,数据呈现爆炸式增长,如何从海量的数据库中,快速选择处有用、有价值的数据以及如何利用云计算这个大平台,新技术,实现在大数据中自动获取企业自身所需的数据信息,并且对数据信息进行处理和分类是目前亟待解决的问题。
技术实现思路
[0003]本专利技术的目的在于提供一种大数据的云计算数据处理系统,解决上述技术问题。
[0004]本专利技术的目的可以通过以下技术方案实现:
[0005]一种大数据的云计算数据处理系统,包括数据采集模块,基于大数据的信息进行系统所需的数据信息采集;
[0006]数据处理模块,将数据采集模块采集的数据信息进行整合分析处理;
[0007]文本分类模块,通过对数据处 ...
【技术保护点】
【技术特征摘要】
1.一种大数据的云计算数据处理系统,其特征在于,包括数据采集模块,基于大数据的信息进行系统所需的数据信息采集;数据处理模块,将数据采集模块采集的数据信息进行整合分析处理;文本分类模块,通过对数据处理后,通过对数据进行处理分析完成对文本的分类;数据存储模块,将采集的数据经过处理以及分类后,对数据和文本进行存储;数据显示模块,对处理后的数据信息进行显示。2.根据权利要求1所述的一种大数据的云计算数据处理系统,其特征在于,包括数据安全模块,所述数据安全模块用于对数据存储进行安全防护。3.根据权利要求2所述的一种大数据的云计算数据处理系统,其特征在于,所述数据安全模块包括数据访问安全模块、数据隔离安全模块和数据销毁安全模块。4.根据权利要求1所述的一种大数据的云计算数据处理系统,其特征在于,所述数据采集模块采用网络爬虫Heritrix实现网上数据爬取,并且设置过滤器对爬取数据进行过滤。5.根据权利要求1所述的一种大数据的云计算数据处理系统,其特征在于,所述数据处理模块采用HtmIParser工具提取网页关键标签标记的内容,并将相对应的数据内容按照后缀名为.doc、.xls、.xml或者.pdf格式的文档分类。6.根据权利要求1所述的一种大数据的云计算数据处理系统,其特征在于,所述文本分类模块包括数据预...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。