【技术实现步骤摘要】
一种互联网数据处理系统及方法
[0001]本专利技术涉及互联网
,具体为一种互联网数据处理系统及方法
。
技术介绍
[0002]近些年,随着
Internet
的高速发展和普及,
Internet
上数以亿计的各种数据源,每时每刻都在产生着海量的数据流量,另外,由于硬件设备也日趋发展与完善,越来越多的领域部门也会自动的产生高速的海量数据流
。
[0003]因为流数据的这些特点都使得传统的数据管理系统很难或者无法对这些数据进行详细分析和管理,因此,设计开发一种用于流数据管理的系统,具有重要的现实意义
。
技术实现思路
[0004]针对现有技术的不足,本专利技术提供了一种互联网数据处理系统及方法,解决了传统的数据管理很难详细分析和管理流数据的问题
。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现:一种互联网数据处理系统,包括中央处理器和数据采集模块
、
数据解析系统
、
数据库
、web
端设计模块以及数据管理系统,所述中央处理器分别与数据采集模块和数据解析系统
、
数据库
、web
端设计模块以及数据管理系统传输连接;
[0006]所述数据采集模块用于对数据进行捕获
、
切分和上传工作;
[0007]所述数据解析系统用于把
Hadoop
分布式文件系统的二进制文件解析为用户可 ...
【技术保护点】
【技术特征摘要】
1.
一种互联网数据处理系统,包括中央处理器
(1)
和数据采集模块
(2)、
数据解析系统
(3)、
数据库
(4)、web
端设计模块
(5)
以及数据管理系统
(6)
,其特征在于:所述中央处理器
(1)
分别与数据采集模块
(2)
和数据解析系统
(3)、
数据库
(4)、web
端设计模块
(5)
以及数据管理系统
(6)
传输连接;所述数据采集模块
(2)
用于对数据进行捕获
、
切分和上传工作;所述数据解析系统
(3)
用于把
Hadoop
分布式文件系统的二进制文件解析为用户可读的字符串的形式;所述数据库
(4)
用于数据表的设计
、
数据库查找以及支持上层语言;所述
web
端设计模块
(5)
用于通过
PHP
设计
Web
界面
,
使用户能简洁方便地通过图形化窗口查询
HBase
数据库中的数据,并在
Web
窗口中快速显示
,
从而避免通过复杂的命令行的形式查找数据;所述数据管理系统
(6)
用于自动管理
Ha
‑
doop
的分布式文件系统中的各种数据
。2.
根据权利要求1所述的一种互联网数据处理系统,其特征在于:所述数据采集模块
(2)
对数据进行捕获时,利用
Endace
高速数据采集卡采集抓取原始的二进制数据;所述数据采集模块
(2)
对数据进行切分时,对抓取的数据文件进行分割,每抓取完一个数据文件,原始文件上传软件会自动检测文件的完整性和文件是否被占用,然后上传到分布式文件系统中,所述数据采集模块
(2)
对数据进行上传时,用于把
Endace
网卡抓取的数据上传到
Hadoop
的分布式文件系统中,在分布式文件系统中集中存储和处理
。3.
根据权利要求2所述的一种互联网数据处理系统,其特征在于:所述
Endace
高速数据采集卡采用网络网卡,最高数据抓取速度为
10G/s
,且
Endace
自带有具备内存的处理器,用于承担计算任务
。4.
根据权利要求2所述的一种互联网数据处理系统,其特征在于:所述
Endace
网卡抓取的数据文件的大小预设为固定值
128Mb。5.
根据权利要求1所述的一种互联网数据处理系统,其特征在于:所述数据解析系统
(3)
包括有输入检测模块
(31)
和数据储存模块
(32)、
数据查询模块
(33)
以及数据调度模块
(34)
,所述输入检测模块
(31)
与数据储存模块
(32)
传输连接,数据储存模块
(32)
分别与数据查询模块
(33)
和数据调度模块
(34)
传输连接,所述数据储存模块
(32)
包括有临时数据储存模块和概要数据储存模块以及静态数据储存模块
。6.
根据权利要求5所述的一种互联网数据处理系统,其特征在于:所述输入...
【专利技术属性】
技术研发人员:杨解清,谭大军,兰显辉,梁艺瀚,丛钰霖,
申请(专利权)人:成都老鹰信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。