一种海量数据的收集与交换系统及方法技术方案

技术编号：13093293 阅读：55 留言：0更新日期：2016-03-30 20:10

本发明专利技术提拱一种海量数据的收集与交换系统，该系统采用代理模式，该系统的代理包括数据收集器、传输通道、接收器；所述数据收集器负责将数据源的数据收集，经过加工转化为事件，以事件（包括事件头信息和数据两个部分）的形式发送的传输通道上，支持多种数据接收器；所述传输通道用来缓存数据收集器发送过来的事件；所述接收器抽取传输通道中的事件，根据相应配置将文件存储到文件系统、数据库，或者提交到远程服务器或下一级的代理中。本发明专利技术中各个代理之间相互独立，可以对多个数据源进行并行交换，实现数据读入和写出的分离，使得系统架构更加灵活、轻量、高效。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大数据和数据收集领域，具体是一种海量数据收集与交换系统及方法。
技术介绍
随着信息通信技术发展积累至今，各种各样的数据成爆发式发展，使得太字节(Terabyte，TB)、拍字节(PetaByte，PB)甚至艾字节(Exabyte，EB)级的数据都变为一种常态，大数据时代便在其中孕育而生;大数据虽然孕育于信息技术的日渐普遍和成熟，它对社会经济生活产生的影响绝不限于技术层面，更本质上，他是为我们看待世界提供了一种全新的方法，即决策行为将日益基于数据分析做出而不是像过去那样更多凭借经验和直觉做出。大数据指的是无法在人可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合;在无法使用常规软件工具对大数据进行处理，代表着我们日常使用的机器是无法完成对大数据的存储和分析处理任务的;而高性能的巨型机会随着性能的提升而价格翻倍、甚至几倍的提高；如何解决这些难题?分布式集群可以很好的解决这一难题;开源项目分布式系统架构(Hadoop)正是为了解决互联网时代的海量数据存储和处理而设计、开发的；简单的讲Hadoop是一个可以更容易开发和并行处理大规模数据的分布式计算和存储系统;它有横向扩展能力强、成本低、效率高、可靠的特点；目前Hadoop的用户已经从传统的互联网公司想，扩展到电信行业、电力行业、医院、金融行业，并得到越来越广泛的应用。虽然Hadoop系统具有如此多的特点以适用于大数据的存储和处理，但是很多原始数据存储在单机机器上，而非Hadoop集群中，如果我们不能将这些数据交换到Hadoop集群中，Hadoop的各种优点都将无法实施；如何将这...

【技术保护点】
一种海量数据收集与交换系统，其特征在于：该系统采用代理模式，该系统的代理包括数据收集器、传输通道、接收器，各个代理之间相互独立，可以对多个数据源进行并行交换，实现数据读入和写出的分离，使得系统架构更加灵活、轻量、高效；所述数据收集器负责将数据源的数据收集，经过加工转化为事件，以事件（包括事件头信息和数据两个部分）的形式发送的传输通道上，支持多种数据接收器；所述传输通道用来缓存数据收集器发送过来的事件，为保证传递过程中数据的可靠性，只有当事件缓存到下一传输通道或者接收器处理完该事件时，才将事件从此传输通道中删除；所述接收器抽取传输通道中的事件，根据相应配置将文件存储到文件系统、数据库，或者提交到远程服务器或下一级的代理中。

【技术特征摘要】

【专利技术属性】
技术研发人员：朱志祥，梁小江，肖跃雷，于金良，
申请(专利权)人：陕西艾特信息化工程咨询有限责任公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人