一种基于Hadoop的海量数据实时分析处理方法技术

技术编号：7936910 阅读：986 留言：0更新日期：2012-11-01 07:33

本发明专利技术涉及一种基于云平台的海量数据通讯系统，所述系统包括：多台机器，对其进行联网以调配成云平台，所述云平台至少包括：主服务器，Map服务器，Reduce服务器；其中通过所述主服务器上的数据库管理界面，连接到数据库，读取原始数据列表，再将数据列表存储到Map服务器上；当所述Map服务器执行完任务，并计算出中间结果，需要将该中间结果发送给所述Reduce服务器；当所述Reduce服务器执行完任务，将最终结果发送给所述主服务器；所述主服务器接收最终结果，并用可视化的形式呈现给用户。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及云计算领域中的基于Hadoop框架的海量数据实时处理方法，更具体地，涉及在数据应用领域中，将海量数据的实时处理特性应用于数据分析与数据处理中。
技术介绍
云计算已经被看做IT业的新趋势，可以粗略的定义为使用自己环境之外的某一服务提供的可伸缩计算资源，并按使用量付费，可以通过Internet访问“云”中的任何资源，而不需要担心计算能力、贷款、存储、安全性和可靠性问题。从企业角度看，日益增长的信息已经很难存储在标准关系数据库甚至数据仓库中，例如，怎样查询一个十亿行的表，怎样跨越数据中心所有服务器上的所有日志来进行一个数据查询，更为复杂的是很多数据是非结构化或者半结构话的，这就更难查询了。Hadoop是一种框架，它可以分布式地操纵大量数据，在海量数据处理上具备了很多的优势I.高容错性从设计上HDFS已经假设了各服务器节点可能宕机，或者网络可能分害I]。这些问题会导致某些服务器不可用。Hadoop通过如下手段实现了高容错性I. I心跳检测和文件复制；I. 2数据完整性检测；I. 3元数据多源备份及Log机制；I. 4集群均衡。2.高伸缩性=Hadoop集群可以从一台机器扩大到上千台机器。具备很强的应对业务变化的能力。这里的业务变化可以是几个小时之内业务量从波峰到波谷之间的转换，也可以是中长期的业务增长或者变化。3.高成熟性业界多家传统IT巨头都在Hadoop上工作，将此系统打磨得相当成熟稳定。基于Hadoop的应用，无须担忧Hadoop本身的稳定性。而且有很多相关的基于Hadoop的套件可以使用例如HBase、Hive、Zookeeper等等都可...

【技术保护点】
一种基于Hadoop的海量数据实时分析处理方法，所述方法包括：1、将服务器进行联网，调配成云平台，所述云平台中至少包括：Client服务器，Nami？ng服务器，Map服务器，Reduce服务器；2、将原始数据部署到Map服务器；3、用户向Client服务器发起分析需求，当Client服务器接到客户发起的分析需求时，首先要向Naming服务器获取当前Map？Reduce状态，以便制定Job；4、当Naming服务器接到Cli？ent服务器发起的获取计划需求时，根据获取到的当前的Map服务器、Reduce服务器的状态，产生一个计划表；5、当Client服务器接收到计划表后，开始生成Job；6、Client服务器生成完Job后，将Reduce？Task发给Reduce服务器，Map？Task发给Map服务器；7、当Map服务器接收到Map？Task时，执行该任务；8、当Reduce服务器接收到Reduce？Task时，执行该任务；9、当Reduce服务器接收到Map？Task返回的结果，Reduce服务器读取返回的结果里的Client？Key，生成与之对应的Reduce？Key，并去白板里...

【技术特征摘要】
1. 一种基于Hadoop的海量数据实时分析处理方法，所述方法包括 1、将服务器进行联网，调配成云平台，所述云平台中至少包括=Client服务器，Naming服务器，Map服务器，Reduce服务器； 2、将原始数据部署到Map服务器； 3、用户向Client服务器发起分析需求，当Client服务器接到客户发起的分析需求时，首先要向Naming服务器获取当前Map-Reduce状态，以便制定Job ； 4、当Naming服务器接到Client服务器发起的获取计划需求时,根据获取到的当前的Map服务器、Reduce服务器的状态,产生一个计划表； 5、当Client服务器接收到计划表后，开始生成Job； 6、Client服务器生成完Job后，将ReduceTask发给Reduce服务器，Map Task发给Map服务器； 7、当Map服务器接收到MapTask时,执行该任务； 8、当Reduce服务器接收到ReduceTask时,执行该任务； 9、当Reduce服务器接收到MapTask返回的结果,Reduce服务器读取返回的结果里的Client Key,生成与之对应的Reduce Key,并去白板里记录已有ー个Map Task完成任务； 10、Reduce服务器将最終結果返回给Client服务器，Client服务器再将所述结果以可视化方式展现给終端用户。2.根据权利要求I的基于Hadoo...

【专利技术属性】
技术研发人员：包丽霞，
申请(专利权)人：北京永洪商智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人