一种Hadoop集群和分布式系统技术方案

技术编号：16427969 阅读：29 留言：0更新日期：2017-10-21 22:56

本发明专利技术提供了一种Hadoop集群和分布式系统，其中，该Hadoop集群包括：主节点和与主节点连接的计算从节点；主节点，用于向计算从节点分配待处理的数据；计算从节点，用于对主节点分配的数据进行计算。通过本发明专利技术实施例提供的Hadoop集群和分布式系统，可以提高Hadoop集群的运行效率。

A Hadoop cluster and distributed system

The invention provides a Hadoop cluster and distributed system, among them, the Hadoop cluster includes a main node and connected with the main node calculated from the node; the master node, used to calculate the distribution of data from the processing nodes; calculated from node, calculated for the master node distribution data. Through the Hadoop cluster and distributed system provided by the embodiment of the invention, the operation efficiency of the Hadoop cluster can be improved.

全部详细技术资料下载

【技术实现步骤摘要】
一种Hadoop集群和分布式系统
本专利技术涉及数据处理
，具体而言，涉及一种海杜普(HadoopDistributedFileSystem，Hadoop)集群和分布式系统。
技术介绍
目前，数据处理量越来越大，种类也越来越繁多，呈现出大数据趋势。需要在对数据处理时，将待处理的数据分块后输入Hadoop集群进行并行处理(如MapReduce)，以得到数据处理结果。相关技术中，Hadoop集群包括主节点和多个从节点，主节点将待处理的数据分配到从节点，从节点对数据进行处理和存储。当在Hadoop集群中增加从节点时，需要将Hadoop集群中已有从节点上的数据迁移到新增从节点上。当要从Hadoop集群中删除从节点时，需要先将待删除的从节点上的数据迁移到其他从节点后，才能删除该待删除的节点。在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：由于从节点具有数据处理和存储功能，Hadoop集群进行从节点增减时，都需要耗费大量的时间(几个小时或者几天)进行从节点间数据迁移，从而降低了Hadoop集群的运行效率。
技术实现思路
有鉴于此，本专利技术实施例的目的在于提供一种Hadoop集群和分布式系统，以提高Hadoop集群的运行效率。第一方面，本专利技术实施例提供了一种Hadoop集群，包括：主节点和与所述主节点连接的计算从节点；所述主节点，用于向所述计算从节点分配待处理的数据；所述计算从节点，用于对所述主节点分配的数据进行计算。结合第一方面，本专利技术实施例提供了第一方面的第一种可能的实施方式，其中：还包括：与所述主节点连接的核心从节点；所述核心从节点，...
一种Hadoop集群和分布式系统

【技术保护点】
一种Hadoop集群，其特征在于，包括：主节点和与所述主节点连接的计算从节点；所述主节点，用于向所述计算从节点分配待处理的数据；所述计算从节点，用于对所述主节点分配的数据进行计算。

【技术特征摘要】
1.一种Hadoop集群，其特征在于，包括：主节点和与所述主节点连接的计算从节点；所述主节点，用于向所述计算从节点分配待处理的数据；所述计算从节点，用于对所述主节点分配的数据进行计算。2.根据权利要求1所述的Hadoop集群，其特征在于，还包括：与所述主节点连接的核心从节点；所述核心从节点，用于对所述主节点分配的数据进行存储。3.根据权利要求2所述的Hadoop集群，其特征在于，所述主节点、所述核心从节点和所述计算从节点均采用虚拟机。4.一种分布式系统，其特征在于，包括：节点调整服务器和上述权利要求1-3任一项所述的Hadoop集群；所述Hadoop集群，包括：主节点、与所述主节点分别连接的计算从节点和核心从节点；所述节点调整服务器，与所述主节点连接，用于根据所述计算从节点的计算任务信息和所述核心从节点的存储任务信息，分别调整与所述主节点连接的所述计算从节点和所述核心从节点的数量。5.根据权利要求4所述的分布式系统，其特征在于，所述节点调整服务器，包括：集群监控器，用于获取所述计算从节点的计算任务信息和所述核心从节点的存储任务信息；计算节点处理器，用于根据所述计算任务信息，计算所述计算从节点的第一扩容数量；核心节点处理器，用于根据所述存储任务信息，计算所述核心从节点的第二扩容数量或者缩减数量；从节点调整单元，用于根据所述第一扩容数量对与所述主节点连接的所述计算从节点的数量进行调整，根据所述第二扩容数量或者所述缩减数量对与所述主节点连接的所述核心从节点的数量进行调整。6.根据权利要求5所述的分布式系统，其特征在于，所述计算任务信息，包括：待处理任务量、当前工作中的计算从节点的计算能力参数、当前工作中的计算从节点的空闲计算能力参数和各计算从节点的最大计算能力参数；所述计算节点处理器，具体用于：当所述计算能力参数大于预设第一计算能力阈值的时长达到预设时长时，所述第一扩容数量＝(所述待处理任务量-所述空闲计算能力参数)/所述最大计算能力参数。7.根据权利要求6所述的分布式系统，其特征在于，所述计算任务信息，还包括：空闲计算从节点和空闲时间的对应关系表，所述空闲计算从节点和空闲时间的对应关系表记录有当前空闲的计算从节点的标识和对应的空闲时间；所述计算节点处理器，还具体用于：当...

【专利技术属性】
技术研发人员：李振龙，杨超伟，
申请(专利权)人：北京云和时空科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人