基于分布式集群的数据处理方法与装置制造方法及图纸

技术编号:17704682 阅读:30 留言:0更新日期:2018-04-14 17:44
本发明专利技术涉及基于分布式集群的数据处理方法与装置,通过在计算节点运行Region分区的镜像实例,使得Region分区的数据访问尽可能的本地化,缓解了用电信息采集系统的网络资源的消耗,从而提升分布式计算集群的运算效率,削减分布式集群的建设成本和维护费用;并且优化了架构于分布式数据库上的其他应用的响应速度。

【技术实现步骤摘要】
基于分布式集群的数据处理方法与装置
本专利技术属于电信息采集系统数据分布式运算
,具体涉及基于分布式集群的数据处理方法与装置。
技术介绍
为满足大型电力公司集约化管理的需求,减少用电信息采集系统的运营成本,各省电力公司的用电信息采集系统一般都采取集中部署的模式,把全省的智能电表都集中接入到省电力公司总部进行统一处理,而不是分散到各个地市级电力公司。按现在各省公司的用户规模,用电信息采集系统需要连接的智能电表数量,一般都在数百万甚至上千万只。考虑到智能电表每15分钟上送一次数据,每天将产生几十亿行记录,1年大约会产生200TB的数据。另外,为了对设备状态和电网运行情况进行分析和追溯,一般电表的历史数据需要保存5-7年。对于这种高密度、长时间跨度的基础数据进行运算和分析需要耗费大量的时间和运算资源,如何合理利用有限的运算资源、提升用电信息采集系统的运算效率是非常困难的事情。在现有的用电信息采集系统中,数据处理主要依靠性能强大的分布式集群完成,如图1所示,分布式集群的每个服务器节点都会部署数据节点,Region分区,计算节点。现有的分布式计算集群的计算节点通过访问分布式数据库的Region分区进行数据访问。然而由于Region分区所管理的数据散布在分布式数据存储的各个节点上;在分布式计算过程中,只有存储于本地数据节点的数据块可以有Region分区直接访问,存储在其他数据节点的数据块需要通过网络进行读取。如此一来,占用了分布式集群大量的网络IO(通信网络);并且,通过网络获取数据比从本地直接读取数据的速度慢,从而影响分布式计算集群的运算效率;并且网络IO的大量消耗会影响分布式集群其他业务的响应速度;随着用电信息采集系统采集数据量的不断增长,有限的运算资源需要经过不断的软硬件升级才能满足,由此带来的用电信息采集系统的成本投入,维护费用等也一直不断提高。
技术实现思路
本专利技术的目的是提供一种基于分布式集群的数据处理方法与装置,用于解决现有分布式集群中计算节点通过网络接收其他计算节点导致的计算数据速度慢的问题,以及占用过多运算资源造成分布式集群整体运行速度慢的问题。为解决上述技术问题,本专利技术提出一种基于分布式集群的数据处理方法,包括以下解决方案:所述分布式集群至少包括两个服务器节点,每个服务器节点均包括计算节点、分区和数据节点,包括如下步骤:1)当有计算节点需要执行计算任务时,将该计算节点对应分区的镜像运行到除该计算节点外的其它计算节点对应的数据节点上;2)该计算节点通过该计算节点的对应分区读取数据,除该计算节点外的其他计算节点通过对应分区的镜像读取数据;3)所有计算节点根据各自计算节点读取的数据进行计算,每个计算节点根据读取的数据计算完成后,由所述需要执行计算任务的计算节点汇总所有计算节点的计算结果。所述除该计算节点外的其它计算节点根据读取的数据计算完成后,删除所述对应分区的镜像。当所述需要执行计算任务的计算节点对应分区内的数据发生变化时,同步更新所述对应分区的镜像。所述对应分区的镜像对所述除该计算节点外的其它计算节点只读。为解决上述技术问题,本专利技术还提出基于分布式集群的数据处理装置,包括以下解决方案:所述分布式集群至少包括两个服务器节点,每个服务器节点均包括计算节点、分区和数据节点,包括处理器,用于实现以下步骤的指令:1)当有计算节点需要执行计算任务时,将该计算节点对应分区的镜像运行到除该计算节点外的其它计算节点对应的数据节点上;2)该计算节点通过该计算节点的对应分区读取数据,除该计算节点外的其他计算节点通过对应分区的镜像读取数据;3)所有计算节点根据各自计算节点读取的数据进行计算,每个计算节点根据读取的数据计算完成后,由所述需要执行计算任务的计算节点汇总所有计算节点的计算结果。所述除该计算节点外的其它计算节点根据读取的数据计算完成后,删除所述对应分区的镜像。当所述需要执行计算任务的计算节点对应分区内的数据发生变化时,同步更新所述对应分区的镜像。所述对应分区的镜像对所述除该计算节点外的其它计算节点只读。本专利技术的有益效果是:本专利技术在计算一个服务器节点设定分区内的数据时,对应在相关服务节点的数据节点上运行该设定分区的镜像实例,其中,相关服务节点存储有该服务区节点设定分区的数据。然后利用相关服务节点的计算节点通过上述设定分区的镜像读取并计算数据,计算完成后将计算结果发送至该设定分区的计算节点,汇总计算结果。本专利技术不需要直接通过网络获取相关服务节点中数据节点的数据,仅通过设置分区的镜像在相关服务节点中进行计算,提高了分布式集群中计算节点的计算速度和计算效率,节省了分布式集群的运算资源。通过在每个数据节点运行Region分区的镜像实例,使得分布式任务最大化的优先从本地读取数据,从而减少整个分布式集群数据节点间的数据交互,缓解了用电信息采集系统的网络资源的消耗,节约网络IO开销;并且从本地读取数据能够提升数据读取速度,提升分布式集群运算效率;从另一方面来说,优化配置了分布式集群的网络资源,降低了分布式集群的建设成本、硬件维护与升级费用。并且,对于架构于分布式数据库的之上的其他应用系统,其响应速度将有显著提升,即优化了架构于分布式数据库上的其他应用的响应速度。附图说明图1是现有分布式集群的示意图;图2是本专利技术的分布式集群的示意图。具体实施方式下面结合附图对本专利技术的具体实施方式作进一步的说明。实施例一:为了提升大数据平台的数据处理效率、缓解运算压力、减少软硬件资源的耗费、降低建设成本和升级维护费用,本专利技术提出以下基于分布式集群的数据处理方法:在每个数据节点上运行Region分区的镜像实例,供分布式计算节点直接访问该数据节点上的本地数据,减少分布式计算过程中各个节点间的网络传输压力。本专利技术所涉及的分布式集群如图1所示,分布式集群包括N个服务器节点,每个服务器节点均包括计算节点、Region分区和数据节点,其中,所涉及的Region分区为分布式数据库中用于管理所存储数据的基本结构。Region分区的镜像为分布式计算任务开始前对Region分区对象在剩余数据节点的复制,与Region分区具有相同的结构,但是Region分区的镜像对其所管理的数据只读。具体数据处理方法的步骤如下:1)当有计算节点需要执行计算任务时,除了该计算节点的对应的数据节点外,在剩余所有数据节点上运行该计算节点对应分区的镜像;2)该计算节点通过该计算节点的对应分区读取数据,除该计算节点外的其他计算节点通过对应分区的镜像读取数据;3)所有计算节点根据各自计算节点读取的数据进行计算,每个计算节点根据读取的数据计算完成后,由需要执行计算任务的计算节点汇总所有计算节点的计算结果。本专利技术在计算一个服务器节点分区内的数据时,对应在相关服务节点的数据节点上运行该设定分区的镜像实例,其中,相关服务节点存储有该服务区节点设定分区的数据。然后利用相关服务节点的计算节点通过上述设定分区的镜像读取并计算数据,计算完成后将计算结果发送至该设定分区的计算节点,汇总计算结果。本专利技术不需要直接通过网络获取相关服务节点中数据节点的数据,仅通过设置分区的镜像在相关服务节点中进行计算,提高了分布式集群中计算节点的计算速度和计算效率,节省了分布式集群的运算资源。作为本实施例的进一步改进,除该本文档来自技高网
...
基于分布式集群的数据处理方法与装置

【技术保护点】
一种基于分布式集群的数据处理方法,所述分布式集群至少包括两个服务器节点,每个服务器节点均包括计算节点、分区和数据节点,其特征在于,包括以下步骤:1)当有计算节点需要执行计算任务时,将该计算节点对应分区的镜像运行到除该计算节点外的其它计算节点对应的数据节点上;2)该计算节点通过该计算节点的对应分区读取数据,除该计算节点外的其他计算节点通过对应分区的镜像读取数据;3)所有计算节点根据各自计算节点读取的数据进行计算,每个计算节点根据读取的数据计算完成后,由所述需要执行计算任务的计算节点汇总所有计算节点的计算结果。

【技术特征摘要】
1.一种基于分布式集群的数据处理方法,所述分布式集群至少包括两个服务器节点,每个服务器节点均包括计算节点、分区和数据节点,其特征在于,包括以下步骤:1)当有计算节点需要执行计算任务时,将该计算节点对应分区的镜像运行到除该计算节点外的其它计算节点对应的数据节点上;2)该计算节点通过该计算节点的对应分区读取数据,除该计算节点外的其他计算节点通过对应分区的镜像读取数据;3)所有计算节点根据各自计算节点读取的数据进行计算,每个计算节点根据读取的数据计算完成后,由所述需要执行计算任务的计算节点汇总所有计算节点的计算结果。2.根据权利要求1所述的基于分布式集群的数据处理方法,其特征在于,所述除该计算节点外的其它计算节点根据读取的数据计算完成后,删除所述对应分区的镜像。3.根据权利要求1所述的基于分布式集群的数据处理方法,其特征在于,当所述需要执行计算任务的计算节点对应分区内的数据发生变化时,同步更新所述对应分区的镜像。4.根据权利要求1所述的基于分布式集群的数据处理方法,其特征在于,所述对应分区的镜像对所述除该计算节点外的其它计算节点只读。5.一种基...

【专利技术属性】
技术研发人员:贺彪徐大青张展国杨迎春李洪普王少鹏丁博
申请(专利权)人:许继集团有限公司国家电网公司许昌许继软件技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1