The embodiment of this application provides a data equalization method, device and computer device, which includes: determining the first data node and the second data node to be equalized based on the utilization ratio of storage devices of each data node; determining the storage device migration information of the first data node and the second data node; and updating the storage device migration information according to the storage device migration information. The first data node and the second data node respectively have corresponding data distribution information to complete the migration of storage devices between the first data node and the second data node. The technical scheme provided in the embodiment of this application improves the efficiency of data equalization.
【技术实现步骤摘要】
数据均衡方法、装置及计算机设备
本申请实施例涉及数据处理
,尤其涉及一种数据均衡方法、装置及计算机设备。
技术介绍
分布式文件系统利用多台计算机协同解决单台计算机所不能解决的计算以及存储等问题。分布式文件系统主要是用于数据存储,数据资源以文件形式存放在物理机器的存储设备上。为了方便数据存储、读取以及管理,现有的分布式系统一般由主节点以及与主节点连接的各个数据节点构成,数据节点负责存储数据,主节点负责存储各个数据节点的数据分布信息。每一个数据节点分配有储存空间,通常具有一个或多个存储设备以存储数据。分布式文件系统在使用过程中会存在存储设备利用率不均衡现象,因此需要对分布式文件系统进行数据均衡,以保证各个数据节点的存储设备利用率满足均衡要求。现有技术中,通常是根据各个数据节点的存储设备利用率,确定待均衡的任意两个数据节点,从存储设备利用率较高的数据节点中迁移数据至存储设备利用率较低的数据节点中,之后通知主节点更新两个数据节点的数据分布信息即可,这种通过数据迁移来实现数据均衡的方式,需要占用网络带宽,但是为了不影响分布式文件系统的正常运行,数据迁移只能缓慢进行,导致数据均衡需要花费很长时间,效率较低。
技术实现思路
本申请实施例提供一种数据均衡方法、装置及计算机设备,用以解决现有技术中数据均衡效率低的技术问题。第一方面,本申请实施例中提供了一种数据均衡方法,包括:基于各个数据节点的存储设备利用率,确定待均衡的第一数据节点以及第二数据节点;确定所述第一数据节点以及所述第二数据节点的存储设备迁移信息;按照所述存储设备迁移信息,更新所述第一数据节点以及所述第二数据节 ...
【技术保护点】
1.一种数据均衡方法,其特征在于,包括:基于各个数据节点的存储设备利用率,确定待均衡的第一数据节点以及第二数据节点;确定所述第一数据节点以及所述第二数据节点的存储设备迁移信息;按照所述存储设备迁移信息,更新所述第一数据节点以及所述第二数据节点分别对应的数据分布信息,以完成所述第一数据节点以及所述第二数据节点之间的存储设备迁移。
【技术特征摘要】
1.一种数据均衡方法,其特征在于,包括:基于各个数据节点的存储设备利用率,确定待均衡的第一数据节点以及第二数据节点;确定所述第一数据节点以及所述第二数据节点的存储设备迁移信息;按照所述存储设备迁移信息,更新所述第一数据节点以及所述第二数据节点分别对应的数据分布信息,以完成所述第一数据节点以及所述第二数据节点之间的存储设备迁移。2.根据权利要求1所述的方法,其特征在于,所述确定第一数据节点以及所述第二数据节点的存储设备迁移信息包括:确定所述第一数据节点以及所述第二数据节点各自对应的各个存储设备;基于第一数据均衡需求,重新建立所述第一数据节点以及所述第二数据节点分别与所述各个存储设备的对应关系,以获得所述存储设备迁移信息。3.根据权利要求1所述的方法,其特征在于,所述按照所述存储设备迁移信息,更新所述第一数据节点以及所述第二数据节点分别对应的数据分布信息,以完成所述第一数据节点以及所述第二数据节点之间的存储设备迁移之后,所述方法还包括:确定所述第一数据节点对应的各个第一存储设备以及所述第二数据节点对应的各个第二存储设备;基于所述各个第一存储设备的利用率,将所述各个第一存储设备进行数据迁移,以获得第一数据迁移信息;基于所述各个第二存储设备的利用率,将所述各个第二存储设备进行数据迁移,以获得第二数据迁移信息;按照所述第一数据迁移信息以及所述第二数据迁移信息,更新所述第一数据节点以及所述第二数据节点分别对应的数据分布信息。4.根据权利要求1所述的方法,其特征在于,所述基于各个数据节点的存储设备利用率,确定待均衡的第一数据节点以及第二数据节点包括:基于各个数据节点的存储设备利用率,确定满足待均衡条件的第一数据节点以及第二数据节点。5.根据权利要求4所述的方法,其特征在于,还包括:如果不存在满足待均衡条件的第一数据节点以及第二数据节点,基于各个数据节点的存储设备利用率,确定满足待迁移条件的第三数据节点以及第四数据节点;基于第二数据均衡需求,在所述第三数据节点以及所述第四数据节点之间进行数据迁移,以获得第三数据迁移信息;基于所述第三数据迁移信息,更新所述第三数据节点以及所述第四数据节点的数据分布信息。6.根据权利要求1所述的方法,其特征在于,所述按照所述存储设备迁移信息,更新所述第一数据节点以及所述第二数据节点分别对应的数据分布信息,以完成所述第一数据节点以及所述第二数据节点之间的存储设备迁移之后,所述方法还包括:判断按照所述存储设备迁移信息进行存储设备迁移之后的所述第一数据节点以及所述第二数据节点是否满足第二数据均衡需求;如果所述第一数据节点以及所述第二数据节点不满足所述第二数据均衡需求,在所述第一数据节点以及所述第二数据节点之间进行数据迁移,以获得第四数据迁移信息;基于所述第四数据迁移信息,更新所述第一数据节点以及所述第二数据节点的数据分布信息。7.根据权利要求5所述的方法,其特征在于,所述基于各个数据节点的存储设备利用率,确定满足待均衡条件的第一数据节点以及第二数据节点包括:基于各个数据节点的存储设备利用率,确定存储设备利用率差值大于第一预设值的第一数据节点以及第二数据节点。8.根据权利要求7所述的方法,其特征在于,所述如果不存在满足待均衡条件的第一数据节点以及第二数据节点,基于各个数据节点的存储设备利用率,确定满足待迁移条件的第三数据节点以及第四数据节点包括:如果不存在存储设备利用率差值大于所述第一预设值的任意两个数据节点,基于各个数据节点的存储设备利用率,确定存储设备利用率差值大于第二预设值的第三数据节点以及第四数据节点;其中所述第二预设值小于所述第一预设值。9.根据权利要求1所述的方法,其特征在于,所述存储设备迁移信息确定步骤之后,所述方法还包括:输出存储设备迁移提示信息;所述存储设备迁移提示信息用于提示用户按照所述存储设备迁移信息交换所述第一数据节点以及所述第二数据节点中的存储设备。10.一种数据均衡装置,其特征在于,包括:第一节点确定模块,用于基于各个数据节点的存储设备...
【专利技术属性】
技术研发人员:余根茂,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。