A data allocation method among distributed nodes, the method includes: obtaining the storage space utilization rate of multiple distributed nodes; using the normal distribution fitting algorithm, fitting the storage space utilization rate of all data nodes, obtaining the normal distribution of the storage space utilization rate, determining the standard deviation of the normal distribution and the mean value of the normal distribution; judging the normal distribution Whether the standard deviation of the normal distribution is greater than the preset standard deviation threshold; if the standard deviation of the normal distribution is greater than the preset standard deviation threshold, determine the nodes to be adjusted according to the curve of the normal distribution; redistribute the data of the nodes to be adjusted according to the mean value of the normal distribution. The invention also provides a data distribution device, a server and a storage medium between distributed nodes. The invention can reduce the consumption of network bandwidth and improve the data reading performance of data nodes.
【技术实现步骤摘要】
分布式节点间的数据分配方法、装置、服务器及存储介质
本专利技术涉及计算机
,尤其涉及一种分布式节点间的数据分配方法、装置、服务器及存储介质。
技术介绍
目前,随着互联网技术的蓬勃发展,社会生产活动中生成的数据量及存储需求越来越大,分布式文件系统被越来越广泛的使用。实践中发现,当数据存储分布不平衡时,分布式计算任务可能会被分配给没有存储数据的数据节点,这需要通过网络读取其它数据节点存储的数据,从而导致网络带宽的消耗。此外,当一些数据节点的数据完全满载时,新的数据会被集中存放在有空余存储空间的数据节点上,由于新的数据会被经常访问,使得对该数据节点的访问过于频繁,降低了该节点读取数据的性能。因此,如何减少网络带宽的消耗以及提高数据节点读取数据的性能是一个亟待解决的技术问题。
技术实现思路
鉴于以上内容,有必要提供一种分布式节点间的数据分配方法、装置、服务器及存储介质,能够减少网络带宽的消耗以及提高数据节点读取数据的性能。本专利技术的第一方面提供一种分布式节点间的数据分配方法,所述方法包括:获取多个分布式节点的存储空间使用率;使用正态分布拟合算法,对所述所有数据节点的存储空间使用率进行拟合,获得所述存储空间使用率的正态分布,并确定正态分布的标准差以及正态分布的均值;判断所述正态分布的标准差是否大于预设标准差阈值;若所述正态分布的标准差大于预设标准差阈值,根据所述正态分布的曲线,确定待调整节点;根据所述正态分布的均值,对所述待调整节点的数 ...
【技术保护点】
1.一种分布式节点间的数据分配方法,其特征在于,所述方法包括:/n获取多个分布式节点的存储空间使用率;/n使用正态分布拟合算法,对所述多个分布式节点的存储空间使用率进行拟合,获得所述存储空间使用率的正态分布,并确定正态分布的标准差以及正态分布的均值;/n判断所述正态分布的标准差是否大于预设标准差阈值;/n若所述正态分布的标准差大于预设标准差阈值,根据所述正态分布的曲线,确定待调整节点;/n根据所述正态分布的均值,对所述待调整节点的数据进行重新分配。/n
【技术特征摘要】
1.一种分布式节点间的数据分配方法,其特征在于,所述方法包括:
获取多个分布式节点的存储空间使用率;
使用正态分布拟合算法,对所述多个分布式节点的存储空间使用率进行拟合,获得所述存储空间使用率的正态分布,并确定正态分布的标准差以及正态分布的均值;
判断所述正态分布的标准差是否大于预设标准差阈值;
若所述正态分布的标准差大于预设标准差阈值,根据所述正态分布的曲线,确定待调整节点;
根据所述正态分布的均值,对所述待调整节点的数据进行重新分配。
2.根据权利要求1所述的方法,其特征在于,所述根据所述正态分布的曲线,确定待调整节点包括:
根据预设百分比,从所述正态分布的曲线中,确定位于所述曲线的两端的第一存储空间使用率范围以及第二存储空间使用率范围;
将存储空间使用率属于所述第一存储空间使用率范围的数据节点确定为转入节点;
将存储空间使用率属于所述第二存储空间使用率范围的数据节点确定为转出节点;
将所述转入节点以及所述转出节点确定为待调整节点。
3.根据权利要求2所述的方法,其特征在于,所述根据所述正态分布的均值,对所述待调整节点的数据进行重新分配包括:
针对每个所述转出节点,根据所述正态分布的均值、所述转出节点的存储空间使用率以及所述转出节点的存储空间大小,确定所述转出节点的可转出数据量;
针对每个所述转入节点,根据所述正态分布的均值、所述转入节点的存储空间使用率以及所述转入节点的存储空间大小,确定所述转入节点的可转入数据量;
根据所述可转出数据量和所述可转入数据量,对所述转出节点的数据进行调整,以及根据所述可转出数据量和所述可转入数据量,对所述转入节点的数据进行调整。
4.根据权利要求3所述的方法,其特征在于,所述根据所述可转出数据量和所述可转入数据量,对所述转出节点的数据进行调整,以及根据所述可转出数据量和所述可转入数据量,对所述转入节点的数据进行调整包括:
按照多个所述转出节点的第一预设排列顺序以及多个所述转入节点的第二预设排列顺序,依次将所述转出节点的数据转入至所述转入节点;
统计所述转出节点的实时转出数据量,以及统计所述转入节点的实时转入数据量;
判断所述实时转出数据量是否等于所述转出节点的可转出数据量,以及判断所述实时转入数据量是否等于所述转入节点的可转入数据量;
若所述实时转出数据量等于所述转出节点的可转出数据量,停止将所述转出节点的数据转出;及/或
若所述实时转入数据量等于所述转入节点的可转入数据量,停止向所述转入节点转入数据。
...
【专利技术属性】
技术研发人员:陈应杨,
申请(专利权)人:深圳市网心科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。