【技术实现步骤摘要】
文件分配方法、装置、设备以及存储介质
[0001]本公开涉及计算机
,尤其涉及一种文件分配方法、装置、设备以及存储介质。
技术介绍
[0002]在大数据处理中,往往会有海量的文件数据需要处理。目前通常会将这些文件分配给多台设备以进行并行处理。在分配时,往往采用随机的方式进行文件分配,以保证文件容量分配的均匀性。
[0003]但是这种随机的方式,在文件大小倾斜(即有的部分文件相对其他文件特别大)时难以保证文件能够均匀地进行分配。
技术实现思路
[0004]本公开提供了一种文件分配方法、装置、设备以及存储介质。
[0005]第一方面,本公开的实施例提供了一种文件分配方法,该方法包括:
[0006]获取多个待分配文件;
[0007]根据多个待分配文件,对预设各分组进行初始化文件分配;
[0008]从初始化文件分配后的多个分组中选择已分配文件大小之和最小的分组作为目标分组,并从剩余的待分配文件中选择偏离系数最小的待分配文件为目标文件,将目标文件分配至目标分组;其中,剩余的 ...
【技术保护点】
【技术特征摘要】
1.一种文件分配方法,其特征在于,所述方法包括:获取多个待分配文件;根据多个待分配文件,对预设各分组进行初始化文件分配;从初始化文件分配后的多个分组中选择已分配文件大小之和最小的分组作为目标分组,并从剩余的待分配文件中选择偏离系数最小的待分配文件为目标文件,将所述目标文件分配至所述目标分组;其中,剩余的各待分配文件的偏离系数为所述目标分组的已分配文件大小之和加上对应的待分配文件的大小,并减去分组平均容量之后所得数值的绝对值;重复上述目标文件分配操作,直到待分配文件分配完毕。2.根据权利要求1所述的方法,其特征在于,所述预设各分组的构建包括以下步骤:根据集群的设备数量,设置分组数量,构建多个分组。3.根据权利要求1所述的方法,其特征在于,所述根据多个待分配文件,对预设各分组进行初始化文件分配,包括:从多个待分配文件中为各分组随机分配预设个数的待分配文件。4.根据权利要求1所述的方法,其特征在于,所述根据多个待分配文件,对预设各分组进行初始化文件分配,包括:根据文件大小对多个待分配文件进行从大到小排序,依次选取大小在前的预设个数的待分配文件分配至各分组。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:通过分组对应的设备对分组中的文件进行处理。6.根据权利要求1
‑
5中...
【专利技术属性】
技术研发人员:郝伟,刘加瑞,
申请(专利权)人:安徽华云安科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。