文件压缩方法、装置、设备及存储介质制造方法及图纸

技术编号:39313906 阅读:7 留言:0更新日期:2023-11-12 15:58
本申请涉及一种文件压缩方法、装置、设备及存储介质,涉及数据处理技术领域。该方法应用于Hadoop平台,Hadoop平台包括多个压缩节点,压缩节点用于压缩文件。该方法包括:将目标文件分割成多个子文件;根据多个子文件的数据信息和多个压缩节点性能,为每个子文件分配压缩节点,子文件的数据信息包括子文件的数据大小;针对每个子文件,利用子文件对应的压缩节点对子文件进行压缩,得到子文件的压缩子文件,以得到多个压缩子文件;将多个压缩子文件合并,得到压缩文件。由此,可以提高文件压缩的效果和效率。效果和效率。效果和效率。

【技术实现步骤摘要】
文件压缩方法、装置、设备及存储介质


[0001]本申请涉及数据处理
,尤其涉及数据压缩
,具体涉及一种文件压缩方法、装置、设备及存储介质。

技术介绍

[0002]随着计算机系统的应用越来越广泛,计算机系统中的数据存储和数据管理已经成为降低计算机系统成本的重要因素之一。为了降低系统数据或文件占用的存储空间,需要进行数据压缩。数据的压缩效果与压缩算法及压缩方式相关。例如,车辆监控/监管系统每天都会产生大量的车辆历史轨迹数据文件,为了更好地利用服务器的磁盘空间,就需要对这些历史轨迹数据文件进行定期的压缩备份,并清理掉源数据,以释放出磁盘空间。传统的文件压缩方法在处理大文件时往往面临效率低下和计算资源消耗过大的问题。

技术实现思路

[0003]本申请提供一种文件压缩方法、装置、设备及存储介质,以至少解决相关技术中文件压缩效率低下的技术问题。本申请的技术方案如下:
[0004]根据本申请涉及的第一方面,提供一种文件压缩方法,应用于Hadoop平台,Hadoop平台包括多个压缩节点,压缩节点用于压缩文件,文件压缩方法包括:将目标文件分割成多个子文件;根据多个子文件的数据信息和多个压缩节点性能,为每个子文件分配压缩节点,子文件的数据信息包括子文件的数据大小;针对每个子文件,利用子文件对应的压缩节点对子文件进行压缩,得到子文件的压缩子文件,以得到多个压缩子文件;将多个压缩子文件合并,得到压缩文件。
[0005]根据上述技术手段,本申请可以充分利用Hadoop的分布式计算能力,对文件进行高效压缩,大大提高了数据的压缩效果和处理效率。方法可以根据Hadoop的处理能力自动分配子文件,降低了系统的复杂度,提高了数据的处理效率。本申请方法支持多种压缩算法,可以根据不同类型的数据选择合适的压缩算法,提高了数据的压缩效果。
[0006]在一种可能的实施方式中,上述方法还包括:根据多个子文件的数据信息和多个压缩节点性能,为每个子文件分配压缩节点,包括:获取多个压缩节点的数据处理能力,数据处理能力用于反应压缩节点能够处理的数据量;基于压缩子文件的数据大小,为压缩子文件分配对应的压缩节点;压缩节点的数据能力大于压缩子文件的数据大小。
[0007]在一种可能的实施方式中,子文件的数据信息包括子文件的数据类型,上述方法还包括:获取多个压缩节点的数据处理能力和数据处理类型;数据处理能力用于反应压缩节点能够处理的数据量,数据处理类型用于反应压缩节点能够处理的数据类型;基于压缩子文件的数据大小和数据类型,为压缩子文件分配对应的压缩节点;压缩节点的数据能力大于压缩子文件的数据大小,压缩节点的数据类型包括压缩子文件的数据类型。
[0008]在一种可能的实施方式中,上述方法还包括:为每个子文件设置文件标识符,子文件的文件标识符包括子文件的文件名和节点分区ID。
[0009]在一种可能的实施方式中,上述方法还包括:根据节点分区ID,将具有相同节点分区ID的多个子文件分发到同一个压缩节点,用于压缩节点对多个子文件分别进行压缩,得到各自对应的压缩子文件,压缩子文件的文件标识符和压缩子文件对应的子文件的文件标识符相同。
[0010]在一种可能的实施方式中,上述方法还包括:根据压缩子文件的文件标识符获取多个压缩子文件的文件顺序;基于多个压缩子文件的文件顺序将多个压缩子文件合并为一个压缩文件。
[0011]根据上述技术手段,本申请可以充分利用Hadoop的分布式计算能力,对文件进行高效压缩,大大提高了数据的压缩效果和处理效率。可以根据文件的数据大小、文件的数据类型和Hadoop的处理能力自动分配子文件,降低了系统的复杂度,提高了数据的处理效率。可以根据文件的文件标识符确定子文件对应的压缩节点和子文件的文件顺序,便于文件压缩和合并,提高文件压缩效率。本申请方法支持多种压缩算法,可以根据不同类型的数据选择合适的压缩算法,提高了数据的压缩效果。
[0012]根据本申请提供的第二方面,提供一种文件压缩装置,包括处理模块。
[0013]在一种可能的实施方式中,上述处理模块,还用于将目标文件分割成多个子文件;还用于根据所述子文件的数据信息和所述多个压缩节点性能,为每个子文件分配压缩节点,所述子文件的数据信息包括子文件的数据大小;还用于针对每个子文件,利用所述子文件对应的压缩节点对所述子文件进行压缩,得到所述子文件的压缩子文件,以得到多个压缩子文件;还用于将所述多个压缩子文件合并,得到压缩文件。
[0014]在一种可能的实施方式中,上述处理模块,还用于获取所述多个压缩节点的数据处理能力,所述数据处理能力用于反应压缩节点能够处理的数据量;还用于基于所述压缩子文件的数据大小,为所述压缩子文件分配对应的压缩节点;所述压缩节点的数据能力大于所述压缩子文件的数据大小。
[0015]根据本申请提供的第三方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现上述第一方面及其任一种可能的实施方式的方法。
[0016]根据本申请提供的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面中及其任一种可能的实施方式的方法。
[0017]根据本申请提供的第五方面,提供一种计算机程序产品,计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面及其任一种可能的实施方式的方法。
[0018]由此,本申请的上述技术特征具有以下有益效果:
[0019](1)本申请是一种基于Hadoop平台的文件压缩方法,对文件分割分别进行压缩,可以充分利用Hadoop的分布式计算能力,对文件进行高效压缩,大大提高了数据的压缩效果和处理效率。
[0020](2)本申请的压缩方法可以根据文件的数据大小、文件的数据类型、Hadoop的处理能力自动分配子文件,降低了系统的复杂度,提高了数据的处理效率。
[0021](3)本申请的压缩方法支持多种压缩算法,可以根据不同类型的数据选择合适的
压缩算法,提高了数据的压缩效果。
[0022](4)本申请的文件压缩方法可以根据文件的文件标识符确定子文件对应的压缩节点和子文件的文件顺序,便于文件压缩和合并,提高文件压缩效率。
[0023]需要说明的是,第二方面至第五方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。
[0024]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0025]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
[0026]图1是根据一示例性实施例示出的一种Hadoop平台的示意图
[0027]图2是根据一示例性实施例示出的一种文件压缩方法的流程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件压缩方法,其特征在于,应用于Hadoop平台,所述Hadoop平台包括多个压缩节点,所述压缩节点用于压缩文件,所述方法包括:将目标文件分割成多个子文件;根据多个所述子文件的数据信息和所述多个压缩节点性能,为每个子文件分配压缩节点,所述子文件的数据信息包括子文件的数据大小;针对每个子文件,利用所述子文件对应的压缩节点对所述子文件进行压缩,得到所述子文件的压缩子文件,以得到多个压缩子文件;将所述多个压缩子文件合并,得到压缩文件。2.根据权利要求1所述的方法,其特征在于,所述根据多个所述子文件的数据信息和所述多个压缩节点性能,为每个子文件分配压缩节点,包括:获取所述多个压缩节点的数据处理能力,所述数据处理能力用于反应压缩节点能够处理的数据量;基于所述压缩子文件的数据大小,为所述压缩子文件分配对应的压缩节点;所述压缩节点的数据能力大于所述压缩子文件的数据大小。3.根据权利要求1所述的方法,其特征在于,所述子文件的数据信息包括子文件的数据类型,所述根据所述子文件的数据信息和所述多个压缩节点性能,为每个子文件分配压缩节点,包括:获取所述多个压缩节点的数据处理能力和数据处理类型;所述数据处理能力用于反应压缩节点能够处理的数据量,所述数据处理类型用于反应压缩节点能够处理的数据类型;基于所述压缩子文件的数据大小和数据类型,为所述压缩子文件分配对应的压缩节点;所述压缩节点的数据能力大于所述压缩子文件的数据大小,所述压缩节点的数据类型包括所述压缩子文件的数据类型。4.根据权利要求2或3所述的方法,其特征在于,所述为每个子文件分配压缩节点,包括:为每个所述子文件设置文件标识符,所述子文件的文件标识符包括所述子文件的文件名和节点分区ID。5.根据权利要求4所述的方法,其特征在于,所述利用所述子文件对应的压缩节点对所述子文件进行压缩,得到所述子文...

【专利技术属性】
技术研发人员:况澳杰
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1