The invention discloses a fragment used in polymerization document finishing method, including pre polymerization and polymerization to obtain the file file is divided into a plurality of blocks of data, each data block is divided into two parts, the first part of the bitmap index information is used to add the file fragments in the data block, the second part is used to store the file debris; when there are files stored in the data block or remove debris from a block of data, records the bitmap index information of the data blocks in the data block; the bitmap index information to determine the current file using polymerization rate; when the aggregate files the current usage rate reaches a predetermined rate, restart defragmentation. Thus, the method can through the bitmap index information of each data block can quickly determine the stored data block, and then determine the storage polymerization file, does not require full scan of the storage space in each data block, so that it not only improves the efficiency of scanning check, and save time.
【技术实现步骤摘要】
一种应用在聚合文件上的碎片整理方法
本专利技术涉及碎片整理
,特别是涉及一种应用在聚合文件上的碎片整理方法。
技术介绍
分布式文件系统中,有大量的文件碎片,为了防止碎片过多,通常会将多个文件碎片合并后写入一个大文件,称为聚合文件,实现碎片整理。碎片整理分为两大部分,一部分是前期将文件碎片存入聚合文件,另一部分是后期对聚合文件剩余的文件碎片重新整理。本专利技术所要解决的问题是后者。在使用聚合文件存储文件时,每次聚合文件的IO都可以写入或读取多个文件碎片,以获取更好的性能。但是随着系统的运行,聚合文件中的部分文件碎片可能会被删除,当聚合文件中的文件碎片被删除后,这个聚合文件的空间就没有这个文件碎片,但是其它文件也不能被存入,这样导致聚合文件的存储效率降低,读取性能降低等问题。为了解决这个问题,传统的做法是将聚合文件全部扫描一遍,从而获取聚合文件中剩余的文件碎片,然后再将这些文件碎片再重新存入一个新的聚合文件。由此可见,在进行聚合文件的扫描过程中,需要对聚合文件的每个空间都要查看一遍,导致在碎片整理过程中,扫描查看效率较低,浪费时间。另外,这样的碎片整理方法也不容易得知当前聚合文件的存储情况。如何克服上述文件是本领域技术人员亟待解决的问题。
技术实现思路
本专利技术的目的是提供一种应用在聚合文件上的碎片整理方法,用于在碎片整理过程中,提高扫描查看的效率,节约时间。为解决上述技术问题,本专利技术提供一种应用在聚合文件上的碎片整理方法,包括:预先获取聚合文件并将所述聚合文件分为多个数据块,将各所述数据块分为两个部分,第一部分用于添加各文件碎片在所述数据块中的位图索 ...
【技术保护点】
一种应用在聚合文件上的碎片整理方法,其特征在于,包括:预先获取聚合文件并将所述聚合文件分为多个数据块,将各所述数据块分为两个部分,第一部分用于添加各文件碎片在所述数据块中的位图索引信息,第二部分用于存储各文件碎片;当有文件碎片存入所述数据块或从所述数据块中删除时,在所述数据块中记录所述数据块的位图索引信息;通过所述位图索引信息确定所述聚合文件的当前使用率;当所述聚合文件的当前使用率达到预定使用率时,启动碎片整理。
【技术特征摘要】
1.一种应用在聚合文件上的碎片整理方法,其特征在于,包括:预先获取聚合文件并将所述聚合文件分为多个数据块,将各所述数据块分为两个部分,第一部分用于添加各文件碎片在所述数据块中的位图索引信息,第二部分用于存储各文件碎片;当有文件碎片存入所述数据块或从所述数据块中删除时,在所述数据块中记录所述数据块的位图索引信息;通过所述位图索引信息确定所述聚合文件的当前使用率;当所述聚合文件的当前使用率达到预定使用率时,启动碎片整理。2.根据权利要求1所述的应用在聚合文件上的碎片整理方法,其特征在于,还包括:当有文件碎片存入所述数据块时,在所述第一部分中添加所述文件碎片的文件号。3.根据权利要求2所述的应用在聚合文件上的碎片整理方法,其特征在于,还包括:当有文件碎片从所述数据块删除时,删除对应的文件号。4.根据权利要求2所述的应用在聚合文件上的碎片整理方法,其特征在于,当接收到查看请求时,通过所述文件号查找所述查看请求对应的目标文件碎片。5.根据权利要求2所述的应用在聚合文件上的碎片整理方法,其特征在于,所述将各所述数据块分为两个部分,第一部分用于添加各文件碎片在所述数据块中的位图索引信息,第二部分用于存储各文件碎片具体为:将所述数据块分为数据头部和数据体,所述数据头部作为所述第一部分,用于添...
【专利技术属性】
技术研发人员:张子奇,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。