XFS下并行多线程文件备份恢复方法、系统及存储介质技术方案

技术编号:32648510 阅读:37 留言:0更新日期:2022-03-12 18:35
本发明专利技术涉及一种XFS下并行多线程文件备份恢复方法、系统及存储介质,属于计算机数据处理领域。所述方法包括:线程创建;获取指定目录及其子目录下目标文件的基础文件信息,或指定目录下子目录的基础文件夹信息;获取目标文件的文件数据位置;获取指定文件和目标文件的偏移记录;恢复出指定数据。所述系统包括:线程创建模块;第一获取模块;第二获取模块;第三获取模块;恢复模块。本发明专利技术通过解析XFS系统结构,提取超级块、inode、目录项等关键元数据,模拟文件系统读取磁盘数据,并通过多线程的方式并行处理每批输出数据,充分调用了资源,数据处理速度大幅提升。理速度大幅提升。理速度大幅提升。

【技术实现步骤摘要】
XFS下并行多线程文件备份恢复方法、系统及存储介质


[0001]本专利技术属于计算机数据处理领域,涉及一种XFS下并行多线程文件备份恢复方法、系统及存储介质。

技术介绍

[0002]XFS是目前Linux上主流的文件系统,在Centos7.0以上版本的Linux中,XFS取代EXT4作为默认的文件系统。
[0003]目前,在面对海量小文件时,XFS环境下并没有一种专门的备份恢复处理方法可以应对呈爆炸式增长的小文件,这极大地影响了XFS环境下数据备份恢复的处理效率。因此,如何快速备份恢复XFS环境下的海量小文件,成为当前急需解决的技术问题。

技术实现思路

[0004]本专利技术为了解决上述
技术介绍
中的技术问题,本专利技术实施例提供了一种XFS下并行多线程文件备份恢复方法、系统及存储介质。所述技术方案如下:第一个方面,提供了一种XFS下并行多线程文件备份恢复方法,所述方法包括步骤:创建至少第一线程、第二线程和第三线程,三者并行处理数据;将指定目录的路径供应给所述第一线程进行解析处理,持续获取第一输出,其中,所述第一输出包括:本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种XFS下并行多线程文件备份恢复方法,其特征在于,所述方法包括步骤:创建至少第一线程、第二线程和第三线程,三者并行处理数据;将指定目录的路径供应给所述第一线程进行解析处理,持续获取第一输出,其中,所述第一输出包括:指定目录及其子目录下目标文件的基础文件信息,或指定目录下子目录的基础文件夹信息;其中,所述基础文件信息为inode号、父目录inode号、文件大小和文件名;所述基础文件夹信息为inode号、父目录inode号和文件名;按批次将所述第一输出供应给所述第二线程进行预读处理,持续获取第二输出,其中,所述第二输出为目标文件的文件数据位置;按批次将所述第二输出供应给所述第三线程进行预读处理,持续获取第三输出,并将目标文件的文件数据写入指定文件,其中,所述第三输出为目标文件的偏移记录;根据写入文件数据后的指定文件,遍历第一输出和第三输出,恢复出指定数据。2.根据权利要求1所述的XFS下并行多线程文件备份恢复方法,其特征在于,所述将指定目录的路径供应给所述第一线程进行解析处理,持续获取第一输出步骤,包括:根据指定目录的路径,获取指定目录的信息,其中,所述指定目录的信息包括:设备编号和指定目录的inode号;根据所述设备编号,获取设备名;根据所述设备名,获取XFS基本信息,其中,所述XFS基本信息包括:分配组块数和分配组个数;根据所述指定目录的inode号和所述XFS基本信息,获取指定目录的inode;解析所述指定目录的inode,获取指定目录的目录项;遍历并解析所述指定目录的目录项,获取指定目录的文件列表信息;将指定目录的文件列表信息作为第一输出按批供应给下一线程。3.根据权利要求1所述的XFS下并行多线程文件备份恢复方法,其特征在于,所述按批次将所述第一输出供应给所述第二线程进行预读处理,持续获取第二输出步骤,包括:根据所述第一输出中的每批文件列表信息,判断所述目标文件对应的inode是否读入内存;若否,将所述目标文件对应的inode及其相邻inode读入内存;根据内存中目标文件的inode,获取目标文件的data fork;根据所述目标文件的data fork,获取目标文件的文件数据位置;将所述目标文件的文件数据位置作为第二输出按批供应给下一线程。4.根据权利要求1所述的XFS下并行多线程文件备份恢复方法,其特征在于,所述按批次将所述第二输出供应给所述第三线程进行预读处理,持续获取第三输出步骤,包括:根据所述第二输出中的每批目标文件的文件数据位置,判断所述目标文件的文件数据是否读入内存;若否,将所述目标文件的文件数据及其相邻文件数据读入内存;根据指定文件的路径,将内存中所述目标文件的文件数据写入指定文件,并持续获取所述目标文件的偏移记录作为第三输出。5.根据权利要求1所述的XFS下并行多线程文件备份恢复方法,其特征在于,所述根据写入文件数据后的指定文件,遍历第一输出和第三输出,恢复出指定数据步骤,包括:根据第一输出,获取指定目录的目录结构;
根据所述第一输出、所述第三输出和写入文件数据后的指定文件,获取目标文件的文件数据;根据所述指定目录的目录结构和所述目标文件的文件数据,恢复出指定数据。6.一种XFS下并行多线程文件备份恢复系统,其特征在于,所述系统包括:线程创建模块,用于创建至少第一线程、第二线程和第三线程,三者并...

【专利技术属性】
技术研发人员:谢卓伟谢俊峰彭涵钧黄传波钱禹航涂磊
申请(专利权)人:成都云祺科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1