一种Office文件数据分片识别、排序、重组方法技术

技术编号：21913890 阅读：52 留言：0更新日期：2019-08-21 12:24

一种Office文件数据分片识别、排序、重组方法属于数据处理技术领域，尤其涉及一种Office文件数据分片识别、排序、重组方法。本发明专利技术提供一种Office文件数据分片识别、排序、重组方法。本发明专利技术包括以下步骤：步骤1：在磁盘空闲空间内，识别出全部Office数据分片；步骤2：在全部Office分片中，根据0X 50 4B 05 06标志位，查找包含Office文件尾部目录结束记录的数据分片；令此类分片总个数为t，即待恢复的Office文件总个数为t；设置整数变量i初值为0；步骤3：根据第i个Office文件目录项定位第i个文件的全部数据块；步骤4：重组第i个Office文件。

A Method of Fragmentation Recognition, Sorting and Reorganization of Office File Data

全部详细技术资料下载

【技术实现步骤摘要】
一种Office文件数据分片识别、排序、重组方法
本专利技术属于数据处理
，尤其涉及一种Office文件数据分片识别、排序、重组方法。
技术介绍
Office办公软件被广泛应用于各个领域，Office文件中存储了大量有价值的数据信息。为了逃避法律制裁，犯罪分子会将存储涉案信息的Office文件删除，甚至直接格式化存储设备。恢复这些被删除的涉案Office文档对公安机关的调查取证工作有重要意义。Office文件在编辑过程中，存储在磁盘上的文件数据极易出现分片情况，即文件内容被分为多段，分别存放在几块非连续存储区域内。图1显示的是某个Office文件被分成6个分片，分别存放在磁盘的6块存储区域内，图中给出了每个分片在磁盘空间内的起始簇号、分片的逻辑次序及分片占用的簇块个数。以第1个分片为例，它的起始簇号是0XE0E6，共占用0X06个簇块。从图1可见，这6个分片并不是按照逻辑次序依次存放，而是按照3、4、5、1、2、6的顺序存放。当被删Office文件的MFT记录遭到覆盖时，现有数据恢复工具（如Encase、X-WAY）无法有效恢复这类分段存储的Office文档。图2说明了Office文件数据分片识别、排序、重组方法的基本原理。图2-a显示了一个Office文件的基本存储结构，每个Office文件均由三部分组成，即数据块区、目录区和目录结束记录。数据块区包含若干个数据块，每个数据块由块首部和具体的块数据构成，图2-a所示Office文件共包含4个数据块，即obj1-obj4。目录区由若干个目录项构成，每个目录项指向一个特定的Office数据块，目录项个数...

【技术保护点】
1.一种Office文件数据分片识别、排序、重组方法，其特征在于包括以下步骤：步骤1：在磁盘空闲空间内，识别出全部Office数据分片；步骤2：在全部Office分片中，根据0X 50 4B 05 06标志位，查找包含Office文件尾部目录结束记录的数据分片；令此类分片总个数为t，即待恢复的Office文件总个数为t；设置整数变量i初值为0；步骤3：根据第i个Office文件目录项定位第i个文件的全部数据块；步骤4：重组第i个Office文件；步骤5：设置i = i + 1，如果i < t，则执行步骤3，否则，结束。

【技术特征摘要】
1.一种Office文件数据分片识别、排序、重组方法，其特征在于包括以下步骤：步骤1：在磁盘空闲空间内，识别出全部Office数据分片；步骤2：在全部Office分片中，根据0X504B0506标志位，查找包含Office文件尾部目录结束记录的数据分片；令此类分片总个数为t，即待恢复的Office文件总个数为t；设置整数变量i初值为0；步骤3：根据第i个Office文件目录项定位第i个文件的全部数据块；步骤4：重组第i个Office文件；步骤5：设置i=i+1，如果i<t，则执行步骤3，否则，结束。2.根据权利要求1所述一种Office文件数据分片识别、排序、重组方法，其特征在于所述步骤1包括以下步骤：步骤1）：磁盘内共有n块空闲存储空间，设置整数变量i和j初值均为0；步骤2）：设置搜索起始地址SP为第i块磁盘空闲空间起始地址；步骤3）：在第i块磁盘空闲空间内，从起始地址SP开始，根据ZIP标志位和修改时间字段查找Office数据块，如查找成功，确定数据块的起始位置BP1和长度值BL1，同时记录分片起始位置为CP[j]=BP1，分片长度值CL[j]=BL1，设置SP=BP1+BL1，执行步骤4）；如查找失败；则执行步骤6）；ZIP标志位值为0X504B0102或0X504B0304或0X504B0506，数据块的修改时间字段值为0X00002100，即1980-01-0100:00:00；步骤4）：在第i块磁盘空闲空间内，从起始位置SP开始，根据ZIP标志位和修改时间字段查找Office数据块，如查找成功，执行步骤5）；否则，执行步骤6）；步骤5）：确定步骤4）命中数据块的起始位置BP2和长度值BL2；如果BP1+BL1=BP2，即两个数据块首尾相接，则令CL[j]=CL[j]+BL2，SP=BP2+BL2，BP1=BP2，BL1=BL2，执行步骤4）；如果BP1+BL1≠BP2，则令j=j+1，新识...

【专利技术属性】
技术研发人员：徐国天，
申请(专利权)人：中国刑事警察学院，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人