一种PDF文件恢复方法及装置制造方法及图纸

技术编号:9794478 阅读:84 留言:0更新日期:2014-03-21 18:49
本发明专利技术提供一种PDF文件恢复方法及装置,包括:根据文件头特征标识和文件尾特征标识在存储介质上查找文件头碎片和文件尾碎片,根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片,根据所述完整碎片恢复所述待恢复文件。通过使用以上方法,可以结合PDF文件的结构特征,实现在对PDF文件的正确恢复,提高恢复的效果,方便用户的使用。

【技术实现步骤摘要】
一种PDF文件恢复方法及装置
本专利技术涉及电子文件读写
,特别涉及一种PDF文件恢复方法及装置。
技术介绍
PDF文件作为一种广泛使用的编辑文件格,已经在计算机及互联网中被广大用户所使用。PDF全称为PortableDocumentFormat,翻译为“便携文档格式”,是一种电子文件格式。这种格式与操作系统平台无关,而正是这一独特的性能使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用PDF格式文件。与此同时,随着人们对PDF文件使用的增多,与PDF文件使用相关的问题也就接踵而来。例如:人们在日常对电脑进行操作时,都可能会碰到因为手误或不知情等非主观原因下误删除文件的情况。在这种情况下,用户一般会借助于文件恢复软件来对PDF文件进行恢复。但由于PDF文件的结构特点,在使用现有技术中的恢复软件进行恢复时效果都不是很好,恢复出的文件经常出现无法打开、乱码或内容丢失的情况。因此,需要提供一种PDF文件恢复方法及装置来解决以上的问题。
技术实现思路
本专利技术要解决的技术问题是提供一种PDF文件恢复方法及装置,提高对PDF文件的恢复效果,方便用户的使用。一种PDF文件恢复方法,其特征在于,包括:根据文件头特征标识和文件尾特征标识在存储介质上查找文件头碎片和文件尾碎片;根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片;根据所述完整碎片恢复所述待恢复文件。优选地,所述根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片,具体为:根据所述文件头碎片中包含的对象编号数组和对象偏移量数据,查找是否存在匹配的文件尾碎片;所述匹配的文件尾碎片中记录的对象编号数组和对象偏移量数组包含了所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组;若查找到所述匹配的文件尾碎片,判断所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组是否全部包含了所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组;若所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组,将所述文件头碎片与所述匹配的文件尾碎片作为所述待恢复文件的完整碎片。优选地,还包括:若查找到若干个所述匹配的文件尾碎片,将距离所述文件头碎片的存储地址最近的文件尾碎片作为所述匹配的文件尾碎片。优选地,还包括:根据对象特征标识在存储介质上查找对象碎片;若所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组没有全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组,将所述文件头碎片与所述对象碎片合并组成新文件头碎片,判断所述新文件头碎片中包含的所述对象编号数组和所述对象偏移量数组是否全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组。优选地,将所述文件头碎片与所述对象碎片合并组成新文件头碎片,具体为:查找所述对象碎片,所述对象碎片中记录的所述对象编号数组和所述对象偏移量数组包括在所述匹配的文件尾碎片记录的对象编号数组和所述对象偏移量数组中,且没有包括在所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组中;将所述文件头碎片的容量与所述对象碎片的容量相加,作为所述新文件头碎片的容量;将所述文件头碎片中的对象编号数组与所述对象碎片的对象编号数组进行组合,作为所述新文件头的对象编号数组;将所述文件头碎片中的对象偏移量数组与所述对象碎片中的对象偏移量数组进行组合,作为所述新文件头碎片的对象偏移量数组。一种PDF文件恢复装置,包括:文件头尾碎片查找模块,完整碎片查找模块和文件恢复模块;所述文件头尾碎片查找模块,用于根据文件头特征标识和文件尾特征标识在存储介质上查找文件头碎片和文件尾碎片;所述完整碎片查找模块,用于根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片;所述文件恢复模块,用于根据所述完整碎片恢复所述待恢复文件。优选地,所述完整碎片查找模块,包括:文件尾匹配子模块、文件头尾比较子模块和完整碎片组合子模块;所述文件尾匹配子模块,用于根据所述文件头碎片中包含的对象编号数组和对象偏移量数据,查找是否存在匹配的文件尾碎片;所述匹配的文件尾碎片中记录的对象编号数组和对象偏移量数组包含了所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组;所述文件头尾比较子模块,用于若查找到所述匹配的文件尾碎片,判断所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组是否全部包含了所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组;所述完整碎片组合子模块,用于若所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组,将所述文件头碎片与所述匹配的文件尾碎片作为所述待恢复文件的完整碎片。优选地,所述完整碎片查找模块,还包括:文件尾碎片选择子模块;所述文件尾碎片选择子模块,用于若查找到若干个所述匹配的文件尾碎片,将距离所述文件头碎片的存储地址最近的文件尾碎片作为所述匹配的文件尾碎片。优选地,还包括:对象碎片查找模块;所述对象碎片查找模块,用于根据对象特征标识在存储介质上查找对象碎片;在文件头尾比较子模块,还包括:新文件头碎片组合子模块;所述新文件头碎片组合子模块,用于若所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组没有全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组,将所述文件头碎片与所述对象碎片合并组成新文件头碎片,判断所述新文件头碎片中包含的所述对象编号数组和所述对象偏移量数组是否全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组。优选地,所述新文件头碎片组合子模块,还包括:对象碎片匹配子模块、新容量计算子模块、对象编号组合子模块和对象偏移量组合子模块;所述对象碎片匹配子模块,用于查找所述对象碎片,所述对象碎片中记录的所述对象编号数组和所述对象偏移量数组包括在所述匹配的文件尾碎片记录的对象编号数组和所述对象偏移量数组中,且没有包括在所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组中;所述新容量计算子模块,用于将所述文件头碎片的容量与所述对象碎片的容量相加,作为所述新文件头碎片的容量;所述对象编号组合子模块,用于将所述文件头碎片中的对象编号数组与所述对象碎片的对象编号数组进行组合,作为所述新文件头的对象编号数组;所述对象偏移量组合子模块,用于将所述文件头碎片中的对象偏移量数组与所述对象碎片中的对象偏移量数组进行组合,作为所述新文件头碎片的对象偏移量数组。与现有技术相比,本专利技术具有以下优点:在本专利技术中,首先根据特征标识获得文件头碎片和文件尾碎片,之后根据文件头碎片中的信息查找相匹配的本文档来自技高网...
一种PDF文件恢复方法及装置

【技术保护点】
一种PDF文件恢复方法,其特征在于,包括:根据文件头特征标识和文件尾特征标识在存储介质上查找文件头碎片和文件尾碎片;根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片;根据所述完整碎片恢复所述待恢复文件。

【技术特征摘要】
1.一种PDF文件恢复方法,其特征在于,包括:根据文件头特征标识和文件尾特征标识在存储介质上查找文件头碎片和文件尾碎片;根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片;所述根据所述文件头碎片中信息和所述文件尾碎片中信息,查找与所述文件头碎片中信息相匹配的所述文件尾碎片,将匹配的所述文件头碎片和所述文件尾碎片作为待恢复文件的完整碎片,具体为:根据所述文件头碎片中包含的对象编号数组和对象偏移量数组,查找是否存在匹配的文件尾碎片;所述匹配的文件尾碎片中记录的对象编号数组和对象偏移量数组包含了所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组;若查找到所述匹配的文件尾碎片,判断所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组是否全部包含了所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组;若所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组,将所述文件头碎片与所述匹配的文件尾碎片作为所述待恢复文件的完整碎片;根据所述完整碎片恢复所述待恢复文件;所述方法还包括:根据对象特征标识在存储介质上查找对象碎片;若所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组没有全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组,将所述文件头碎片与所述对象碎片合并组成新文件头碎片,判断所述新文件头碎片中包含的所述对象编号数组和所述对象偏移量数组是否全部包含所述匹配的文件尾碎片中记录的所述对象编号数组和所述对象偏移量数组;将所述文件头碎片与所述对象碎片合并组成新文件头碎片,具体为:查找所述对象碎片,所述对象碎片中记录的所述对象编号数组和所述对象偏移量数组包括在所述匹配的文件尾碎片记录的对象编号数组和所述对象偏移量数组中,且没有包括在所述文件头碎片中包含的所述对象编号数组和所述对象偏移量数组中;将所述文件头碎片的容量与所述对象碎片的容量相加,作为所述新文件头碎片的容量;将所述文件头碎片中的对象编号数组与所述对象碎片的对象编号数组进行组合,作为所述新文件头的对象编号数组;将所述文件头碎片中的对象偏移量数组与所述对象碎片中的对象偏移量数组进行组合,作为所述新文件头碎片的对象偏移量数组。2.根据权利要求1所述的方法,其特征在于,还包括:若查找到若干个所述匹配的文件尾碎片,将距离所述文件头碎片的存储地址最近的文件尾碎片作为所述匹配的文件尾碎片。3.一种PDF文件恢复装置,其特征在于,包括:文件头尾碎片查找模块,完整碎片查找模块和文件恢复模块;所述文件头尾碎片查找模块,用于根据文件头特征标识和文件尾特征标识在存储介质上查找文件头碎片和文件尾碎片;所述完整碎片查找模块,用于根据所述文件头...

【专利技术属性】
技术研发人员:沈长达钱镜洁林艺滨
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1