当前位置: 首页 > 专利查询>北京大学专利>正文

一种文件打包、提取的方法和装置制造方法及图纸

技术编号:4187633 阅读:172 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种文件打包、提取的方法和装置,以解决现有技术中打包工具不够灵活且功能不够全面的问题。文件打包的方法包括:收集待打包的文件,其中,每个文件由至少一个文件项来描述,每个文件项包含多个用于描述文件内容的文件信息;将每个文件项所包含的文件信息分为至少两组;根据各组的组标识将各组中的文件信息写入包文件。文件提取的方法包括:提取包文件中包含指定的唯一性标识的组中的文件信息;根据所述提取到的文件信息确定所需文件数据所在的组的位置信息;根据所述位置信息提取所述文件数据所在的组中的文件信息。通过上述文件打包、提取方法,使得文件打包和提取时更加的灵活。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,尤其涉及一种文件打包、提取的方法和装置
技术介绍
文件打包,指的是将存储设备中保存的多个文件合成一个文件,合成后的 文件称为包文件,用户还可以从包文件中提取出所需的文件。在日常生活中,计算机中存在大量的文件。为了合理布局和便于查找,人 们通常将这些文件进行分类、存档。在分类、存档时,往往需要将多个文件进行打包。 一般,用户会选择WinZip等工具来对这些文件进行打包存储,这类 工具的打包具体步骤包括首先将需要打包的各个文件进行压缩,然后将压缩 后的各个文件写入到一个包文件内,并将与各个文件相应的信息集中存放在一 起。使用WinZip打包确实可以解决多文件的存档问题,并且可以对被打包的 文件进行数据压缩,从而节省了存储空间。但是由于WinZip本身的文件结构, 即这类工具是将所有的文件数据集中存放,所以会导致这种打包方式存在一定 的缺点和限制,例如(1)需要获取全部数据后才能进行操作。(2)不适应网 络应用。(3)不能保存同一文件的多个历史版本等。因此,现有打包工具无论 是在文件打包时,还是在文件提取时都不够灵活且功能不够全面。
技术实现思路
本专利技术实施例提供一种文件打包、提取的方法和装置,用以解决现有打包 工具不够灵活且功能不够全面的问题,例如,现有打包工具需要获取全部数据 后才能进行操作;现有打包工具不适应网络应用;现有打包工具不能保存同一文件的多个历史版本等问题。本专利技术实施例提供一种文件打包的方法,包括收集待打包的文件,其中,每个文件由至少一个文件项来描述,每个文件 项包含多个用于描述文件内容的文件信息;将每个文件项所包含的文件信息分为至少两组;根据各组的组标识将各组中的文件信息写入包文件。本专利技术实施例还提供一种用于实现多种功能的包文件,所述包文件包括文件头,描述包括版权版本信息和历史版本数量的基本信息;文件描述信息块,文件流入口描述,包括包文件内文件流的位置;文件数据信息块,多个文件流的顺序组合,包括数据编码方式的信息描述。本专利技术实施例提供一种文件打包的装置,包括收集模块,用于收集待打包的文件,其中每个文件由至少一个文件项 来描述,每个文件项包含多个用于描述文件内容的文件信息;分组模块,用于将每个文件项所包含的文件信息分为至少两组; 写模块,用于根据各组的组标识将各组中的文件信息写入包文件。 本专利技术实施例提供一种文件提取的方法,包括 提取包文件中包含指定的唯一性标识的组中的文件信息; 根据所述提取到的文件信息确定所需文件数据所在的组的位置信息; 根据所述位置信息提取所述文件数据所在的组中的文件信息。 本专利技术实施例提供一种文件提取的装置,包括第一提取模块,用于提取包文件中包含指定的唯一性标识的组中的文件信自 ,&,确定模块,用于根据所述提取到的文件信息确定所需文件数据所在的組的 位置信息;第二提取模块,用于根据所述位置信息提取所述文件 据所在的组中的文 件信息。在本专利技术实施例中所有需要打包的文件都由至少一个独立的文件项来描 述,并且还将每个文件项所包含的文件信息进行分组,使得文件打包和提取时 更加的灵活,而且功能更加全面,例如,通过本专利技术实施例提供的文件打包方 法,由于每个文件都有至少一个文件项来描述,即将一个文件分为多个文件项, 并且将每个文件项中包含的文件信息进行分组,从而可以根据需要获取其中的 部分数据,即可进4亍#:作;同样,在网络应用中,也可以在上述文件打包方法的基础上,按照网络传输顺序对文件项进行打包,从而达到线性化的效果;此 外,基于上述文件打包方法,可以在包文件尾部新增文件项,从而可以保存同 一文件的多个历史版本。附图说明图1为本专利技术实施例中文件打包的方法的原理流程图2为本专利技术实施例中一种文件打包方法的具体流程图3为本专利技术实施例中一种包文件修改方法的具体流程图4为本专利技术实施例中另一种包文件修改方法的具体流程图5为本专利技术实施例中又一种包文件修改方法的具体流程图6为本专利技术实施例中一种包文件结构的示意图7为本专利技术实施例中一种包文件结构中文件头的结构示意图8为本专利技术实施例中一种包文件结构中Entry块的结构示意图9为本专利技术实施例中一种包文件结构中Bitstream块的结构示意图IO为本专利技术实施例中对包文件做增量修改的示意图11为本专利技术实施例中包文件线性化结构的示意图12为本专利技术实施例中一种文件打包装置的结构图13为本专利技术实施例中一种文件提取方法的原理流程图14为本专利技术实施例中一种文件提取装置的结构图。具体实施例方式本专利技术实施例中,首先收集所有需要打包的文件,其中每个文件都由至少 一个文件项来描述,然后将每个文件项所包含的文件信息分成至少两组,并根 据各组的组标识将各组中的文件信息写入包文件。在本专利技术实施例中,文件项所包含的文件信息包括类型(文件或文件夹)、 名称、路径、操作、文件数据以及与文件数据相关的描述信息、数据长度、数 据指向(或数据位置)、数据编码方法序列、校验值等等。上述文件信息对于 每个文件项来说并不一定全部出现,而是可以根据需要进行选择、组合。其中, 一部分文件信息的含义是(1) 校验值能够保证文件内容的正确性,从而提高整体的可靠性。(2) 操作指的是将包文件看作一个虚拟的存储设备,在该存储设备上进 行的新建、删除、替换、修改、追加、切换当前目录等可能的文件系统操作。 一个文件项中只包含上述文件系统操作中的任意一种。(3 )文件数据是原始文件数据经过指定的数据编码方法处理后得到的, 如果未指定数据编码方法,则将原始文件数据直^^作为所需的文件数据。对于文件项来说,文件数据有时可以为空。具体来说,当某个文件项 中的操作是删除时,并不需要文件数据,这时文件数据为空。(4)数据编码方法序列是一个或者多个数据编码方法构成的序列。不 仅仅包含一般意义上的数据编码方法,本专利技术实施例还将加解密方法看作 为数据编码方法。这是因为加解密方法与数据编码方法一样,都是将数据 从一种表示形式变换为另一种表示形式,只不过加解密方法在变换的过程 中与密钥等安全信息相关。通过在该序列中添加不同的数据编码方法,然 后按照该序列对相应数据进行编码处理,继而达到灵活的扩展压缩和安全 处理。另外,有一些文件信息在开始时不能获得,必须在后续的处理过程中 才能计算得到,例如,文件数据在包文件中的位置等。这些文件信息可以在后期处理时得到,并写入到文件项中相应的位置处。下面结合说明书附图对本专利技术实施例的具体实施方式进行详细描述。如图l所示,本专利技术实施例提供的文件打包方法的基本步骤包括 步骤IIO、收集待打包的文件,其中,每个文件由至少一个文件项来描述,每个文件项包含多个用于描述文件内容的文件信息;步骤120、将每个文件项所包含的文件信息分为至少两组; 步骤130、根据各组的组标识将各组中的文件信息写入包文件。 本专利技术实施例中,文件项中的一些文件信息可以在开始时获得,也可以在后续处理过程中获得,例如,容量相对较大的文件数据可以在开始时获得,也可以在写入包文件之前的处理过程中获得并写入到相应位置处,以提高灵活性和效率。下面针对具体应用需要,对上述文件打包方法的四个具体实施例进行详细描述。 实施例一如图2所示,本专利技术实施例提供的一种文件打包方法的具体步骤包括 步骤210、收集所有本文档来自技高网...

【技术保护点】
一种文件打包的方法,其特征在于,包括: 收集待打包的文件,其中,每个文件由至少一个文件项来描述,每个文件项包含多个用于描述文件内容的文件信息; 将每个文件项所包含的文件信息分为至少两组; 根据各组的组标识将各组中的文件信息 写入包文件。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:仇睿恒汤帜王毅
申请(专利权)人:北京大学北大方正集团有限公司北京方正阿帕比技术有限公司
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1