当前位置: 首页 > 专利查询>北京大学专利>正文

文件描述信息存储以及文件数据读取的方法、装置制造方法及图纸

技术编号:4990179 阅读:240 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及数据处理领域,尤其涉及一种文件描述信息存储以及文件数据读取的方法、装置。所述文件描述信息存储的方法包括:收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;根据替换后的最终文件标识对所有文件描述信息进行排序;以及将排序后的所有文件描述信息存储到包文件中。通过该方法,缩短了第一次读取文件数据的时间,提高了读取效率及用户体验,同时提高了包文件的安全性。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,尤其涉及一种文件描述信息存储以及文件数据读取 的方法、装置。
技术介绍
目前人们往往会使用winzip、winrar等软件对多个文件数据打包压缩成包文件后 进行存储。包文件中包括各个文件数据及其对应的文件描述信息,文件描述信息用于描 述对应的文件数据的相关信息,如初始文件标识(文件名或全路径)、文件数据大小、压 缩后大小以及压缩方法等。在第一次读取包文件中的文件数据前,需要对包文件中所有 的文件描述信息进行解析并读取到内存后才能读取所需的文件数据,从而使得第一次读 取文件数据的时间过长,影响读取效率及用户体验。上述缺陷是由每个文件描述信息(file header)的结构引起的。因为传统方案中 的文件描述信息是可变长的,并且各个文件描述信息在包文件中的存储是按照文件数据 写入的顺序排列的,而写入的顺序是不固定的,因此在第一次读取包文件中的文件数据 前,必须先按照该写入的顺序依次对包文件中所有的文件描述信息进行解析。此外,包 文件中存储的文件描述信息中包括初始文件标识,任何人都可以在打开包文件时看到其 中包括哪些文件数据,因此安全性不好,容易引起信息泄露。
技术实现思路
本专利技术实施例提供一种文件描述信息存储以及文件数据读取的方法、装置,用 以在第一次读取包文件中的文件数据前,无需对包文件中所有文件描述信息进行解析并 读取,从而缩短第一次读取文件数据的时间,提高读取效率及用户体验,还可以提高包 文件的安全性。一种文件描述信息存储的方法,包括收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长 度的最终文件标识;将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替 换;根据替换后的最终文件标识对所有文件描述信息进行排序;以及将排序后的所有文件描述信息存储到包文件中。 一种文件描述信息存储的装置,包括收集单元,用于收集所有文件描述信息,每项所述文件描述信息中包括初始文 件标识;确定单元,用于按照预定的最终文件标识确定规则,根据所述初始文件标识确 定对应的固定长度的最终文件标识;替换单元,用于将每项所述文件描述信息中的初始文件标识用确定出的对应的 最终文件标识替换;排序单元,用于根据替换后的最终文件标识对所有文件描述信息进行排序;以 及 存储单元,用于将排序后的所有文件描述信息存储到包文件中。一种文件数据读取的方法,包括确定所有文件描述信息在包文件中的位置信息,每项所述文件描述信息中包括 固定长度的最终文件标识;根据用户指定的初始文件标识确定对应的最终文件标识;根据确定出的对应的最终文件标识以及所述位置信息,在所述所有文件描述信 息中查找对应的文件描述信息;根据查找到的文件描述信息读取对应的文件数据。一种文件数据读取的装置,包括第一确定单元,用于确定所有文件描述信息在包文件中的位置信息,每项所述 文件描述信息中包括固定长度的最终文件标识;第二确定单元,用于根据用户指定的初始文件标识确定对应的最终文件标识;查找单元,用于根据所述第二确定单元确定出的对应的最终文件标识及所述第 一确定单元确定出的位置信息,在所述所有文件描述信息中查找对应的文件描述信息;读取单元,用于根据所述查找单元查找到的文件描述信息读取对应的文件数 据。本专利技术有益效果如下本专利技术实施例在存储文件描述信息到包文件中时,按照 预定的最终文件标识确定规则,根据文件描述信息中的初始文件标识确定对应的固定长 度的最终文件标识,然后用确定出的最终文件标识替换初始文件标识,并根据最终文件 标识对所有文件描述信息进行排序,再将排序后的所有文件描述信息存储到包文件中。 这样,由于存储的文件描述信息中的最终文件标识长度固定,且各文件描述信息有序排 列,因此在第一次读取包文件中的文件数据前,无需对包文件中的所有文件描述信息进 行解析并读取,只要根据用户指定的初始文件标识确定对应的最终文件标识,再根据最 终文件标识查找对应的文件描述信息,即可读取对应的文件数据,从而缩短了第一次读 取文件数据的时间,提高了读取效率及用户体验。另外,由于用保密性强的最终文件标 识替换了初始文件标识,因此在打开包文件时看到的只是其中的文件数据的最终文件标 识,而无法知道其初始文件标识,即无法知道具体是哪些文件数据,而只有知道文件数 据的初始文件标识的用户才能够读取其中的文件数据,从而提高了包文件的安全性。附图说明图1为本专利技术实施例中一种文件描述信息存储方法的流程图;图2为本专利技术实施例中一种文件描述信息存储装置的结构图;图3为本专利技术实施例中一种文件数据读取方法的流程图;图4为本专利技术实施例中一种文件数据读取装置的结构图。具体实施例方式本专利技术实施例提供了一种文 件描述信息存储的方法、装置,以及一种文件数据 读取的方法、装置,通过将可变长的初始文件标识转换成固定长度的最终文件标识,并 根据最终文件标识对所有文件描述信息进行排序,从而在第一次读取包文件中的文件数 据前,无需对包文件中的所有文件描述信息进行解析并读取,只要根据用户指定的初始 文件标识确定对应的最终文件标识,再根据最终文件标识查找对应的文件描述信息,即 可读取对应的文件数据,从而缩短了第一次读取文件数据的时间,提高了读取效率及用 户体验。此外,通过用保密性强的最终文件标识替换初始文件标识,提高包文件的安全 性。下面结合附图对本专利技术的具体实施方式及对应产生的有益效果进行详细描述。如图1所示,为本专利技术实施例提供的文件描述信息存储方法的流程图,该方法 包括如下步骤步骤101、收集所有文件描述信息,每项文件描述信息中包括初始文件标识。其中,初始文件标识可以为文件名或全路径。步骤102、按照预定的最终文件标识确定规则,根据初始文件标识确定对应的固 定长度的最终文件标识。其中,预定的最终文件标识确定规则可以有多种,包括但不限于以下两种最终 文件标识确定规则1、将所有初始文件标识保存在初始文件标识列表中,按照该列表中的保存顺序 依次为所有初始文件标识进行编号,将该编号作为对应的最终文件标识。例如,列表中 第一个初始文件标识的编号为0,第二个初始文件标识的编号为1,第三个初始文件标识 的编号为2,以此类推。当然,也可以采用其他的编号形式进行编号,只要每个初始文件 标识对应唯一的一个编号即可。2、利用哈希函数,根据初始文件标识,计算对应的哈希值作为最终文件标识。 当哈希函数足够优秀、哈希值域远远大于初始文件标识的数目时,可以认为计算出的各 个哈希值不会冲突。在采用第一种最终文件标识确定规则时,可以将初始文件标识列表进行保存, 既可以保存在包文件中,也可以保存在包文件之外的其他外存中,以方便在读取包文件 中的文件数据时进行利用该列表。另外,该列表中还可以对应保存确定出的最终文件标 识,以方便在读取包文件中的文件数据时,根据用户指定的初始文件标识在该列表中直 接查找到对应的最终文件标识。该包括初始文件标识及对应的最终文件标识的初始文件 标识列表可以保存在包文件中。在采用第二种最终文件标识确定规则时,由于不需要有初始文件标识列表,因 此进一步隐藏了包文件中的文件数据信息。此外,所述最终文件标识的固定长度可以根据实际需要进行设定,也可以根据本文档来自技高网...

【技术保护点】
一种文件描述信息存储的方法,其特征在于,包括:收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;根据替换后的最终文件标识对所有文件描述信息进行排序;以及将排序后的所有文件描述信息存储到包文件中。

【技术特征摘要】

【专利技术属性】
技术研发人员:仇睿恒王毅
申请(专利权)人:北京大学北大方正集团有限公司北京北大方正技术研究院有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1