一种文件包分卷的识别方法及系统技术方案

技术编号:3477311 阅读:233 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种文件包分卷的识别方法及系统。所述文件包分卷识别方法包括:获取多个文件包分卷中的各文件包分卷的识别信息,所述识别信息包括所述各文件包分卷的分卷号与文件列表,所述分卷号为生成文件包分卷时各文件包分卷在同组文件包分卷中的序号,所述文件列表记录了各文件包分卷所存储文件的属性信息;根据所获取的各文件包分卷识别信息识别所述多个文件包分卷是否属于同组文件包分卷。

【技术实现步骤摘要】

本专利技术涉及电脑与互联网领域,特别是涉及一种文件包分巻的识别方法 及系统。
技术介绍
网络中为了文件传输的方便,需要将一些体积过大的原始文件拆分成多 个文件块,例如使用文件分块软件将文件拆分成多个文件包分巻,然后将各 个文件包分巻传输至网络中其他接收端,接收端接收到文件包分巻后,文件 分块软件根据各文件包分巻的标题及分巻号,判断各个文件包分巻是否属于 同组文件包分巻,如果有所有的属于同组的文件包分巻,就能够将其还原为 原始文件。但是,如果属于同组文件包分巻的部分文件包分巻的标题被更改,即便 实际上属于同组文件包分巻,文件分块软件也无法正确识别,从而无法将文件包分巻所存储的原始文件还原;或者,如果网络上存在不属于同组但命名 规则却恰好一致的文件包分巻,用户很可能将其误判为属于同组文件包分巻 而获取,但获取之后同样不能将文件包分巻所存储的原始文件还原。可见, 通过文件包分巻标题来识别文件包分巻的方法,其有效性与可靠性均无法得 到保证。
技术实现思路
有鉴于此,本专利技术实施例^是供一种文件包分巻的识别方法及系统。 所述文件包分巻识别方法,包括获取多个文件包分巻中的各文件包分巻的识别信息,所述识别信息包括 所述各文件包分巻的分巻号与文件列表,所述分巻号为生成文件包分巻时各 文件包分巻在同组文件包分巻中的序号,所述文件列表记录了各文件包分巻 所存储文件的属性信息;根据所获取的各文件包分巻识别信息识别所述多个文件包分巻是否属于 同组文件包分巻。所述文件包分巻识别系统,包括信息获取单元,用于获取多个文件包分巻中的各文件包分巻的识别信息, 所述识别信息包括所述各文件包分巻的分巻号与文件列表,所述分巻号为生录了各文件包分巻所存储文件的属性信息;识别单元,用于根据所述信息获取单元获取的各文件包分巻的识别信息, 识别所述多个文件包分巻是否属于同组文件包分巻。与现有的通过分巻标题识别文件包分巻的方法相比,本专利技术实施例通过表是在文件包分巻创建的时候产生,产生后无法对其进行修改,因此通过分 巻号及文件列表识别文件包分巻是否属于同组,其有效性和可靠性都得到提 高。附图说明图1为本专利技术第一实施例文件包分巻识别方法的流程图; 图2为搜索结果排序示意图; 图3为搜索结果整合示意图4为本专利技术第二实施例文件包分巻识别方法的流程图; 图5为本专利技术第三实施例文件包分巻识别系统结构示意图; 图6为本专利技术第四实施例文件包分巻识别系统结构示意图; 图7为本专利技术第五实施例文件包分巻识别系统结构示意图; 图8为本专利技术第六实施例文件包分巻识别系统结构示意图; 图9为本专利技术第七实施例文件包分巻识别系统结构示意图; 图10为本专利技术第八实施例文件包分巻识别系统结构示意图; 图11为本专利技术第九实施例文件包分巻识别系统结构示意图; 图12为本专利技术第十实施例文件包分巻识别系统结构示意图; 图13为本专利技术第十一实施例文件包分巻识别系统结构示意图。具体实施例方式首先对本专利技术实施例文件包分巻的识别方法进行说明。可实现文件分巻处理的软件有多种,比如WinRAR。在使用分巻处理软件进行分巻处理过程 中产生的文件称为文件包分巻,本专利技术实施例通过比较各文件包分巻的分巻 号及文件列表,识别多个文件包分巻是否属于同组文件包分巻。下面结合附图,对本专利技术实施例进行详细描述。如图1所示为本专利技术实施例文件包分巻的识别方法,具体步骤如下步骤IOI,获取多个文件包分巻中的各文件包分巻的识别信息,所述识别 信息包括所述各文件包分巻的分巻号与文件列表,所述分巻号为生成文件包 分巻时各文件包分巻在同组文件包分巻中的序号,所述文件列表记录了各文 件包分巻所存储文件的属性信息。较佳地,可通过获取网络中所存储的文件包分巻的文件头信息,分析该络资源获取系统(如网络爬虫程序spider)获取文件包分巻的文件头信息。所 述分巻号及所述文件列表一经生成就不能被更改。所述各文件包分巻所存储 文件的属性信息包括文件名,文件大小,文件修改时间等。步骤102,根据所获取的各文件包分巻识别信息识别所述多个文件包分巻 是否属于同组文件包分巻。较佳地,所述根据所获取的各文件包分巻识别信息识别所述多个文件包 分巻是否属于同组文件包分巻包括比较分巻号相邻的文件包分巻的文件列表,如果分巻号较小的文件包分 巻的文件列表中最后一个文件的文件属性,与分巻号较大的文件包分巻的文 件列表中第一个文件的文件属性相同,则确定所述文件包分巻属于同组文件 包分巻。各文件包分巻有后续分巻属性,该属性用于标识文件包分巻是否为同组 文件包分巻中的最后一个文件包分巻。如果一个文件包分巻没有后续分巻,包分巻。则较佳地,各文件包分巻还具有后续分巻属性,该后续分巻属性为生成 文件包分巻时一并生成,如果一个文件包分巻的该属性值为是,则该文件包 分巻有后续分巻,如果该属性值为否,则该文件包分巻为其所属同组文件包 分巻的最后一个文件包分巻;当一个文件包分巻的所述是否有后续分巻属性比较。同组文件包分巻中存储了 一个或多个文件,在同组文件包分巻所存储的 文件中, 一个文件可能会被切分成几部分放到分巻号相邻的文件包分巻中, 所以在文件包分巻的文件列表中,还包括文件在各文件包分巻中是否存储完整的信息,例如在WinRARj欠件所生成的rar分巻中,文件完整度信息定义如 下1 )文件完整存在于该分巻,文件完整度信息为空;2) 文件有部分内容存在于该分巻之前的分巻,用符号'<-'表示;3) 文件有部分内容存在于该分巻后面的分巻,用符号'->,表示;4) 文件既有部分内容存在于该分巻前面的分巻,也有部分内容存在于该 分巻后面的分巻,用符号'<->,表示。例如有一组rar分巻,总共有4个rar分巻,分巻号分别为1-4号,各rar 分巻的文件列表的信息如表1所示<table>table see original document page 12</column></row><table>表1由表1可以看到,该组rar分巻共存储了 2个文件,"Thunder.exe"及 "WebThunder.exe"。在分巻1中,存储了 Thunder.exe文件,'->,表示 Thunder.exe在分巻1中并不完整,还有部分内容在后面的分巻里。在分巻2 中,同样存储了 Thunder.exe文件,'<-->'表示该文件有部分内容在前面的分 巻里,同时也有部分内容在后面的分巻里。在分巻3中,有Thunder.exe和 WebThunder.exe两个文件,'<-,表示Thunder.exe有部分内容在前面的分巻里, 但已经没有内容在后面的分巻里。至此,我们可以知道,Thunder.exe被切分 成3块,分布在分巻1、 2、 3中;除了 Thunder.exe之外,分巻3中还有WebThunder.exe,'->,表明它有部分内容在后面的分巻。在分巻4中存储了 文件WebThunder.exe,'<-,表明它有部分内容在前面的分巻。对于分布于不同分巻的同一个文件,其文件属性信息(文件名,文件大 小,文件修改时间等)是相同的,例如表1中的Thunder.exe在分巻1、 2、 3 中所记录的信本文档来自技高网...

【技术保护点】
一种文件包分卷识别方法,其特征在于,包括: 获取多个文件包分卷中的各文件包分卷的识别信息,所述识别信息包括所述各文件包分卷的分卷号与文件列表,所述分卷号为生成文件包分卷时各文件包分卷在同组文件包分卷中的序号,所述文件列表记录了各文件包分卷所存储文件的属性信息; 根据所获取的各文件包分卷识别信息识别所述多个文件包分卷是否属于同组文件包分卷。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈晓东张国强
申请(专利权)人:深圳市迅雷网络技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1