一种文件处理方法及装置制造方法及图纸

技术编号:17970614 阅读:41 留言:0更新日期:2018-05-16 11:26
本发明专利技术提供的文件处理方法及装置,在对文件进行存储处理时,对文件进行内容分块并为分块所得的各文件块建立索引信息,在此基础上,对文件目录、文件分块信息及文件块索引信息进行对应存储,同时对文件进行压缩存储并删除原始文件;后续具体通过对文件对应的各文件块索引信息进行查询,来实现所需的文件查询。由于本发明专利技术方案对文件目录、文件分块信息及文件块索引信息进行对应存储,同时对文件进行压缩存储并删除原始文件,从而与存储原始文件的传统存储方式相比,可有效节约存储空间,同时,由于本发明专利技术对文件的各文件块索引信息而非原始文件进行查询,从而可提升文件查询效率,鉴于此,本发明专利技术可实现低成本、高效率地存储和查询各种数据文件。

【技术实现步骤摘要】
一种文件处理方法及装置
本专利技术属于数据文件的存储、查询
,尤其涉及一种文件处理方法及装置。
技术介绍
在当前的互联网及信息化时代,产生了大量的文字信息,进而产生了大量的数据文件,其中word\excelxt\html\java\xml\css是最基本和常用的形式。对于这些大量的数据文件而言,必然面临着数据文件的存储和查询问题,目前市面上一般通过谷歌、百度等公司提供的商业化文件存储和查询服务,来进行数据文档的存储和查询,但是对于中小企业而言,目前的这些商业化存储和查询服务普遍存在费用较高,文件占用空间大,查询搜索速度慢等缺点。因此,本领域亟需提供一种较优的数据文件处理方法,以满足中小企业在文件存储及查询方面的需求,实现低成本、高效率地存储和查询各种数据文件。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种文件处理方法及装置,旨在实现能够低成本、高效率地存储和查询各种数据文件。为此,本专利技术公开如下技术方案:一种文件处理方法,用于实现文件存储,所述方法包括:获得待处理文件;对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;为每个文件块建立索引信息,得到每个文件块的文件块索引信息;将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。上述方法,优选的,所述获得待处理文件,包括:获得用户向文件服务器上传的待处理文件。上述方法,优选的,所述对所述待处理文件进行内容分块处理,包括:基于预定的数据量阈值,将所述待处理文件分为相应数量的文件块;其中,每个文件块的数据量不高于所述数据量阈值;上述方法,优选的,所述为每个文件块建立索引信息,得到每个文件块的文件块索引信息,包括:对每个文件块进行切词处理,得到所述每个文件块对应的关键字列表;根据所述每个文件块对应的关键字列表,为所述每个文件块建立关键字索引。一种文件处理方法,用于实现文件查询,所述用于实现文件查询的文件处理方法包括:获得用户输入的文件查询信息;利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果;根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果。上述方法,优选的,所述获得用户输入的文件查询信息,包括:获得用户输入的用于进行文件查询的关键字。上述方法,优选的,所述文件块索引信息为关键字索引,则所述利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果,包括:在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,得到每个文件的文件块索引信息与所述关键字的匹配信息,并将所述匹配信息作为所述文件块索引信息查询结果。上述方法,优选的,所述在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,包括:基于用户输入的所述关键字,对每个文件所对应的各个文件块的关键字索引进行并行的关键字匹配查询。上述方法,优选的,所述根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果,包括:根据各个文件的文件块索引信息与所述关键字的匹配信息,获得各个文件与所述关键字的匹配度;根据各个文件与所述关键字的匹配度,按匹配度降序的顺序对各个文件的文件目录进行排序,并将文件目录排序结果作为文件查询结果输出。上述方法,优选的,还包括:在接收到用户针对所述文件目录排序结果中相应文件目录的文件下载请求时,从所述相应文件目录中下载文件压缩包。一种文件处理装置,用于实现文件存储,所述装置包括:第一获取单元,用于获得待处理文件;文件分块单元,用于对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;索引建立单元,用于为每个文件块建立索引信息,得到每个文件块的文件块索引信息;存储单元,用于将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;以及对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。上装装置,优选的,所述第一获取单元,具体用于:获得用户向文件服务器上传的待处理文件。上装装置,优选的,所述文件分块单元,具体用于:基于预定的数据量阈值,将所述待处理文件分为相应数量的文件块;其中,每个文件块的数据量不高于所述数据量阈值。上装装置,优选的,所述索引建立单元,具体用于:对每个文件块进行切词处理,得到所述每个文件块对应的关键字列表;根据所述每个文件块对应的关键字列表,为所述每个文件块建立关键字索引。一种文件处理装置,用于实现文件查询,所述用于实现文件查询的文件处理装置包括:第二获取单元,用于获得用户输入的文件查询信息;查询单元,用于利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果;查询结果生成单元,用于根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果。上装装置,优选的,所述第二获取单元具体用于:获得用户输入的用于进行文件查询的关键字。上装装置,优选的,所述文件块索引信息为关键字索引,则所述查询单元,具体用于:在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,得到每个文件的文件块索引信息与所述关键字的匹配信息,并将所述匹配信息作为所述文件块索引信息查询结果。上装装置,优选的,所述查询单元,在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,具体包括:基于用户输入的所述关键字,对每个文件所对应的各个文件块的关键字索引进行并行的关键字匹配查询。上装装置,优选的,所述查询结果生成单元,具体用于:根据各个文件的文件块索引信息与所述关键字的匹配信息,获得各个文件与所述关键字的匹配度;根据各个文件与所述关键字的匹配度,按匹配度降序的顺序对各个文件的文件目录进行排序,并将文件目录排序结果作为文件查询结果输出。上装装置,优选的,还包括:文件下载单元,用于在接收到用户针对所述文件目录排序结果中相应文件目录的文件下载请求时,从所述相应文件目录中下载文件压缩包。由以上方案可知,本专利技术提供的文件处理方法及装置,在对文件进行存储处理时,对文件进行内容分块并为分块所得的各文件块建立索引信息,在此基础上,对文件目录、文件分块信息及文件块索引信息进行对应存储,同时对文件进行压缩存储并删除原始文件;后续具体通过对文件对应的各文件块索引信息进行查询,来实现所需的文件查询。由于本专利技术方案对文件目录、文件分块信息及文件块索引信息进行对应存储,同时对文件进行压缩存储并删除原始文件,从而与存储原始文件的传统存储方式相比,可有效节约存储空间,同时,由于本专利技术对文件的各文件块索引信息而非原始文件进行查询,从而可提升文件查询效率,鉴于此,本专利技术可实现低成本、高效率地存储和查询各种数据文件。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的本文档来自技高网...
一种文件处理方法及装置

【技术保护点】
一种文件处理方法,其特征在于,用于实现文件存储,所述方法包括:获得待处理文件;对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;为每个文件块建立索引信息,得到每个文件块的文件块索引信息;将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。

【技术特征摘要】
1.一种文件处理方法,其特征在于,用于实现文件存储,所述方法包括:获得待处理文件;对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;为每个文件块建立索引信息,得到每个文件块的文件块索引信息;将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。2.根据权利要求1所述的方法,其特征在于,所述获得待处理文件,包括:获得用户向文件服务器上传的待处理文件。3.根据权利要求1所述的方法,其特征在于,所述对所述待处理文件进行内容分块处理,包括:基于预定的数据量阈值,将所述待处理文件分为相应数量的文件块;其中,每个文件块的数据量不高于所述数据量阈值。4.根据权利要求1所述的方法,其特征在于,所述为每个文件块建立索引信息,得到每个文件块的文件块索引信息,包括:对每个文件块进行切词处理,得到所述每个文件块对应的关键字列表;根据所述每个文件块对应的关键字列表,为所述每个文件块建立关键字索引。5.一种文件处理方法,其特征在于,用于实现文件查询,基于如权利要求1-4任一项所述的方法,所述用于实现文件查询的文件处理方法包括:获得用户输入的文件查询信息;利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果;根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果。6.根据权利要求5所述的方法,其特征在于,所述获得用户输入的文件查询信息,包括:获得用户输入的用于进行文件查询的关键字。7.根据权利要求6所述的方法,其特征在于,所述文件块索引信息为关键字索引,则所述利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果,包括:在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,得到每个文件的文件块索引信息与所述关键字的匹配信息,并将所述匹配信息作为所述文件块索引信息查询结果。8.根据权利要求7所述的方法,其特征在于,所述在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,包括:基于用户输入的所述关键字,对每个文件所对应的各个文件块的关键字索引进行并行的关键字匹配查询。9.根据权利要求7或8所述的方法,其特征在于,所述根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果,包括:根据各个文件的文件块索引信息与所述关键字的匹配信息,获得各个文件与所述关键字的匹配度;根据各个文件与所述关键字的匹配度,按匹配度降序的顺序对各个文件的文件目录进行排序,并将文件目录排序结果作为文件查询结果输出。10.根据权利要求9所述的方法,其特征在于,还包括:在接收到用户针对所述文件目录排序结果中相应文件目录的文件下载请求时,从所述相应文件目录中下载文件压...

【专利技术属性】
技术研发人员:王同庆
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1