【技术实现步骤摘要】
一种文件处理方法及装置
本专利技术属于数据文件的存储、查询
,尤其涉及一种文件处理方法及装置。
技术介绍
在当前的互联网及信息化时代,产生了大量的文字信息,进而产生了大量的数据文件,其中word\excelxt\html\java\xml\css是最基本和常用的形式。对于这些大量的数据文件而言,必然面临着数据文件的存储和查询问题,目前市面上一般通过谷歌、百度等公司提供的商业化文件存储和查询服务,来进行数据文档的存储和查询,但是对于中小企业而言,目前的这些商业化存储和查询服务普遍存在费用较高,文件占用空间大,查询搜索速度慢等缺点。因此,本领域亟需提供一种较优的数据文件处理方法,以满足中小企业在文件存储及查询方面的需求,实现低成本、高效率地存储和查询各种数据文件。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种文件处理方法及装置,旨在实现能够低成本、高效率地存储和查询各种数据文件。为此,本专利技术公开如下技术方案:一种文件处理方法,用于实现文件存储,所述方法包括:获得待处理文件;对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;为每个文件块建立索引信息,得到每个文件块的文件块索引信息;将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。上述方法,优选的,所述获得待处理文件,包括:获得用户向文件服务器上传的待处理文件。上述方法,优选的,所述对所述待处理文件进行内容分块处理,包括:基于预定的数据量阈值,将 ...
【技术保护点】
一种文件处理方法,其特征在于,用于实现文件存储,所述方法包括:获得待处理文件;对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;为每个文件块建立索引信息,得到每个文件块的文件块索引信息;将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。
【技术特征摘要】
1.一种文件处理方法,其特征在于,用于实现文件存储,所述方法包括:获得待处理文件;对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;为每个文件块建立索引信息,得到每个文件块的文件块索引信息;将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。2.根据权利要求1所述的方法,其特征在于,所述获得待处理文件,包括:获得用户向文件服务器上传的待处理文件。3.根据权利要求1所述的方法,其特征在于,所述对所述待处理文件进行内容分块处理,包括:基于预定的数据量阈值,将所述待处理文件分为相应数量的文件块;其中,每个文件块的数据量不高于所述数据量阈值。4.根据权利要求1所述的方法,其特征在于,所述为每个文件块建立索引信息,得到每个文件块的文件块索引信息,包括:对每个文件块进行切词处理,得到所述每个文件块对应的关键字列表;根据所述每个文件块对应的关键字列表,为所述每个文件块建立关键字索引。5.一种文件处理方法,其特征在于,用于实现文件查询,基于如权利要求1-4任一项所述的方法,所述用于实现文件查询的文件处理方法包括:获得用户输入的文件查询信息;利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果;根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果。6.根据权利要求5所述的方法,其特征在于,所述获得用户输入的文件查询信息,包括:获得用户输入的用于进行文件查询的关键字。7.根据权利要求6所述的方法,其特征在于,所述文件块索引信息为关键字索引,则所述利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果,包括:在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,得到每个文件的文件块索引信息与所述关键字的匹配信息,并将所述匹配信息作为所述文件块索引信息查询结果。8.根据权利要求7所述的方法,其特征在于,所述在每个文件所对应的各文件块的关键字索引中,对用户输入的所述关键字进行匹配查询,包括:基于用户输入的所述关键字,对每个文件所对应的各个文件块的关键字索引进行并行的关键字匹配查询。9.根据权利要求7或8所述的方法,其特征在于,所述根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果,包括:根据各个文件的文件块索引信息与所述关键字的匹配信息,获得各个文件与所述关键字的匹配度;根据各个文件与所述关键字的匹配度,按匹配度降序的顺序对各个文件的文件目录进行排序,并将文件目录排序结果作为文件查询结果输出。10.根据权利要求9所述的方法,其特征在于,还包括:在接收到用户针对所述文件目录排序结果中相应文件目录的文件下载请求时,从所述相应文件目录中下载文件压...
【专利技术属性】
技术研发人员:王同庆,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。