一种文件检索的方法、系统、装置及计算机可读存储介质制造方法及图纸

技术编号:17363708 阅读:35 留言:0更新日期:2018-02-28 13:48
本发明专利技术公开了一种文件检索的方法,包括在顶层目录下创建多个子目录,分别计算顶层目录中各个文件的哈希值,并将各个文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据待查找文件的哈希值确定待查找文件所在的子目录,以便上层应用程序在子目录中调用待查找文件。本发明专利技术缩小了文件检索的范围,提高了检索速度,降低了上层应用程序的等待时间,在大数据量的条件下显著提高了用户的体验。本发明专利技术还公开了一种文件检索的系统、装置及计算机可读存储介质,具有上述有益效果。

A method, system, device and computer readable storage medium for file retrieval

The invention discloses a method for document retrieval, including the creation of multiple sub directory in the top-level directory, respectively calculate the hash value in the top-level directory of all files, and each file are stored into the hash value of the corresponding sub directory to find the file; calculate the hash value, and to find the file according to the hash value sure to find where the file directory, so that the upper application in the subdirectory call to find files. The invention reduces the scope of file retrieval, improves retrieval speed and reduces the waiting time of the upper application program, and significantly improves user experience under the condition of large data volume. The invention also discloses a system, a device and a computer readable storage medium for file retrieval, which has the beneficial effects.

【技术实现步骤摘要】
一种文件检索的方法、系统、装置及计算机可读存储介质
本专利技术涉及检索领域,特别是涉及一种文件检索的方法、系统、装置及计算机可读存储介质。
技术介绍
伴随着大数据的发展,数据的有效期越来越长,为了保存这些数据,不同的厂家和研究机构提出了多种存储方式,比如磁盘阵列、分布式存储等。但是无论何种存储方式,在操作系统层面都需要将数据保存成文件系统中的一个个文件。随着数据量的不断增多,在文件系统中同一个顶层目录下保存的文件数量也逐渐增大,若上层应用程序想调用顶层目录下的其中某一个或某一组文件实现某种功能时,需要操作系统先获取该顶层目录下的所有文件的信息,接着从所有文件信息中查找符合条件的文件,最后将查找到某一个或一组文件返回给上层应用程序,进行后续操作。当数据量较大时,操作系统将会读取大量无效数据,降低了文件检索的速度,增大了上层应用程序的等待时间。因此,如何提供一种解决上述结束问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种文件检索的方法,缩小了文件检索的范围,提高了检索速度,降低了上层应用程序的等待时间,在大数据量的条件下显著提高了用户的体验;本专利技术的另一目的是提供一种文件检索的系统、装置及计算机可读存储介质。为解决上述技术问题,本专利技术提供了一种文件检索的方法,包括:在顶层目录下创建多个子目录,分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。优选的,所述分别计算所述顶层目录中各个文件的哈希值的过程具体为:根据所述顶层目录中各个文件的文件名分别计算各个所述文件的哈希值。优选的,所述分别计算所述顶层目录中各个文件的哈希值的过程具体为:将所述顶层目录中各个文件的文件信息分别进行编码,根据各个所述文件对应的编码分别计算各个文件的哈希值,其中,所述文件信息包括文件名、文件大小、文件创建日期及文件修改日期。优选的,所述将各个所述文件分别存放到与其哈希值对应的子目录中的过程具体为:将各个所述文件分别存放到与其哈希值最低位对应的子目录中。优选的,所述根据所述待查找文件的哈希值确定所述待查找文件所在的子目录的过程具体为:步骤11:进入与所述待查找文件的哈希值的最低位对应的子目录,并将其设为当前目录,所述最低位设为当前位;步骤12:判断所述当前目录是否存在下一级子目录,若是,进入步骤13,若否,进入步骤14;步骤13:进入与所述待查找文件的哈希值的所述当前位的高一位对应的下一级子目录,将所述下一级子目录作为当前目录,并将与所述当前目录对应的所述哈希值的数位作为当前位,进入步骤12;步骤14:将所述当前目录确定为所述待查找文件所在的子目录。为解决上述技术问题,本专利技术还提供了一种文件检索的系统,包括:存储模块,用于在顶层目录中创建多个子目录,还用于分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;查找模块,用于计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。优选的,所述存储模块具体用于根据所述顶层目录中各个文件的文件名分别计算各个所述文件的哈希值。优选的,所述存储模块具体用于将各个所述文件分别存放到与其哈希值最低位对应的子目录中。为解决上述技术问题,本专利技术还提供了一种文件检索的装置,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述任意一项所述的文件检索方法的步骤。为解决上述技术问题,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述的文件检索方法的步骤。本专利技术提供了一种文件检索的方法,包括在顶层目录下创建多个子目录,分别计算顶层目录中各个文件的哈希值,并将各个文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据待查找文件的哈希值确定待查找文件所在的子目录,以便上层应用程序在子目录中调用待查找文件。可见,在实际应用中,采用本专利技术的方案,通过在顶层目录中创建多个子目录,将各个文件保存在与其哈希值相对应的子目录中,在对文件进行查找时,只需按照待查找文件的哈希值就可以确定待查找文件的准确位置,方便上层应用程序调用,缩小了文件检索的范围,提高了检索速度,降低了上层应用程序的等待时间,在大数据量的条件下显著提高了用户的体验。本专利技术还提供了一种文件检索的系统、装置及计算机可读存储介质,具有和上述文件检索方法相同的有益效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术所提供的一种文件检索方法的流程图;图2为本专利技术所提供的一种文件检索系统的结构示意图。具体实施方式本专利技术的核心是提供一种文件检索的方法,缩小了文件检索的范围,提高了检索速度,降低了上层应用程序的等待时间,在大数据量的条件下显著提高了用户的体验;本专利技术的另一核心是提供一种文件检索的系统、装置及计算机可读存储介质。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参照图1,图1为本专利技术所提供的一种文件检索方法的流程图,包括:步骤1:在顶层目录下创建多个子目录;步骤2:分别计算顶层目录中各个文件的哈希值,并将各个文件分别存放到与其哈希值对应的子目录中;具体的,当顶层目录中的文件总数达到一定阈值时,在顶层目录下创建多个子目录,由于本专利技术计算得到的哈希值为16进制数,所以子目录的个数为16,相应的命名方式可以为DIR_0-DIR_F,按照各文件计算得到的哈希值,将各个文件存放到与其哈希值对应的子目录中,具体的,若一个文件的哈希值为1234,则可以按不同的规则放到子目录DIR_1或子目录DIR_4中,按上述方法存储文件,为后续提升检索速度提供了基础,存放规则据实际情况而定,本专利技术在此不做限定。步骤3:计算待查找文件的哈希值,并根据待查找文件的哈希值确定待查找文件所在的子目录,以便上层应用程序在子目录中调用待查找文件。具体的,首先计算待查找文件的哈希值,根据待查找文件的哈希值,找到待查找文件所在的子目录,方便上层应用程序调用,缩小了文件检索的范围,提高了检索速度,降低了上层应用程序的等待时间,在大数据量的条件下显著提高了用户的体验。本专利技术提供了一种文件检索的方法,包括在顶层目录下创建多个子目录,分别计算顶层目录中各个文件的哈希值,并将各个文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据待查找文件的哈希值确定待查找文件所在的子目录,以便上层应用程序在本文档来自技高网...
一种文件检索的方法、系统、装置及计算机可读存储介质

【技术保护点】
一种文件检索的方法,其特征在于,包括:在顶层目录下创建多个子目录,分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。

【技术特征摘要】
1.一种文件检索的方法,其特征在于,包括:在顶层目录下创建多个子目录,分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。2.根据权利要求1所述的方法,其特征在于,所述分别计算所述顶层目录中各个文件的哈希值的过程具体为:根据所述顶层目录中各个文件的文件名分别计算各个所述文件的哈希值。3.根据权利要求1所述的方法,其特征在于,所述分别计算所述顶层目录中各个文件的哈希值的过程具体为:将所述顶层目录中各个文件的文件信息分别进行编码,根据各个所述文件对应的编码分别计算各个文件的哈希值,其中,所述文件信息包括文件名、文件大小、文件创建日期及文件修改日期。4.根据权利要求1所述的方法,其特征在于,所述将各个所述文件分别存放到与其哈希值对应的子目录中的过程具体为:将各个所述文件分别存放到与其哈希值最低位对应的子目录中。5.根据权利要求1-4任意一项所述的方法,其特征在于,所述根据所述待查找文件的哈希值确定所述待查找文件所在的子目录的过程具体为:步骤11:进入与所述待查找文件的哈希值的最低位对应的子目录,并将其设为当前目录,所述最低位设为当前位;步骤12:判断所述当前目录是否存在下一级子目录,若...

【专利技术属性】
技术研发人员:玄加林
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1