The invention discloses a method for document retrieval, including the creation of multiple sub directory in the top-level directory, respectively calculate the hash value in the top-level directory of all files, and each file are stored into the hash value of the corresponding sub directory to find the file; calculate the hash value, and to find the file according to the hash value sure to find where the file directory, so that the upper application in the subdirectory call to find files. The invention reduces the scope of file retrieval, improves retrieval speed and reduces the waiting time of the upper application program, and significantly improves user experience under the condition of large data volume. The invention also discloses a system, a device and a computer readable storage medium for file retrieval, which has the beneficial effects.
【技术实现步骤摘要】
一种文件检索的方法、系统、装置及计算机可读存储介质
本专利技术涉及检索领域,特别是涉及一种文件检索的方法、系统、装置及计算机可读存储介质。
技术介绍
伴随着大数据的发展,数据的有效期越来越长,为了保存这些数据,不同的厂家和研究机构提出了多种存储方式,比如磁盘阵列、分布式存储等。但是无论何种存储方式,在操作系统层面都需要将数据保存成文件系统中的一个个文件。随着数据量的不断增多,在文件系统中同一个顶层目录下保存的文件数量也逐渐增大,若上层应用程序想调用顶层目录下的其中某一个或某一组文件实现某种功能时,需要操作系统先获取该顶层目录下的所有文件的信息,接着从所有文件信息中查找符合条件的文件,最后将查找到某一个或一组文件返回给上层应用程序,进行后续操作。当数据量较大时,操作系统将会读取大量无效数据,降低了文件检索的速度,增大了上层应用程序的等待时间。因此,如何提供一种解决上述结束问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种文件检索的方法,缩小了文件检索的范围,提高了检索速度,降低了上层应用程序的等待时间,在大数据量的条件下显著提高了用户的体验;本专利技术的另一目的是提供一种文件检索的系统、装置及计算机可读存储介质。为解决上述技术问题,本专利技术提供了一种文件检索的方法,包括:在顶层目录下创建多个子目录,分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。优 ...
【技术保护点】
一种文件检索的方法,其特征在于,包括:在顶层目录下创建多个子目录,分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。
【技术特征摘要】
1.一种文件检索的方法,其特征在于,包括:在顶层目录下创建多个子目录,分别计算所述顶层目录中各个文件的哈希值,并将各个所述文件分别存放到与其哈希值对应的子目录中;计算待查找文件的哈希值,并根据所述待查找文件的哈希值确定所述待查找文件所在的子目录,以便上层应用程序在所述子目录中调用所述待查找文件。2.根据权利要求1所述的方法,其特征在于,所述分别计算所述顶层目录中各个文件的哈希值的过程具体为:根据所述顶层目录中各个文件的文件名分别计算各个所述文件的哈希值。3.根据权利要求1所述的方法,其特征在于,所述分别计算所述顶层目录中各个文件的哈希值的过程具体为:将所述顶层目录中各个文件的文件信息分别进行编码,根据各个所述文件对应的编码分别计算各个文件的哈希值,其中,所述文件信息包括文件名、文件大小、文件创建日期及文件修改日期。4.根据权利要求1所述的方法,其特征在于,所述将各个所述文件分别存放到与其哈希值对应的子目录中的过程具体为:将各个所述文件分别存放到与其哈希值最低位对应的子目录中。5.根据权利要求1-4任意一项所述的方法,其特征在于,所述根据所述待查找文件的哈希值确定所述待查找文件所在的子目录的过程具体为:步骤11:进入与所述待查找文件的哈希值的最低位对应的子目录,并将其设为当前目录,所述最低位设为当前位;步骤12:判断所述当前目录是否存在下一级子目录,若...
【专利技术属性】
技术研发人员:玄加林,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。