一种FTP文件的全文检索方法及装置制造方法及图纸

技术编号:16101997 阅读:22 留言:0更新日期:2017-08-29 22:36
本发明专利技术公开了一种FTP文件的全文检索方法,该方法包括以下步骤:在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;针对每个新增文件,建立该新增文件的每个关键词的数据索引;根据建立的每个关键词的数据索引,更新目标目录对应的索引库;在接收到针对目标目录的目标词的检索请求时,在索引库中查找目标词的数据索引,生成并返回检索结果。应用本发明专利技术实施例所提供的技术方案,可以对FTP服务器中的文件进行全面检索,避免检索结果的片面性,提升了用户的检索体验。本发明专利技术还公开了一种FTP文件的全文检索装置,具有相应技术效果。

【技术实现步骤摘要】
一种FTP文件的全文检索方法及装置
本专利技术涉及计算机应用
,特别是涉及一种FTP文件的全文检索方法及装置。
技术介绍
FTP,即FileTransferProtocol,文件传输协议。支持FTP协议的服务器为FTP服务器。FTP服务器可以在互联网上提供存储空间,依照FTP协议提供服务。用户通过支持FTP协议的客户机程序,可以连接到远程主机上的FTP服务器程序,进而可以通过客户机程序向服务器程序发出命令,如检索命令,服务器程序执行用户发出的命令,将执行结果返回给客户机程序。在实际应用中,FTP服务器中存储的文件数量较大,用户多是通过检索方式检索所需的目标文件。目前,服务器程序多是通过将目标词与文件名称进行匹配,确定文件名称包含目标词的文件,作为检索结果返回给客户机程序,输出给用户。通过这种检索方法查找到的文件较为片面,用户的检索体验较差。
技术实现思路
本专利技术的目的是提供一种FTP文件的全文检索方法及装置,以对FTP服务器中的文件进行全面检索,避免检索结果的片面性,提升用户的检索体验。为解决上述技术问题,本专利技术提供如下技术方案:一种FTP文件的全文检索方法,包括:在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;针对每个新增文件,建立该新增文件的每个关键词的数据索引;根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。在本专利技术的一种具体实施方式中,所述在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件,包括:在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。在本专利技术的一种具体实施方式中,在所述确定该文件为新增文件之后,还包括:在所述本地配置文件中添加或者更新该文件的修改时间。在本专利技术的一种具体实施方式中,所述针对每个新增文件,建立该新增文件的每个关键词的数据索引,包括:开启多个线程,每个线程对应一个或多个新增文件;针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。在本专利技术的一种具体实施方式中,利用操作系统的定时任务命令确定所述时间间隔。在本专利技术的一种具体实施方式中,针对每个新增文件的每个关键词,该关键词的数据索引包括该关键词在该新增文件中出现的次数、出现的位置。一种FTP文件的全文检索装置,包括:新增文件确定模块,用于在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;数据索引建立模块,用于针对每个新增文件,建立该新增文件的每个关键词的数据索引;索引库更新模块,用于根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;检索结果返回模块,用于在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。在本专利技术的一种具体实施方式中,所述新增文件确定模块,包括:修改时间获取子模块,用于在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;新增文件确定子模块,用于针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。在本专利技术的一种具体实施方式中,还包括修改时间更新子模块,用于:在所述确定该文件为新增文件之后,在所述本地配置文件中添加或者更新该文件的修改时间。在本专利技术的一种具体实施方式中,所述数据索引建立模块,具体用于:开启多个线程,每个线程对应一个或多个新增文件;针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。应用本专利技术实施例所提供的技术方案,在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件,针对每个新增文件,建立该新增文件的每个关键词的数据索引,根据建立的每个关键词的数据索引,更新目标目录对应的索引库,在接收到针对目标目录的目标词的检索请求时,在索引库中查找目标词的数据索引,生成并返回检索结果。可以对FTP服务器中的文件进行全面检索,避免检索结果的片面性,提升了用户的检索体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中一种FTP文件的全文检索方法的实施流程图;图2为本专利技术实施例中FTP文件的全文检索系统框架示意图;图3为本专利技术实施例中一种FTP文件的全文检索装置的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1所示,为本专利技术实施例所提供的一种FTP文件的全文检索方法的实施流程图,该方法可以包括以下步骤:S110:在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件。在本专利技术实施例中,可以预先设定获取新增文件的时间间隔。在实际应用中,可以按照实际情况进行设定,在用户对FTP服务器使用较为频繁的时段,FTP服务器中的文件变化较快,可以设定较短的时间间隔,如设定为10分钟,在其他时段可以设定较长的时间间隔,如1小时。具体可以利用操作系统的定时任务命令确定时间间隔,在定时任务命令中可以包含定时参数和要启动的获取新增文件的任务的可执行程序路径,按照设定的时间参数定时启动新增文件获取任务。如果时间参数设置的短,则可以近乎实时地对FTP服务器目标目录中的新增文件进行监控。在达到设定的时间间隔时,可以确定FTP服务器中目标目录的新增文件。具体的,可以通过监控文件变化的日志进行确定。目标目录为FTP服务器中预先设定的任意一个目录。在本专利技术的一种具体实施方式中,步骤S110可以包括以下步骤:步骤一:在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;步骤二:针对目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。为便于描述,将上述两个步骤结合起来进行说明。在本专利技术实施例中,可以通过编程语言接口获取FTP服务器中目标目录的每个文件的修改时间。通过文件的修改时间可以确定文件是否为新增文件。本地配置文件用于记录目标目录中每个文件的修改时间。针对目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,则表明之前目标目录中没有该文件,可以确定该文件为新增文件,或者,如果该本文档来自技高网
...
一种FTP文件的全文检索方法及装置

【技术保护点】
一种FTP文件的全文检索方法,其特征在于,包括:在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;针对每个新增文件,建立该新增文件的每个关键词的数据索引;根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。

【技术特征摘要】
1.一种FTP文件的全文检索方法,其特征在于,包括:在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件;针对每个新增文件,建立该新增文件的每个关键词的数据索引;根据建立的每个关键词的数据索引,更新所述目标目录对应的索引库;在接收到针对所述目标目录的目标词的检索请求时,在所述索引库中查找所述目标词的数据索引,生成并返回检索结果。2.根据权利要求1所述的FTP文件的全文检索方法,其特征在于,所述在达到设定的时间间隔时,确定FTP服务器中目标目录的新增文件,包括:在达到设定的时间间隔时,获取FTP服务器中目标目录的每个文件的修改时间;针对所述目标目录的每个文件,如果本地配置文件中没有记录该文件的修改时间,或者该文件的修改时间在所述本地配置文件中记录的该文件的修改时间之后,则确定该文件为新增文件。3.根据权利要求2所述的FTP文件的全文检索方法,其特征在于,在所述确定该文件为新增文件之后,还包括:在所述本地配置文件中添加或者更新该文件的修改时间。4.根据权利要求1至3任一项所述的FTP文件的全文检索方法,其特征在于,所述针对每个新增文件,建立该新增文件的每个关键词的数据索引,包括:开启多个线程,每个线程对应一个或多个新增文件;针对每个新增文件,使用该新增文件对应的线程对该新增文件进行分析,获得该新增文件的文件内容;根据该新增文件的文件内容,建立该新增文件的每个关键词的数据索引。5.根据权利要求4所述的FTP文件的全文检索方法,其特征在于,利用操作系统的定时任务命令确定所述时间间隔。6.根据权利要求4所述的FTP文件的全文检索方法,其特征在于,针对每...

【专利技术属性】
技术研发人员:金洪殿李栋梁
申请(专利权)人:广东浪潮大数据研究有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1