【技术实现步骤摘要】
加快ES文件进行本地全文检索的方法、系统、装置及介质
[0001]本专利技术涉及数据检索
,尤其涉及一种加快ES文件进行本地全文检索的方法、系统、装置及介质。
技术介绍
[0002]随着技术的发展,PC电脑的硬盘容量越来越大,电脑上可存放的文件也越来越多,也因此延伸出了以下问题:用户有时候为了检索查找一个文件,需要花费较长的时间。由于Windows系统自带的文件检索功能查找速度太慢,人们希望实现快速地对全盘文件夹和文件进行检索,因此诞生许多相应的检索软件,其中包括Elasticsearch软件。Elasticsearch软件的实现原理主要分为以下几个步骤,首先用户将数据提交到Elasticsearch数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,根据权重将结果排名,打分,再将返回结果呈现给用户。然而,其中将数据提交到Elasticsearch数据库中的过程中非常耗时,极大地影响了用户的使用体验。
技术实现思路
[0003]为至少一定程度上解决现有技术中 ...
【技术保护点】
【技术特征摘要】
1.一种加快ES文件进行本地全文检索的方法,其特征在于,包括以下步骤:采用fsutil工具的文件记录读取功能对磁盘中文件夹的文件信息进行采集;将文件信息保存至预设的程序内存中,并命名为original;根据original获取磁盘中文件的全路径,对全路径进行处理,获得文件列表;根据文件列表将磁盘中的文件内容上传至Elasticsearch数据库中;输入需要检索的关键字,根据关键字和Elasticsearch数据库获得检索结果。2.根据权利要求1所述的一种加快ES文件进行本地全文检索的方法,其特征在于,所述文件信息包括文件名、文件ID、父文件ID以及时间戳;所述将文件信息保存至预设的程序内存中,并命名为original,包括:利用HashMap对象将文件ID作为key,文件名作为value,保存至预设的程序内存中,并命名为original。3.根据权利要求2所述的一种加快ES文件进行本地全文检索的方法,其特征在于,所述根据original获取磁盘中文件的全路径,对全路径进行处理,获得文件列表,包括:将全路径存放入TreeMap对象中,对TreeMap对象进行排序;根据排序后的TreeMap对象将所有文件的全路径存入HashMap对象中,命名为fileListMap;根据磁盘中文件夹从fileListMap中取出所有文件列表,命名为fileList。4.根据权利要求3所述的一种加快ES文件进行本地全文检索的方法,其特征在于,存入HashMap对象的全路径与文件之间存有映射关系(key,value),其中,key表示文件夹全路径,value表示以全路径为前缀的文件保存的List对象。5.根据权利要求1所述的一种加快ES文件进行本地全文检索的方法,其特征在于,所述根据文件列表将磁盘中的文件内容上传至Elasticsearch数据库中,包括:根据文件列表对每个文件进行后缀过滤,获取预设格式文件中包含的文本内容;采用c...
【专利技术属性】
技术研发人员:周磊,蓝飘,曹纪梅,蔡志坚,黄泓凯,田丰,
申请(专利权)人:广州广电运通金融电子股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。