一种多类型文件的全文检索方法、装置、设备及介质制造方法及图纸

技术编号:41213139 阅读:17 留言:0更新日期:2024-05-09 23:36
本说明书实施例公开了一种多类型文件的全文检索方法,涉及计算机技术领域,用于解决现有受文件类型的多样性问题难以通过统一方式快速实现对于多类型文件的检索,导致检索效率低的问题。方法包括:获取数据拥有端上传的多类型文件,以对各多类型文件进行文件处理,获得各多类型文件的文件信息;其中,文件信息包括:文件类型、文本内容;将文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中,获得多类型文件的索引映射关系;接收数据获取端上传的内容检索信息,以使预置分布式搜索分析引擎基于索引映射关系对多类型文件进行全文检索,获得与内容检索信息相对应的文件,实现了对于多类型文件的高效检索。

【技术实现步骤摘要】

本说明书涉及内容检索,尤其涉及一种多类型文件的全文检索方法、装置、设备及介质


技术介绍

1、随着互联网技术的不断发展与数字化时代的到来,基于文本数据的电子文档的数量在过去的十几年中激增,各行各业在日常业务工作中都积累了大量的文档素材及稿件。例如在企业管理软件中由于在工作中需要经常查询或调阅往期同类型同主题的文档作为参考,然而,面对数量庞大,主题多样,格式各异,且分散在不同的人员手中的材料文档,难以进行统一检索。因此,文件检索是提高企业管理效率的一项重要技术。

2、现有技术中的大多数管理软件对于文件的管理是以单据为单位的,只有少部分理软件可对文件统一管理,进行实现对于文件查询的功能,然而随着各类文档编辑工具的不断发展,文件类型多种多样例如当前存在:excel、word、ppt、txt、pdf、img等多种格式的文件,此时用户需要检索哪个文件中包含某些关键字时,受文件类型的多样性问题难以通过统一方式快速实现对于多类型文件的检索,获得相对应的文件,使得文件管理过程效率较低。


技术实现思路>

1、为了解决本文档来自技高网...

【技术保护点】

1.一种多类型文件的全文检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,对各所述多类型文件进行文件处理,获得各所述多类型文件的文件信息,具体包括:

3.根据权利要求2所述的一种多类型文件的全文检索方法,其特征在于,所述基于预置文件类型检测策略对所述多类型文件进行类型识别,具体包括:

4.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,将所述文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中,获得所述多类型文件的索引映射关系,具体包括:

5.根据权利要求1所述的一种...

【技术特征摘要】

1.一种多类型文件的全文检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,对各所述多类型文件进行文件处理,获得各所述多类型文件的文件信息,具体包括:

3.根据权利要求2所述的一种多类型文件的全文检索方法,其特征在于,所述基于预置文件类型检测策略对所述多类型文件进行类型识别,具体包括:

4.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,将所述文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中,获得所述多类型文件的索引映射关系,具体包括:

5.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,将所述文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中之前,所述方法还包...

【专利技术属性】
技术研发人员:田金瓒
申请(专利权)人:浪潮城市服务科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1