【技术实现步骤摘要】
本说明书涉及内容检索,尤其涉及一种多类型文件的全文检索方法、装置、设备及介质。
技术介绍
1、随着互联网技术的不断发展与数字化时代的到来,基于文本数据的电子文档的数量在过去的十几年中激增,各行各业在日常业务工作中都积累了大量的文档素材及稿件。例如在企业管理软件中由于在工作中需要经常查询或调阅往期同类型同主题的文档作为参考,然而,面对数量庞大,主题多样,格式各异,且分散在不同的人员手中的材料文档,难以进行统一检索。因此,文件检索是提高企业管理效率的一项重要技术。
2、现有技术中的大多数管理软件对于文件的管理是以单据为单位的,只有少部分理软件可对文件统一管理,进行实现对于文件查询的功能,然而随着各类文档编辑工具的不断发展,文件类型多种多样例如当前存在:excel、word、ppt、txt、pdf、img等多种格式的文件,此时用户需要检索哪个文件中包含某些关键字时,受文件类型的多样性问题难以通过统一方式快速实现对于多类型文件的检索,获得相对应的文件,使得文件管理过程效率较低。
技术实现思路
>1、为了解决本文档来自技高网...
【技术保护点】
1.一种多类型文件的全文检索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,对各所述多类型文件进行文件处理,获得各所述多类型文件的文件信息,具体包括:
3.根据权利要求2所述的一种多类型文件的全文检索方法,其特征在于,所述基于预置文件类型检测策略对所述多类型文件进行类型识别,具体包括:
4.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,将所述文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中,获得所述多类型文件的索引映射关系,具体包括:
5.根据
...【技术特征摘要】
1.一种多类型文件的全文检索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,对各所述多类型文件进行文件处理,获得各所述多类型文件的文件信息,具体包括:
3.根据权利要求2所述的一种多类型文件的全文检索方法,其特征在于,所述基于预置文件类型检测策略对所述多类型文件进行类型识别,具体包括:
4.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,将所述文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中,获得所述多类型文件的索引映射关系,具体包括:
5.根据权利要求1所述的一种多类型文件的全文检索方法,其特征在于,将所述文件信息基于预置文档数据模型同步到预置分布式搜索分析引擎中之前,所述方法还包...
【专利技术属性】
技术研发人员:田金瓒,
申请(专利权)人:浪潮城市服务科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。