【技术实现步骤摘要】
本专利技术涉及信息检索和人工智能技术,属于计算机。本专利技术设计了一种应用于企业内网的智能搜索引擎系统,该系统能够快速对内网指定内容索引并提供检索服务。
技术介绍
1、随着计算机信息技术的快速发展及应用,推动了各个领域的生产运行方式的变革。对于企业说,通过有效的信息化建设,可以帮助企业在提高生产效率的同时,降低运营成本,从而实现最大化的效益目标。但是信息化在给企业带来效率提升的同时也不可避免的带来了一些问题。通常企业在信息化建设中会将不同来源的数据集中在数据库中进行管理,虽然数据在物理上呈现为集中化管理,但是数据本身呈现为碎片化、孤岛化的特点,存在大量重复、无法溯源、无法利用的数据。因此,如何做到对这些数据的快速、准确的检索,从而为企业的发展赋能成为一个亟待解决的问题。
2、在通用领域,为了解决信息检索的问题出现了第一代搜索引擎技术:目录式搜索引擎。目录式搜索引擎(directory search engine)是最早出现的基于www的搜索引擎,以雅虎为代表,我国的搜狐也属于目录式搜索引擎。目录式搜索引擎通过人工发现,依靠编
...【技术保护点】
1.一种面向企业内网的智能搜索引擎系统,其特征在于,该系统分为采集器构建模块、采集器管理模块、数据管理模块、自然语言处理模块、检索模块和日志模块六大模块;所述采集器构建模块和采集器管理模块负责构造、管理一系列的采集器;采集器则负责按照预定流程采集、清洗、索引、入库数据;数据管理模块则为管理员提供了一个图形化的管理平台,方便在ElasticSearch索引库中增加、删除数据;自然语言处理模块提供文档向量化和文档相似度计算服务;检索模块接收到用户的查询请求之后通过和自然语言处理模块、ElasticSearch索引库交互,检索得到一系列和用户请求相关的文档,并按照相关性大小
...【技术特征摘要】
1.一种面向企业内网的智能搜索引擎系统,其特征在于,该系统分为采集器构建模块、采集器管理模块、数据管理模块、自然语言处理模块、检索模块和日志模块六大模块;所述采集器构建模块和采集器管理模块负责构造、管理一系列的采集器;采集器则负责按照预定流程采集、清洗、索引、入库数据;数据管理模块则为管理员提供了一个图形化的管理平台,方便在elasticsearch索引库中增加、删除数据;自然语言处理模块提供文档向量化和文档相似度计算服务;检索模块接收到用户的查询请求之后通过和自然语言处理模块、elasticsearch索引库交互,检索得到一系列和用户请求相关的文档,并按照相关性大小进行排序之后返回给用户。
2.根据权利要求1所述的一种面向企业内网的智能搜索引擎系统,其特征在于,该系统的实施过程如下:
3.根据权利要求1所述的一种面向企业内网的智能搜索引擎系统,其特征在于,采集器类型有三种:爬虫采集器、数据库采集器、接口采集器;选择对应的采集器之后,从组件...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。