一种基于多数据源的企业搜索引擎技术制造技术

技术编号：5284038 阅读：445 留言：0更新日期：2012-04-11 18:40

一种基于多数据源的福富企业搜索引擎技术将企业内部、外部数据统一于同一平台，搜索不同来源地数据信息，支持多种数据格式，包括结构化数据（各种关系型数据库，如Ｏｒａｃｌｅ、Ｍｙｓｑｌ、ＳＱＬ　Ｓｅｒｖｅｒ等）、非结构化数据（如ｗｏｒｄ、ｅｘｃｅｌ、ｐｐｔ、ｐｄｆ等）和半结构化数据（如ｘｍｌ等）。首先使用不同的数据采集方式搜集各类信息，对于采集到的信息对象，先要进行一定的智能处理，然后再建立索引，该系统支持按字索引、按词索引、按关键词索引等索引策略，能够适应不同应用环境的需求。之后，将在搜索引擎的中心数据库中进行统一的存储管理，该系统具备强大的结构化、非结构化和半结构化信息的处理和检索能力，它是整个搜索引擎的数据仓储中心，也是整个搜索引擎的检索动力核心，最终的搜索结果在门户页面上展示。

全部详细技术资料下载

【技术实现步骤摘要】

针对传统的信息检索方式中数据源单一的缺点，本专利技术对该缺点进行了改进，并提出支持多数据源的一种企业搜索引擎技术，主要研究如何在复杂的应用系统环境下，对企业知识资产进行统一管理规划，本专利技术属于企业管理自动化领域。
技术介绍
随着企业信息化的逐步普及，企业拥有越来越多的、各式各样的电子文件和数据信息，面临“信息爆炸”的挑战，搜索引擎方便了人们的生活，计算机操作人员若要找到所需资料，首先想到的是去网上找，目前最常用的搜索引擎为百度、Google等几家搜索引擎，对于企业员工而言，若要找企业内部的信息，则使用网页的搜索引擎是无法满足要求的。企业的数据包括数据库信息、邮件信息、网页信息已经各种文档形式的信息，因此，企业需要一个能够同时搜索各类信息的企业搜索引擎。
技术实现思路
技术问题本专利技术的目的是建立一种支持多数据源的是企业搜索引擎，企业搜索弓I擎需要支持尽可能多的数据源和应用系统，包括企业内和企业外的数据。对于这些企业内的数据，经过和业务系统的耦合，可以通过简单的系统配置和一定的数据更新策略来完成数据的采集和建立索引工作；对于企业外的数据搜索处理...

【技术保护点】
一种基于多数据源的福富企业搜索引擎技术，其特征在于系统同时支持企业内部数据（数据库数据）、外部数据处理（网页、邮件等数据）：复杂的应用系统环境下，企业内部数据知识管理系统与各业务系统的数据融合将采用几种方式：界面层耦合、业务层耦合、数据层耦合。经过和业务系统的耦合，对于这些企业内的数据，可以通过简单的系统配置和一定的数据更新策略来完成数据的采集和建立索引工作。对于企业外的数据搜索处理，通过页面抓取技术将目标网页抓取，解析页面内容并索引处理，经过处理后的Ｉｎｔｅｒｎｅｔ数据和企业内的数据一起进行分类。当企业员工使用搜索查询相关信息时，可以同时得到企业内和企业外的相关数据，通过定时抓取网页更新索引...

【技术特征摘要】

【专利技术属性】
技术研发人员：黄震奇，江勇，林乐然，罗志伟，陈华光，
申请(专利权)人：福建富士通信息软件有限公司，
类型：发明
国别省市：35[中国|福建]

全部详细技术资料下载我是这个专利的主人