一种面向分布式资源站点的搜索系统及其实现方法技术方案

技术编号:13050328 阅读:55 留言:0更新日期:2016-03-23 15:56
本发明专利技术涉及资源搜索及共享技术领域,特别是一种面向分布式资源站点的搜索系统及其实现方法。本发明专利技术的资源站点模块发布资源服务到资源服务注册模块,同时根据资源类型进行授权;资源服务注册模块对该资源站点的资源服务进行注册;资源分检模块通过资源注册模块获取资源站点的资源服务信息,将资源服务信息发送到索引生成模块;索引生成模块对资源服务信息进行分析、计算和索引等一系列操作之后,将索引信息存储到资源索引库;用户通过资源查询模块对资源服务进行查询及访问。同时提供Web Service对外接口,让外部应用程序可调用搜索系统或直接访问资源站点并获取资源服务,实现资源共享。本发明专利技术能满足分布式资源站点的资源搜索及资源共享需要;可以用于分布式资源站点的资源搜索和共享。

【技术实现步骤摘要】

本专利技术涉及资源搜索及共享
,特别是。
技术介绍
随着互联网的发展和企业信息化建设的不断深入,企业内部各种信息应用平台的数量越来越多,平台上的数据资源也在快速增长,形成了分布性的数据资源站点;搜索系统是快速获取所需数据资源的重要服务,但一般的搜索系统搜索功能单一,不能搜索某些特殊数据资源,对某些机密的数据资源也没有采取身份认证和授权许可等安全措施,不能为用户提供方便快捷的资源搜索服务,也无法有效的保护企业机密数据资源。
技术实现思路
本专利技术解决的技术问题之一在于提供一种面向分布式资源站点的搜索系统;采用资源服务的方式,通过资源服务的发布实现资源索引和资源共享。本专利技术解决的技术问题之二在于提供一种面向分布式资源站点的搜索实现方法;基于资源服务,对数据资源进行分类,通过身份认证和授权许可,在提供资源搜索服务的同时有效的保护企业内部的机密数据资源。本专利技术解决上述技术问题之一的技术方案是:所述的系统由资源站点、资源服务注册、资源分检、索引生成、资源索引库和资源查询六大模块组成;所述的资源站点是搜索系统的数据源,主要负责发布资源服务、授权及提取数据资源,资源站点的数据资源可分为公共资源、共享资源和机密资源等不同的等级,对于共享资源和机密资源,必须获得相关授权才能使用;所述的资源服务注册负责注册各资源站点发布的资源服务,通过注册资源服务,获得资源站点具体提供的资源服务及其访问方法;所述的资源分检对资源采取不同的检索方式,对普通网页、视频文件等公共资源不需要授权,可使用常规的方法进行数据资源抓取;对于共享和机密文档等需要授权的,则返回文档的描述信息;所述的索引生成负责将收集到的资源服务相关信息进行整合,并根据相关度算法进行计算,最后生成网页索引保存到资源索引库;所述的资源索引库负责存储数据资源的索引信息;所述的资源查询负责对用户输入的关键词进行分解及搜索,然后从资源索引库中进行匹配查询并排序,最后将搜索结果的链接地址和页面内容摘要等内容整合起来以Web页面的形式反馈给用户。本专利技术解决上述技术问题之二的技术方案是:所述的方法按照以下流程步骤处理:第一步,资源站点发布本站点的资源服务到资源服务注册模块;第二步,资源服务注册模块负责对该资源站点的资源服务进行注册;第三步,资源分检模块通过资源服务注册模块获取资源站点的资源服务信息,将资源服务信息发送到索引生成模块;第四步,索引生成模块对资源服务信息进行分析、计算和索引等一系列操作之后,将索引信息存储到资源索引库;第五步,当用户通过资源查询模块进行查询时,资源查询模块负责对用户输入的关键词进行分解及搜索,然后从资源索引库中进行匹配查询并排序,最后将搜索结果的链接地址和页面内容摘要等内容整合起来以Web页面的形式反馈给用户;第六步,对于需要获得授权许可才能访问的资源,资源查询模块根据返回的索引信息,通过资源分检模块对相应的资源站点进行访问。所述的资源服务注册模块同时提供Web Service对外接口,让外部应用程序可调用搜索系统或直接访问资源站点并获取资源服务,实现资源共享。所述的资源站点主要提供发布资源服务;站点资源授权及身份认证;提取本站点各类数据资源。采用本专利技术的系统及方法,具有以下有益效果:(1)适用于分布式资源站点的资源搜索;(2)适用于分布式资源站点的资源共享;(3)采用资源服务的方式,按需获取;(4)采用Web Service技术,不受系统平台的限制;(5)采用资源分级和授权许可,有效保护敏感数据;(6)提供对外接口,外部应用程序可直接调用,以获取资源服务或集成搜索功能。【附图说明】下面结合附图对本专利技术进一步说明:图1是本专利技术的架构示意图。图2是本专利技术资源站点模块的资源服务发布的架构示意图。【具体实施方式】如图1所示,本专利技术的系统主要由资源站点、资源服务注册、资源分检、索引生成、资源索引库和资源查询六大模块组成。1、资源站点:资源站点是搜索系统的数据源,主要负责发布资源服务、授权及提取数据资源,资源站点的数据资源可分为公共资源、共享资源和机密资源等不同的等级,对于共享资源和机密资源,必须获得相关授权才能使用;2、资源服务注册:资源服务注册负责注册各资源站点发布的资源服务,通过注册资源服务,就可以知道资源站点具体提供的资源服务及其访问方法;3、资源分检:由于数据资源的类型不同,有公共资源、共享资源和机密资源之分,共享资源和机密资源需要授权才能使用,所以对资源应该采取不同的检索方式,比如对普通网页、视频文件等公共资源不需要授权,可使用常规的方法进行数据资源抓取,而对于共享和机密文档等需要授权的,则返回文档的描述信息;4、索引生成:索引生成负责将收集到的资源服务相关信息进行整合,并根据相关度算法进行计算,最后生成网页索引保存到资源索引库;5、资源索引库:资源索引库负责存储数据资源的索引信息;6、资源查询:资源查询负责对用户输入的关键词进行分解及搜索,然后从资源索引库中进行匹配查询并排序,最后将搜索结果的链接地址和页面内容摘要等内容整合起来以Web页面的形式反馈给用户。如图1所示,面向分布式资源站点的搜索系统的详细实施流程为:第一步,资源站点通过资源服务发布程序发布本站点的资源服务到资源注册模块;第二步,资源注册模块负责对该资源站点的资源服务进行注册;第三步,资源分检模块通过资源注册模块获取资源站点的资源服务信息,将资源服务信息发送到索引生成模块;第四步,索引生成模块对资源服务信息进行分析、计算和索引等一系列操作之后,将索引信息存储到资源索引库;第五步,当用户通过资源查询模块进行查询时,资源查询负责对用户输入的关键词进行分解及搜索,然后从资源索引库中进行匹配查询并排序,最后将搜索结果的链接地址和页面内容摘要等内容整合起来以Web页面的形式反馈给用户;第六步,对于需要获得授权许可才能访问的资源,资源查询模块根据返回的索引信息,通过资源分检模块对相应的资源站点进行访问。所述的资源服务注册模块同时提供Web Service对外接口,让外部应用程序可调用搜索系统或直接访问资源站点并获取资源服务,实现资源共享。如图2所示,资源站点的资源服务发布主要提供以下功能:1、发布资源服务;2、站点资源授权及身份认证;3、提取本站点各类数据资源。【主权项】1.一种面向分布式资源站点的搜索系统,其特征在于:所述的系统由资源站点、资源服务注册、资源分检、索引生成、资源索引库和资源查询六大模块组成; 所述的资源站点是搜索系统的数据源,主要负责发布资源服务、授权及提取数据资源,资源站点的数据资源可分为公共资源、共享资源和机密资源等不同的等级,对于共享资源和机密资源,必须获得相关授权才能使用; 所述的资源服务注册负责注册各资源站点发布的资源服务,通过注册资源服务,获得资源站点具体提供的资源服务及其访问方法; 所述的资源分检对资源采取不同的检索方式,对普通网页、视频文件等公共资源不需要授权,可使用常规的方法进行数据资源抓取;对于共享和机密文档等需要授权的,则返回文档的描述信息; 所述的索引生成负责将收集到的资源服务相关信息进行整合,并根据相关度算法进行计算,最后生成网页索引保存到资源索引库; 所述的资源索引库负责存储数据资源的索引信息; 所述的资源查询负责对用户输本文档来自技高网...

【技术保护点】
一种面向分布式资源站点的搜索系统,其特征在于:所述的系统由资源站点、资源服务注册、资源分检、索引生成、资源索引库和资源查询六大模块组成;所述的资源站点是搜索系统的数据源,主要负责发布资源服务、授权及提取数据资源,资源站点的数据资源可分为公共资源、共享资源和机密资源等不同的等级,对于共享资源和机密资源,必须获得相关授权才能使用;所述的资源服务注册负责注册各资源站点发布的资源服务,通过注册资源服务,获得资源站点具体提供的资源服务及其访问方法;所述的资源分检对资源采取不同的检索方式,对普通网页、视频文件等公共资源不需要授权,可使用常规的方法进行数据资源抓取;对于共享和机密文档等需要授权的,则返回文档的描述信息;所述的索引生成负责将收集到的资源服务相关信息进行整合,并根据相关度算法进行计算,最后生成网页索引保存到资源索引库;所述的资源索引库负责存储数据资源的索引信息;所述的资源查询负责对用户输入的关键词进行分解及搜索,然后从资源索引库中进行匹配查询并排序,最后将搜索结果的链接地址和页面内容摘要等内容整合起来以Web页面的形式反馈给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡文彬李勇波季统凯
申请(专利权)人:国云科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1