【技术实现步骤摘要】
本专利技术涉及的是信息
的系统,具体的说是基于最小依赖的细粒度科研数据融合系统,用于有目标地收集Internet上科学研究方面的数据。
技术介绍
信息融合系统是对多源异构数据提供统一的存储、查询和管理的系统。由于数据在不同的数据源中有不同的表示方式,所以需要针对各个数据源设定特定的数据获取方法,并对这些数据加以整合,形成具有实用意义的数据。当前,数据融合的数据来源是由数据融合系统方主动查找,并且在找到的数据源模式和融合系统的目标模式之间建立映射关系。这种方式具有很大的被动性,容易忽略一些较小的、零散的、未被广泛知晓的数据源,例如科研课题发布信息。同时,当前使用的数据映射方法需要较为专业的知识,这在某种程度上也就造成了普通的数据源提供者加入数据融合系统、为数据融合系统提供数据的难度。因此,为了从根本上解决多源异构数据融合系统的灵活性、可扩展性和简单易用性,需要研发一个开放的,使数据源所有者可以主动参与的,并且能够为广大使用者提供服务的新数据融合系统。 经对现有技术文献的检索发现,中国专利申请号200710042896. X,专利技术名称基于海量交通信息的融合系统,公 ...
【技术保护点】
一种基于最小依赖的细粒度科研数据融合系统,其特征在于:包括数据采集服务器、信息融合服务器、映射及依赖管理服务器、系统交互管理服务器以及数据发布服务器;其中系统交互管理服务器和信息融合服务器之间以及系统交互管理服务器和映射及依赖管理服务器之间分别通过网络连接;信息融合服务器分别与映射及依赖管理服务器、数据采集服务器、数据发布服务器、系统交互服务器连接;所述数据采集服务器是能够以指定方式访问网络上的数据库、HTML、XML数据,并获取相应信息的计算机;所述映射及依赖管理服务器是专门用于存储和管理数据源、系统最小依赖集和数据源模式到该融合系统基础数据模式映射关系的计算机;所述信息 ...
【技术特征摘要】
1.一种基于最小依赖的细粒度科研数据融合系统,其特征在于包括数据采集服务器、信息融合服务器、映射及依赖管理服务器、系统交互管理服务器以及数据发布服务器;其中系统交互管理服务器和信息融合服务器之间以及系统交互管理服务器和映射及依赖管理服务器之间分别通过网络连接;信息融合服务器分别与映射及依赖管理服务器、数据采集服务器、数据发布服务器、系统交互服务器连接; 所述数据采集服务器是能够以指定方式访问网络上的数据库、HTML、XML数据,并获取相应信息的计算机; 所述映射及依赖管理服务器是专门用于存储和管理数据源、系统最小依赖集和数据源模式到该融合系统基础数据模式映射关系的计算机; 所述信息融合服务器是从映射及依赖管理服务器获取数据源信息,调度数据采集服务器,获取数据采集服务器返回结果,并进行数据融合处理的计算机; 所述系统交互管理服务器是为管理用户和数据源用户提供数据融合系统可视化操作界面的计算机; 所述数据发布服务器是指专门用于接受数据用户请求,并把结果反馈给数据用户的计算机。2.根据权利要求I所述的基于最小依赖的细粒度科研数据融合系统,其特征在于所述的信息融合服务器包括数据融合引擎、融合信息数据库、查询处理模块、融合规则管理模块以及融合规则数据库;其中数据融合引擎和映射和依赖管理服务器相连,用于获取映射信息和数据源信息;数据融合引擎和融合规则数据库相连,用于处理采集器返回数据的融合问题;融合规则管理模块和融合规则数据库相连,为融合规则的管理提供接口 ;融合规则管理模块和系统交互管理服务器相连,用于响应管理用户对融合规则的管理;数据融合引擎和融合信息数据库相连,用于存储融合结果;数据存储数据库和数据发布服务器相连,把数据融合结果反馈给用户。3.根据权利要求I所述的基于最小依赖的细粒度科研数据融合系统,其特征在于所述映射及依赖管理服务器包括映射规则及依赖关系数据库、映射规则存取模块以及映射规则管理模块;其中映射规则存取模块则为信息融合服务器提供了访问映射规则及依赖关系数据库的接口 ;映射规则管理模块是为系统交互管理服务器提供管理映射规则及依赖关系数据库的接口。4.根据权利要求I所述的基于最小依赖的细粒度科研数据融...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。