资源描述框架分布式引擎及增量式更新方法技术

技术编号：13075190 阅读：32 留言：0更新日期：2016-03-30 10:49

本发明专利技术提供一种资源描述框架分布式引擎及增量式更新方法，RDF分布式引擎部署在计算机集群上，通过主节点接收查询语言和SPARQL语句，对SPARQL语句进行解析，以将其转换为查询子图，并从N个从节点中确定SPARQL语句中RDF数据的对应从节点，根据查询子图生成操作日志及执行计划，并将SPARQL语句、执行计划发送及操作日志发送至主节点中的备份管理器，将SPARQL语句与执行计划发送至对应节点，并对对应从节点上的数据进行备份，由对应从节点用于根据执行计划，通过增量式方式更新内存。该过程中，通过增加能够解析SPARQL语句的查询解析器，使RDF分布式引擎能够支持数据更新语句，从而支持动态数据源。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语义网数据库检索技术，尤其涉及一种。
技术介绍
语义网(Semantic Web)通过给万维网上的文档，如超级文本标记语言(HyperTextMarkup Language，HTML)添加能够被计算机所理解的语义(Meta data)，从而使整个互联网成为一个通用的信息交换媒介。资源描述框架(Resource Descript1n Framework，RDF)是描述万维网资源的标准模型。基于RDF数据进行语义网的研究过程中，通过搜索引擎，如分布式引擎TriAD对RDF数据进行存储和查询等。具体的，分布式搜索引擎TriAD采用关系型存储模型进行数据存储，对RDF数据模型进行优化，从而有自己的图数据剪枝、查询语言和数据获取协议(SimpleProtocol and RDF Query Language，SPARQL)语句预处理机制，具有较高的查询效率。然而，分布式引擎TriAD不支持动态数据源支持、并发请求处理、数据持久化策略等功能，无法满足多样化的RDF数据查询需求。
技术实现思路
本专利技术提供一种，提供一种支持RDF数据查询的同时，支持数据通过增量式方式更新到及数据持久化功能的资源描述框架分布式引擎，使其能够支持动态数据源。第一个方面，本专利技术实施例提供一种资源描述框架分布式引擎，所述资源描述框架RDF分布式引擎部署在计算机集群上，所述计算机集群包括一个主节点及N个从节点，N21且为整数，所述主节点包括:查询服务器、查询解析器、处理器、备份管理器，其中，所述查询服务器，用于接收查询语言和数据获取协议SPARQL语句，并将所述SP...

【技术保护点】
一种资源描述框架分布式引擎，其特征在于，所述资源描述框架RDF分布式引擎部署在计算机集群上，所述计算机集群包括一个主节点及N个从节点，N≥1且为整数，所述主节点包括：查询服务器、查询解析器、处理器、备份管理器，其中，所述查询服务器，用于接收查询语言和数据获取协议SPARQL语句，并将所述SPARQL语句发送至所述查询解析器；所述查询解析器，用于对所述SPARQL语句进行解析，以将所述SPARQL语句转换为查询子图；所述处理器，用于根据所述查询子图生成操作日志及执行计划，根据哈希映射规则，从所述N个从节点中确定所述SPARQL语句中RDF数据的对应从节点，并将所述SPARQL语句、所述执行计划发送及所述操作日志发送至所述备份管理器；所述备份管理器，用于根据所述操作日志，将所述SPARQL语句与所述执行计划发送至所述对应节点，并对所述对应从节点上的数据进行备份；所述对应从节点中的每一个从节点上设置内存，所述对应从节点用于根据所述执行计划，更新所述内存。

【技术特征摘要】

【专利技术属性】
技术研发人员：胡春明，翟烨，李博，许程，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人