The present invention relates to the technical field of search path MapReduce programming framework based on map, and discloses a method for large-scale query semantic data path, the programming framework based on MapReduce, using the popular path graph query sort algorithm, complete the path relationship between large-scale semantic data query. The present invention realizes the data semantic relationship path under a large magnitude, path query can quickly, from the return results, not only tell the user what is the two ends of the body is on the path, but the key is concerned about the specific of the two body is how to connect to. Users clearly see all the related ontology on this chain.
【技术实现步骤摘要】
本专利技术涉及基于MapReduce编程框架地图的路径搜索
,尤其涉及了一种 。
技术介绍
海量数据是互联网发展的必然结果,而大规模的将现有数据语义化则是信息时代 的必然需求。现在已经有不少较大的语义数据云,提供大量的语义化的数据及其应用服务。关联关系则是语义网的核心。那么,查询得到语义关联关系则是语义网应用领域 的一个非常重要的工作,特别是医学、生物领域。数据查询是利用现有数据进行开发利用的 一个不可避免的步骤。现在的查询语言只做到一般规模数据的普通查询和路径查询,其中,路径查询只 能得到处于整个路径链上的起点和终点的本体,没有给出这条路径具体是什么,即这两个 本体是通过怎样的属性链一步步连接起来的。随着语义数据的增加,处理大规模语义数据的方法也需要解决。MapReduce作为一 种高效地并行处理大规模数据的编程框架在很多领域上都获得了应用。
技术实现思路
本专利技术针对现有技术中的路径查询只能得到处于整个路径链上的起点和终点的 本体,无法看到整个具体路径的缺点,提供了一种采用了 MapReduce的编程模型,不同于现 有的路径查询,只返回该路径上的起点和终 ...
【技术保护点】
1.大规模语义数据路径查询的方法,其特征在于,包括下列步骤:步骤A:需要定制查询路径的模式:a:查询路径的语法:查询路径表达式为基于本体的属性而非字符的正则表达式,该路径表达式基本能够满足查询需求;b:路径评估:路径按照难易程度分为以下两种:简单路径:路径表达式只包含连接(sequence)、取反(reverse)和{n},即路径长度固定;复杂路径:路径表达式中包含*,?,{},即该路径的长度可变;步骤B:分析路径表达式,将路径表达式进行拆分:所述的简单路径需要将路径表达式分成几个更简单的表达式,然后将其join(求交),连接起来,过程中需要迭代,如果其中间结果不满足路径条 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。