当前位置: 首页 > 专利查询>浙江大学专利>正文

一种互联网数据查询方法技术

技术编号:6109910 阅读:201 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种互联网数据查询方法,其特征在于,步骤如下:(1)导航代理创建数据集导航的基础图;(2)用户向导航代理输入路径表达式;3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作;(4)导航代理将获得的互联数据结果输出给用户。本方法实现了基于互联数据的半自动化的语义导航,并为查询提供了良好的导航能力。用户可以通过给定路径表达式来约束导航的规则和过程。通过导航可以查询获得用户想要的互联数据集,并能做一些推理工作,为互联数据的查询和推理提供了一种新的方法。

【技术实现步骤摘要】

本专利技术涉及信息检索领域,尤其涉及。
技术介绍
互联数据由大量的互联RDF (资源描述框架)图组成。互联数据有四个规 则(1)用URI作为事物的名字;(2)使用HTTP URI; (3)在RDF中提供有用的信息; (4)可以包括到其他URI的RDF链接。互联数据被看做是互联网上的一个开放的分布 式的数据库。互联数据可以用RDF数据集来表示,RDF数据集是一个RDF命名图的集 合。RDF图既可以表示成RDF三元组(s,p,o)的集合,又可以表示成带标签的有向图s~^-^α ο要对海量的互联数据进行处理和应用,首先要解决互联数据的查询问题。W3C推 荐使用SPARQL进行语义web数据的查询。RDF的数据格式是带标签的有向图,因此SPARQL 是一种图匹配查询语言。SPARQL其语法类似于SQL,SPARQL查询由三部分组成。模式匹配 部分,结果修正部分和结果输出部分。SPARQL查询的结果类型包括是与否,匹配模式的变 量值以及由这些值组成的新的RDF数据,资源的描述等。由于RDF是一种带标签的有向图,人们已经越来越意识到,对以树形和图结构的 数据(如XML和RDF),导航能力是非常重要的。然而SPARQL在导航方面提供的支持非常少, 这就造成了一些查询的困难。因此我们考虑使用路径表达式来提供查询的导航能力。
技术实现思路
为解决上述问题,本专利技术提供一种导航能力强的互联网数据查询方法。为了达到上述目的,本专利技术采用的技术方案是,其特 征在于,步骤如下(1)导航代理创建数据集导航的基础(2)用户向导航代理输入路径表达式;(3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作;(4)导航代理将获得的互联数据结果输出给用户。更进一步,所述的导航代理为编程语言架构的数据管理服务器。本专利技术的专利技术思想在于用户根据想要查询的互联数据内容,向导航代理提交用 RPath语言描述的路径表达式规则,以及互联数据导航开始的节点等约束条件。导航代理,是基于路径表达式的互联数据查询与推理引擎,它能够自动的在互联 数据上查询出用户想要的内容,并可以根据用户提供的推理规则进行推理。导航代理根据 步骤( 给定的路径表达式,从给定起点集合开始,在互联网上的数据集导航的基础图寻 找匹配的路径,进行导航过程,获取查询和推理结果。RPath语言包括如下规则Step 从(g,m)到(g,n)的图内转移,使得对于一些三元组t e g, m, η e Term(t),记作(g,t)。其中g表示图,m,n表示图中的节点,t表示一个三元组,Term(t)表示一条互联 数据三元组。Self是一种特殊的Step,它的起始节点是同一个节点,即是自身到自身的跳 转;Jump:从(g,n)到(g’,n)的跨图转移,表示从图g跳转到图g’,记作 (g, (n,JUMP,g’))。其中g和g’表示两个用5表示反向转移;使用标准的正则表达式比如,Union ( ‘|’),Sequence ( ‘/’),Star( ‘*’),来表示复合表达式。Fold: folding操作分析路径集合,根据folding规则把一些路径打包形成一个新 的路径,记作f=(Pe=>p)。其中Pe是嵌套的路径表达式,ρ是路径的属性值。通过以下模型来描述导航过程一个位置ρ和一个以ρ为起点路径的集合。路径 是一个序列路径(P。,、,?1,*",‘?11),其中?0,?1,"、?11为位置,ti是从pi-Ι到pi的转 移,1彡i彡η。路径表达式Pe用来表述导航过程(p,Pe)在数据集d中的估值,记作 Evald(p, Pe),是从节点ρ开始,由Pe指定的导航过程所产生的路径集合;ρ在Pe规则下, 在数据集d内的可到达集合,记作Reachd(p,Pe),包含在Evald(p,Pe)中的所有路径的末端点ο上面关于RPath语言的规则可以改为下面的形式,(1)St印是图中一个顶点到另一个顶点的转移,转移可以用即图中的一条边 来表示,其中s,ο是图中的顶点,ρ表示从s到ο的一条边。s对应于互联数据三元组中的 主语,ο对应于宾语,ρ对应于谓语;(2)I I表示并且关系,U表示或者关;(3)Fold ,表示从规则t可以推出规则r,其中t是用Π和U链接的多个规则,我们称将规则t fold称规则r。本专利技术的技术优势在于本方法实现了基于互联数据的半自动化的语义导航,并为查 询提供了良好的导航能力。用户可以通过给定路径表达式来约束导航的规则和过程。通过 导航可以查询获得用户想要的互联数据集,并能做一些推理工作,为互联数据的查询和推 理提供了一种新的方法。下面结合附图和具体实施方式,对专利技术做进一步说明。 附图说明图1是本实施例的工作流程示意图。 具体实施例方式参考图1,,步骤如下(1)导航代理创建数据集导航的基础(2)用户向导航代理输入路径表达式;(3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作;(4)导航代理将获得的互联数据结果输出给用户。例如,我们希望根据FOAF信息(朋友关系信息),参考书目信息和书评,推断出谁可 能会购买人工智能专业领域的书籍。具体实施步骤如下(1)用户查询的范围是互联数据集M上;(2)用户希望查询Mia可能购买的书。用户将查询推理条件转化为导航约束规则,并设 定Mia为导航起点;a)我们认为如果一个人写作、评论或者购买了一本书,这本书是领域D的,则我们认为 他对这个领域感兴趣,特别到人工智能(Al)领域,转化为导航约束规则为personybook「丨 bookAIbook =>person ^ggtf ) AIbookb)我们认为如果一个人A对某个领域D感兴趣,并且这个人知道E是领域D的专家,则 在领域D上,A相信E。转化为路径表达式person}AIbook fl E e^at yAlbook ^person 細謹威、Ec)我们假设如果一个人A在领域D相信专家E,并且专家E评论了产品P,则A可 能会购买产品P。转化为路径表达式』j trmOnMMmh〉忍门丑^ ρ 』 〉ρ(3)导航代理装置将结果集设为空,开始导航过程;(4)对于起点Mia开始的边Ma"職ybook!,属于导航规则(a),加入结果集合;(5)对结果集合的每一个子图,子图的顶点bookl与书目信息中顶点相同,执行jump操 作,改书目信息中的顶点bookl为新的起点;对与起点bookl开始的边iwoM^^Aftoot ,属于导航规则(a),加入结果集合。(6)重复前一步的过程,可将 bookl^^AIbook , Joe w^e >book2 , Joe r^iy )bookl , Joe ^en0i AIbook 加入结果集合。(7) 导航代理装置依次对比每一条导航约束规则。Mia …)bookl 和bookl^^Mbook符合规则(a),推出Ma fat^fg ) Alhook加入结果集合; Ma 政碰 >』4/& Α 禾口 Joe —_、Albook 符合规则(b),推出 Mm mat0sm^ ) Jm 加 入结果结合;Mia 邮魁滅.>Jbe和Jog 胁v >bookl , Joe>book2符合规则(c), 推出 Aiita ^bookMJb本文档来自技高网...

【技术保护点】
1.一种互联网数据查询方法,其特征在于,步骤如下:(1)导航代理创建数据集导航的基础图;(2)用户向导航代理输入路径表达式;(3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作;(4)导航代理将获得的互联数据结果输出给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈华钧张湘豫于彤
申请(专利权)人:浙江大学
类型:发明
国别省市:86

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1