当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于多代理路由的图路径关系发现方法技术

技术编号:7457860 阅读:240 留言:0更新日期:2012-06-23 22:18
本发明专利技术公开了一种基于多代理路由的图路径关系发现方法,包括如下步骤:1)利用基于W3C标准的资源描述语言和语义抽取及编辑工具从各个知识领域分别获取语义关系图,并将其作为关联关系发现的底层知识库;2)通过一个主代理和多个分代理搭建多代理分布式路由框架;3)提供用户交互接口;4)主代理接收用户的假设命令后将其分配给分代理组进行查询任务;5)分代理组接收所述查询任务后对其底层知识库进行关联关系路径的路由查询,路由查询结束后经过主代理向用户反馈答案;具有在不同领域知识之间,建立带有权值的相似关联矩阵采用多代理技术,为跨领域知识的查询和论证提供分布式路由支持等优势。

【技术实现步骤摘要】

本专利技术涉及语义网技术,数据挖掘技术、图论应用和智能agent技术,尤其涉及多代理技术在大规模语义图上的关联信息挖掘。
技术介绍
一、语义网技术语义网的核心是通过给万维网上的文档添加能够被计算机所理解的语义,从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。所谓“语义”就是文本的含义,语义网就是能够根据语义进行判断的网络,也就是一种能够理解人类语言,可以使人与电脑之间的交流变得像人与人之间交流一样轻松的智能网络。除了提供一种方式允许文本表达语义之外,语义网技术的另一个目的就是使得数据更加便于电脑进行智能处理和查找。通过三元组关系表达和语义标注技术,计算机能够利用智能软件,通过智能代理从大规模的语义关系图或者语义网络中筛选出相关的有用信肩、ο资源描述框架(Resource Description Framework,简称RDF)是一个用于表达关于万维网(World Wide Web)上的资源的信息的语言.它专门用于表达关于Web资源的元数据,比如Web页面的标题、作者和修改时间,Web文档的版权和许可信息,某个被共享资源的可用计划表等。RDF基于这样的思想用Web标识符(称作统一资源标识符,Uniform Resource Identifier s或URIs)来标识事物,用简单的属性(property)及属性值来描述资源。这使得RDF可以将一个或多个关于资源的简单陈述表示为一个由节点和弧组成的图,其中的节点和弧代表资源、属性或属性值。二、多代理(agent)技术随着信息基础设施的建立和完善,人们对应用的要求越来越高。高智能性、网络化、高可靠性和快速适应性成为应用系统所追求的目标,这正是多agent系统的特点。所谓多agent系统是指一个由多个自治运行的agent组成的集体,在开放分布式网络环境中, agent是一个抽象实体,它是自治的,可以对自身环境、操作环境和环境变化采取行动。三、基于语义相似度的聚类方法语义相似度指的是文本所包含的语义之间的相似程度,也就是在实际环境的人类语言中,文本所指的意思的相似度。聚类是数据挖掘中经常使用的方法,目的是使得物理或抽象对象的集合分成由类似的对象组成的多个类的过程。聚类算法通常是基于相似性进行,最终能够方便计算任务进行,以及降低计算复杂度。四、图论应用图论以图为研究对象,图论中的图是由若干给定的点及连接两点的线所构成的图形。这种图形通常用来描述某些事物之间的某种特定关系,用节点表示事物,用连接两点的线表示相应两个事物间具有这种关系。这恰恰是语义网络最终转化成的语义关系图所具备的特质。因此,图论算法例如路径搜索算法通常可以被应用到语义网的语义关系搜索中去。
技术实现思路
本专利技术针对需要大规模关系数据的计算问题,克服单机难以快速获得全部知识的缺点,提出。为了解决上述技术问题,本专利技术的技术方案如下,包括如下步骤1)利用基于W3C标准的资源描述语言和语义抽取及编辑工具从各个知识领域分别获取语义关系图,并将其作为关联关系发现的底层知识库;2)通过一个主代理和多个分代理搭建多代理分布式路由框架;3)提供用户交互接口 ;4)主代理接收用户的假设命令后将其分配给分代理组进行查询任务;5)分代理组接收所述查询任务后对其底层知识库进行关联关系路径的路由查询, 路由查询结束后经过主代理向用户反馈答案。作为可选方案,所述语义关系图采用语义三元组(S,ρ,ο)来表达领域的语义知识,所述S表示主体,所述P表示属性关系,所述O表示被主体通过属性关系约束的客体;所述各个知识领域资源之间的语义相似度可抽取成为相似度矩阵,所述相似度矩阵的行列分别为所述语义关系图中任意两点的相似度且其数域范围为W,1],所述语义相似度为所述各个知识领域资源所指含义相近的程度。作为可选方案,当所述分代理组中,分代理对其底层知识库进行关联关系路径的路由查询不足以完成查询任务时,则向所述主代理反馈局部答案并加入新假设命令,所述主代理接收所述新假设命令并对其重新分配给其他分代理进行关联关系路径的路由查询; 上述过程可迭代直至用户假设命令被验证正确或错误,所述主代理对各个分代理反馈的局部答案进行整合。作为可选方案,所述主代理接收用户的假设命令或分代理加入的新假设命令后根据各个语义关系图之间的语义相似度,选择和假设命令最近似的分代理接受查询任务。本专利技术的有益效果在于第一、在不同领域知识之间,建立带有权值的相似关联矩阵,为交叉学科提供知识依据。第二、采用多代理技术,为跨领域知识的查询和论证提供分布式路由支持,使得不同学科间的知识得以在网络上不同的位置进行编辑和被访问。第三、用户访问接口可采用Flex技术为网络用户提供Web访问接口,接受用户输入,并展示语义图关联关系的路由结果。附图说明图1为基于多代理路由的图路径关系发现方法实施框架图;图2为多代理协作式假设验证流程图;图3多代理协作式寻路场景。具体实施例方式下面将结合附图和具体实施例对本专利技术做进一步的说明。1)基于多代理路由的图路径关系发现方法实施框架首先使用资源描述语言(Resource Description Framework, RDF)和语义抽取及编辑工具Prot6g6从各个知识领域分别获取语义关系图,即通过语义三元组(s,ρ,ο)来表达领域的语义知识,而不仅仅是机器不可理解的文本知识,其中s表示主体,ρ表示属性关系,ο表示被主体通过属性关系约束的客体,将其作为关联关系发现的底层知识库。如图1 所示,本专利技术的总体架构,由一个主代理和由主代理控制的分代理组组成。主代理通过用户访问接口(用户访问接口是系统为了方便用户提出命题假设和查看系统查询结果,、其用于用户输入和系统的输出接口)接受用户输入的命题假设,将该命题假设与各个分代理之间的相似度进行匹配,先进行聚类,再按分组调度给各个分代理。语义相似度主要基于文献中词组共同出现的频率确定,在图路径关系发现中,语义相似度相当于图中节点之间的边长度,各个知识领域资源之间的语义相似度可抽取成为相似度矩阵,所述相似度矩阵的行列分别为所述语义关系图中任意两点的相似度,其数域范围为,例如“父亲”和“爸爸” 尽管在文本上有差别,但是含义近似,语义相似度可定义为1。各个分代理之间的知识相似度计算和基于边长度的聚类分组先于用户提交输入进行。每个分代理各管理一部分知识之后,命题假设由主代理发送给与命题假设语义相似度最高的分代理进行路由,分代理接受命题假设后进行路由查询,在内部的语义关系图寻找相关路径,并不断将局部结果放入关系链。如果命题假设可以在一个代理里经过路由得到路径验证即可以得到用户命题假设的正确性,则直接由该分代理向主代理返回最终关联路径;如果该命题假设无法在一个代理内部得到最终关联路径即不能验证用户命题假设的正确性,则产生新的命题假设,将新的命题假设提交给主代理的命题池中,以进行迭代路由,直到得到最终关联路径为止。经过多个代理协作路由产生的假设关联路径由主代理整合并返回给用户。如下为路由方法的伪代码和分代理提交证据方法的伪代码a)路由 Router (s,c, ο e resources, ρ e graph),Q :task queue权利要求1.,其特征在于,包括如本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:顾珮嵚王超陈华钧
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术