当前位置: 首页 > 专利查询>清华大学专利>正文

基于描述逻辑的本体不一致性分析方法技术

技术编号:4159900 阅读:390 留言:0更新日期:2012-04-11 18:40
基于描述逻辑的本体不一致性分析方法属于语义及本体分析领域,其特征在于,在计算机上建立本体仓库、缓冲本体库、本体不一致性分析模块、逻辑推理机RACER和本体工具Prot*  g*;该方法通过本体不一致性分析模块来分析缓冲本体库中存储的不一致的本体,计算该本体的最小不一致公理集合、命中集合,最后得到最小错误集合,该最小错误集合即产生本体不一致性的根源,通过删除或修改该最小错误集合可以有效恢复原本体的一致性。根据本发明专利技术,能够在语义不一致情况下对本体进行分析,找到产生本体不一致性的根源,从而有效恢复本体的一致性。

Analysis method of ontology inconsistency based on description logic

A description logic ontology inconsistent analysis method and belongs to the field of semantic analysis based on ontology, which is characterized in that the establishment of ontology warehouse, the computer buffer domain ontology, ontology inconsistent analysis module, logic inference and ontology tool Prot RACER * g *; this method through ontology inconsistency analysis module of storage the buffer in the ontology inconsistent ontology, ontology to calculate the minimum inconsistent axiomatic set and hitting set, and finally get the minimum error set, the minimum error set is generated ontology inconsistent causes, by deleting or modifying the minimum error set consistency can effectively restore the original ontology. According to the invention, the ontology can be analyzed under the condition of semantic inconsistency, and the root of the inconsistency of the ontology can be found, so that the consistency of the ontology can be effectively restored.

【技术实现步骤摘要】

本专利技术属于语义及本体分析领域,旨在为人们提供一种在语义不一致的情况下,对本体 进行分析并解决本体的不一致性的方法。
技术介绍
语义网是由WWW的创始人Tim Berners-Lee在2001年正式提出的,它的主要任务是使数 据能被计算机自动的处理和理解,其最终目标是让计算机可以在这些海量信息中找到人所需 要的任何信息。它研究的主要目的就是扩展当前的万维网,使得网络中的信息具有语义,能 够被计算机理解。语义网主要是通过本体来实现的。本体(ontology)用于对一些主题作清晰而规范的描述,能够澄清领域知识的结构,获得 统一的术语和概念,并使知识的共享成为可能。面向各专业领域建立的领域本体,能够提供 该领域中知识概念的词表以及概念之间的关系,并实现领域知识的重用。现有的对本体进行描述的方法主要是基于描述逻辑(Description Logic, DL)的。描述逻 辑是基于对象的知识表示的形式化,也是一阶谓词逻辑的一个可判定子集。描述逻辑的优点 是很强的表达能力和可判定性,它能保证推理算法总能停止,并返回正确的结果。近些年来, 描述逻辑逐渐成为语义网表达的语义理论基础。描述逻辑中最基本的两个术语是概念(③nc印t)和角色(role)。概念是一类事物的抽象, 通常用A, B, C, D,…来表示;而角色则刻画了事物之间的各种联系,通常用P, Q, R, S,…来表示。描述逻辑中的真假分别用丁和丄来表示,析取和合取分别用u和n来表示,蕴含和等价分别用G和E来表示,关系非用来表示,存在量词和全称量词分别用3和V来表示。 例如C门D表示概念C和D的交,CU表示概念C和D的并,,C表示所有概念中除去C 的概念,3/ .C表示存在概念C的实例满足角色R, Vi .C表示任意概念C的实例满足角色R。本专利技术中提到的本体均根据描述逻辑构建。 一个本体通常由四部分组成(l)概念,用于 表不一组或一类实例, 一般用来表示具有共同性质的一类事物。(2)关系,用于表示概念或其 属性之间的关联。(3)公理,用于对概念或实例的值进行约束,表示一些永真式。(4)实例,用于表示类的一个具体的个体,对本体而言不是必需的。语义网技术的飞速发展在很大程度上依赖于本体的正确性及质量,因此保证本体的一致 性至关重要。对本体的一致性定义如下如果一个本体中的所有概念都存在可满足的解释,则说明这个本体是一致的。反之,如果本体中任何一个概念不存在可满足的解释,则该本体是不一致的。 一个不一致的本体意味 着本体中的某些部分与其他部分产生冲突。本体的最小不一致公理集合(Minimal Inconsistent Subset, MIS)是指该集合是本体的 不一致子集,而该集合的任何真子集都是一致的。最小错误集合(Minimal Error Set)是导致本体产生不一致的最小集合。即产生本体不一 致现象的根源。通过删除或修改最小错误集合,即可有效恢复整个本体的一致性。尽管本体的一致性非常重要,但是现实生活中的本体却常常是不一致的。这种不一致可能来源于l)本体构建者的错误,即由于建立本体的人知识不足或者发生错误而使本体在建 立之初就是不一致的;2) —词多义现象,即一个词根据语境不同具有多种含义,因此容易发 生混淆;3)格式转换,由于本体具有多种表达方式,例如RDF(Resource Description Framework) 、 OWL(Web Ontology Language)等,当本体从一种表达方式转换为另一种表达方 式时也容易产生不一致;4)本体集成,即一个本体是由多个小本体集成而来的,由于各个小 本体的构造方式不同,集成得到的本体往往很难达到一致。已有很多研究者考虑了本体的不一致问题,但是其研究和应用还很不完善。Schlobach等 人在SEKT(Semantically Enabled Knowledge Technologies)项目中研究了不一致本体的诊 断和修复问题,提出Pinpoint的概念作为本体的诊断集,但是作者采用了启发式算法,因此 无法保证算法的完备性(Schlobach S, H翻G Zhisheng. Inconsistent ontology diagnosis and r印air [EB/0L]. 2007. http:〃wasp.cs.vu.nl/sekt/dion/sekt363.pd:0。 H扁g等人 提出线性扩展战略,以从不一致的本体中推出有意义的结论,但是其应用还具有一定的局限 性(HUANG Zhisheng, Harmelen VF, Te丄jeAT. Reasoning with inconsistent ontologies [C]. //Proc IJCAI'05. Edinburgh' UK: Professional Book Center, 2005:254-259.)。 Deng等 人利用博弈论中的谢普利值(Shapley value)计算本体中每条公理的错误程度,通过删除 Shapley值最大的公理解决不一致问题,但是其计算复杂度是指数级的,不便执行(DENGXi, Haarslev V, Shiri N. Measuring inconsistencies in ontologies [J]. ■iecti/re Abtes C卿wter ^'認e, 2007, 4519: 326-340.)。因此,有必要提出一种更加有效的对木体的不一致性进行分析的方法,从而恢复本体的 一致性,保证语义理解的正确性。
技术实现思路
针对现有技术中存在的问题,本专利技术的目的是提出一种基于描述逻辑的本体不一致性分 析方法,能够通过修改或去除本体中的最小错误集合,有效恢复本体的一致性,从而保证语 义理解的正确性,实现基于语义的知识共享与信息交换。本专利技术的特征在于,所述方法是依次按以下步骤实现的步骤(l),初始化安装本体建模工具Prot6g6,用以建立、删除、修改本体,并把本体存储为网络本体语 言0WL的格式,构建本体仓库,用于存储用所述Prot6g6构建的本体文件,安装本体不一致性分析系统,其中包括缓冲本体库、逻辑推理机RACER、以及本体不 一致性分析模块,其中-缓冲本体库,存储从所述本体仓库中提取到的需要分析本体不一致性的本体,逻辑推理机RACER,是一个基于描述逻辑的推理机,用于获取需要分析本体不一致性的 文件中存在着不一致的概念集合,本体不一致性分析模块,用于从所述缓冲本体库中提取不一致的本体,并借助所述逻辑 推理机RACER,求得本体的最小错误集合; 步骤(2),按以下步骤进行本体不一致性分析步骤(2. 1),用本体不一致性分析模块从缓冲本体库中提取待分析的本体0;步骤(2. 2),该本体不一致性分析模块把步骤(2. 1)所述的本体0送往逻辑推理机RACER, 判断本体0是否描述逻辑一致若 一致,则分析结束,返回歩骤(2.1),若不一致,则计算不一致的概念集合,并保存;步骤(2. 3),该本体不一致性分析模块得到步骤(2. 2)中所述的不一致的概念集合后,利 用MUPS—bottomup算法(参见文献Schlobach S, HUANG Zhisheng. Inconsistent ontolog本文档来自技高网
...

【技术保护点】
基于描述逻辑的本体不一致性分析方法,其特征在于,所述方法是在计算机中依次按以下步骤实现的:    步骤(1),初始化    安装本体建模工具Prot*g*,用以建立、删除、修改本体,并把本体存储为网络本体语言OWL的格式,    构建本体仓库,用于存储用所述Prot*g*构建的本体文件,    安装本体不一致性分析系统,其中包括:缓冲本体库、逻辑推理机RACER、以及本体不一致性分析模块,其中:    缓冲本体库,存储从所述本体仓库中提取到的需要分析本体不一致性的本体,    逻辑推理机RACER,是一个基于描述逻辑的推理机,用于获取需要分析本体不一致性的文件中存在着不一致的概念集合,    本体不一致性分析模块,用于从所述缓冲本体库中提取不一致的本体,并借助所述逻辑推理机RACER,求得本体的最小错误集合;    步骤(2),按以下步骤进行本体不一致性分析:    步骤(2.1),用本体不一致性分析模块从缓冲本体库中提取待分析的本体O;    步骤(2.2),该本体不一致性分析模块把步骤(2.1)所述的本体O送往逻辑推理机RACER,判断本体O是否描述逻辑一致:    若:一致,则分析结束,返回步骤(2.1),    若:不一致,则计算不一致的概念集合,并保存;    步骤(2.3),该本体不一致性分析模块得到步骤(2.2)中所述的不一致的概念集合后,利用MUPS_bottomup算法求得最小不一致公理集合,表示为MIS={S↓[1],S↓[2],…,S↓[n]},其中S↓[1],S↓[2],…,S↓[n]均为本体O的最小不一致公理集合,每个集合中包含若干条不一致的公理;    步骤(2.4),从步骤(2.3)得到的集合S↓[1],S↓[2],…,S↓[n]中各任意选取一条公理加入集合H↓[k];    步骤(2.5),若步骤(2.4)得到的集合H↓[k]中存在重复的公理,则删去重复的公理,得到一个命中集合H;    步骤(2.6),重复执行步骤(2.4)到步骤(2.5),一直到不存在新的集合H↓[k]为止,再执行下一个步骤;    步骤(2.7),计算步骤(2.5)中所述命中集合H中至少一个H包含的公理数最少的集合,并保存;    步骤(2.8),把步骤(2.7)得到的集合赋给最小错误集合D,并把其返回给用户;    步骤(3),用户得到步骤(2.8)所述的最小错误集合D后,用本体建模工具Prot*g*删除...

【技术特征摘要】
1.基于描述逻辑的本体不一致性分析方法,其特征在于,所述方法是在计算机中依次按以下步骤实现的步骤(1),初始化安装本体建模工具Protégé,用以建立、删除、修改本体,并把本体存储为网络本体语言OWL的格式,构建本体仓库,用于存储用所述Protégé构建的本体文件,安装本体不一致性分析系统,其中包括缓冲本体库、逻辑推理机RACER、以及本体不一致性分析模块,其中缓冲本体库,存储从所述本体仓库中提取到的需要分析本体不一致性的本体,逻辑推理机RACER,是一个基于描述逻辑的推理机,用于获取需要分析本体不一致性的文件中存在着不一致的概念集合,本体不一致性分析模块,用于从所述缓冲本体库中提取不一致的本体,并借助所述逻辑推理机RACER,求得本体的最小错误集合;步骤(2),按以下步骤进行本体不一致性分析步骤(2.1),用本体不一致性分析模块从缓冲本体库中提取待分析的本体O;步骤(2.2),该本体不一致性分析模块把步骤(2.1)所述的本体O送往逻辑推理机RACER,判断本体O是否描述逻辑一致若一致,则分析结束,返回步骤(2.1),若不一致,则计算不一致的概念集...

【专利技术属性】
技术研发人员:范玉顺刘博
申请(专利权)人:清华大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利