当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于概念模型的本体复杂性分析评估方法技术

技术编号:2834310 阅读:269 留言:0更新日期:2012-04-11 18:40
一种基于概念模型的本体复杂性分析评估方法,主要包括以下步骤:1)获取所需分析本体的版本,将其转化为DAG图的格式;2)对单个本体内部的所有概念,按其重要程度从高至低排序,对排序后的每个概念统计其路径数、最大路径长度和平均路径长度,并以表格形式存储;分析单个本体的复杂性分布的性质和规律。所述步骤2)中,对于重要程度相同的概念,再按其平均路径长度值由小至大排序。本发明专利技术从概念、关系和路径三者的相互依赖关系,通过对本体概念模型的分析,克服了现有评估分析方法不够系统全面,分析的合理性验证不够说服力,对复杂性变化的原因分析不足等缺点,适用范围广泛。

【技术实现步骤摘要】

本专利技术涉及一种用于本体演变过程中,对所构建本体的复杂性进行分析和评估的方法。它 面向计算机本体工程领域。
技术介绍
目前,Web的发展迅猛,Web上各种应用日益复杂。但Web上现有的信息对计算机是不 可理解的,这极大的影响了 Web应用的自动化、集成化和智能化进程。于是Berners-Lee提出 了下一代Web——语义Web的目标,就是使Web上的信息具有计算机可以理解的语义,其 中一个重要的思想就是用本体来表示语义信息,从而提高Web信息服务的智能化和自动化。 这对本体的规划、设计和开发人员提出了新的挑战——本体工程学,即本体的构建应该是工 程化的。尽管这一思想已经被广泛接受,但是并没有得到广泛认可的通用的方法。目前,本 体的构建基本还是采用以经验为主的构建方法。这种方法对中小规模的本体还是可行的。但 是随着本体规模的急剧扩大和复杂性的迅速增加,构建本体时需要考虑的因素也急剧增加, 往往超出了人的经验所能企及的范围,同时会加大本体更新、维护的技术和经济风险。如果在本体构建阶段,能及时跟踪、分析本体的规模和复杂性情况及演变趋势,则可以提 高本体开发的质量,估计开发的费用,以及有效减少今后本体维护的开销,从一定程度上规 避技术和经济风险。因此在对本体的规模和复杂性情况及演变进行分析时,合理有效的评估 方法和指标是很关键的。然而,目前的分析评估方法很少而且不够系统和全面。现有的分析评估方法主要从本体描述能力的角度,针对本体的构词、语义及结构特点对本体质量进行评估,主要有下列几种1) 美国乔治亚州立大学的Burton、 Storey、 Sugumaran和Ahluwalia (2003年)从构词法、语义能力、实效性和社会性四个方面,对DAML本体的有效性进行了评估,同时给出了一组 评价指标。而且在这些指标的基础上,通过加权函数计算得出本体总体质量的评价指标。2) 美国阿拉巴马大学(亨茨维尔)的Yao、 Orme和Etzkorn (2005年)提出的内聚指标 (cohesion metrics),针对本体中类的数量及继承树的深度,对OWL本体的模态相关性 (modular relatedness)进行分析。这些指标首先从构词法的角度对OWL本体进行解析,然后根据树状的语义层次结构计算而得。从理论上讲,这组指标比人按经验的评价方法有效。但 这些标准却并非是专门针对本体复杂度的。3) 东南大学的Kang、Xu、Lu和Chu(2004年)用加权类关系图(weighted class dependence graph)表示一个给定的类,并提出基于熵距离(entropy distance)的方法,对UML类的结构 复杂性进行评估。该方法同时考虑了类和关系的复杂性,并将类和关系的复杂度值通过一定 的规则转化为加权类关系图。这种方法能够比较客观的分析类的结构复杂性。4) 美国乔治亚技术学院的His (2004年)在他的博士论文中,通过图论的方法研究了两 个概念完整性指标概念一致性(conceptual coherence)和概念复杂性(conceptual complexity)。 概念一致性指标用图中节点间的平均距离来考察概念间的相关性。概念复杂性指标主要体现 为概念图中每个节点的关系数及图中所有节点的平均度数。这两个指标更多是用来衡量单个 概念的复杂度问题。5) 美国BDGP/GO协会的Mungall (2005年)以有向非循环图(directed acyclic graph, DAG)表示本体的层次结构,通过每个概念的平均路径数来衡量本体的复杂性。但是,在统 计本体概念总数时,他没有把排除那些已经废弃的概念。而在计算概念的路径数时,废弃概 念的路径却是排除在外的。这样在计算路径与概念的比率时,其结果是不正确的。上述方法的共性问题是都提出了各自的本体复杂性的评估方法和指标,但方法本身及指标 合理性都不够全面。
技术实现思路
针对现有对本体复杂性评估分析方法和指标的不足,本专利技术提出一种基于概念模型的本 体复杂性分析评估方法,以克服现有评估分析方法不够系统全面,分析手段较单一,分析的 合理性验证不够说服力,对复杂性变化的原因分析不足等缺点。为达上述目的,本专利技术采用如下技术方案,包括以下步骤1) 获取所需分析本体的版本,将其转化为DAG图的格式;2) 对单个本体内部的所有概念,按其重要程度从高至低排序,对排序后的每个概念统计 其路径数、最大路径长度和平均路径长度,并以表格形式存储;分析单个本体的复杂性分布 的性质和规律。作为本专利技术方法的一种改进,所述步骤2)中,对于重要程度相同的概念,再按其平均路径长度值由小至大排序。作为本专利技术方法的又一改进,所述步骤1)中,获取所需分析本体的版本为多个演变版本,在所述步骤2)之后,还包括以下步骤3) 对本体的各个演变版本,统计本体拥有的概念数、关系数、路径数、最大路径长度、 平均路径长度、平均关系数、平均路径数和本体最长路径与平均路径长度的比率,以表格形 式存储;分析本体的各个不同版本的复杂性演变的性质、规律和趋势。在所述步骤3)之后,还包括以下步骤作为本专利技术方法的再一改进,所述步骤3)之后,还包括以下步骤4) 将所述步骤2)、步骤3)获得数据结合,用于分析引起本体复杂性演变的原因及其与 其复杂性分布的关系。本专利技术具有以下优点1、 基于本体共有的基本属性——概念模型的评价指标集,概念、关系和路径是本体共有 的基本属性,本体概念模型由概念和关系的构成。本方法主要从概念、关系和路径三者的相 互依赖关系,通过对本体概念模型的分析,提出了本体复杂性的评价指标集。因此本方法的 适用性较广。2、 分析对象同时包括本体本身和本体中的单个概念,以往方法的分析对象往往为整个本体,通过一定的评价指标集对本体的复杂性或其它性质的演变进行分析,但对组成本体的概 念本身及其结构和层次却无相应评价指标,而实际上正是由于本体概念的数量、结构和层次的变化才导致本体复杂性的变化。因此本方法中的评价指标集包括了对本体中概念的复杂性 的评价,从而更加全面和有效。3、 对本体概念按其重要程度开展复杂性分析,本方法提出了 概念的重要程度的定义。 概念自身由于所处本体中的层次不同,与其它概念的联系数量不同而有着不同的复杂性,整 个本体的复杂性是由所有概念共同产生的,那些与较多其它概念产生联系的较重要概念,其 对本体的复杂性的贡献也较高。对概念按重要程度进行分析, 一方面可以由此看清整个 本体内部的复杂性分布,另一方面还可对本体演变过程中复杂性变化产生的内部原因进行更 好的深入研究。附图说明图1至图3为BP本体的复杂性演变图。图4至图6为CC本体的复杂度演变图。图7至图9为MF本体的复杂度演变图。图10为2005年9月GO本体的路径和度数分布图。图11为GO本体各个演变版本的路径分布统计图。图12为GO本体各个演变版本的概念和路径变化图。 具体实施例方式,为便于说明本方法,首先给出下面一些定义概念本体概念模型中的概念是广义上的概念,除了一般意义上的概念以外,可以指任何 事务,如任务、功能、行为、策略、推理过程等等,用小写符号C表示。在其他本体中,概念(Concept)可能被称为类(Class)或者术语(Term)。概念集概本文档来自技高网
...

【技术保护点】
一种基于概念模型的本体复杂性分析评估方法,其特征在于包括以下步骤:1)获取所需分析本体的版本,将其转化为DAG图的格式;2)对单个本体内部的所有概念,按其重要程度从高至低排序,对排序后的每个概念统计其路径数、最大路径长度和平 均路径长度,并以表格形式存储;分析单个本体的复杂性分布的性质和规律。

【技术特征摘要】
1、一种基于概念模型的本体复杂性分析评估方法,其特征在于包括以下步骤1)获取所需分析本体的版本,将其转化为DAG图的格式;2)对单个本体内部的所有概念,按其重要程度从高至低排序,对排序后的每个概念统计其路径数、最大路径长度和平均路径长度,并以表格形式存储;分析单个本体的复杂性分布的性质和规律。2、 根据权利要求1所述的基于概念模型的本体复杂性分析评估方法,其特征在于所述步骤 2)中,对于重要程度相同的概念,再按其平均路径长度值由小至大排序。3、 根据权利要求1或2所述的基于概念模型的本体复杂性分析评估方法,其特征在于所...

【专利技术属性】
技术研发人员:张大陆杨哲叶钏
申请(专利权)人:同济大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1