当前位置: 首页 > 专利查询>东北大学专利>正文

一种本体调试信息的度量与排序方法技术

技术编号:19424894 阅读:22 留言:0更新日期:2018-11-14 10:32
本发明专利技术公开了一种本体调试信息的度量与排序方法,包括根据用户对辩解的认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度三方面;采用ListNet排序学习方法构造top k排序模型,根据该排序模型对特征化后的辩解进行排序,获取排序前k个易理解的辩解。从用户认知的角度提出一套度量OWL辩解的标准,该套标准综合考虑了复杂度、相关度和新颖度三方面,基于该套标准,构造一个top k排序模型,获取易理解的前k个辩解,帮助用户更好地进行本体不一致的解释工作,从而增强用户体验。

【技术实现步骤摘要】
一种本体调试信息的度量与排序方法
本专利技术涉及本体调试
,尤其涉及一种本体调试的优化与度量排序方法。
技术介绍
随着Web信息的与日俱增,使用计算机处理这种信息成为一种必然的趋势。语义Web应运而生,目前已经成为一个研究热点。语义Web的目标是延伸当前的万维网,为机器提供一种可读取识别的Web信息,并提供一种可基于Web信息进行自动推理的机制。为了便于计算机的处理和交互,语义Web中的信息采用共享的词汇描述,并赋予严格的语义,这种共享的词汇即为本体(ontology)。本体定义为概念化的显示规约,它提供共享的词汇供语义Web中不同的领域使用。因为共享的词汇需要赋予一定的语义,所以语义Web需要一定的逻辑基础。为此W3C组织提出使用Web本体语言OWL(WebOntologyLanguage)作为语义Web中本体描述的标准语言。目前,越来越多的本体使用OWL来描述。OWL是一种表达语义Web数据的标准语言。随着语义Web相关研究与应用的发展,越来越多的OWL本体发布在Web之上,并互相连接成为链接数据。然而,这种开放链接的方式却加大了本体自身演化或本体间链接更新导致本体中出现逻辑冲突的可能性。对于OWL本体而言,为了定位冲突产生的具体原因,达到本体调试的目的,基本方法是找到一组最小冲突的公理集合作为本体调试信息,这种最小的公理集合被称为辩解(justification)。辩解作为蕴含的解释手段之一,需要能够被用户理解。然而随着本体规模越来越大、复杂度越来越高,辩解的规模、数量和复杂性也随之增加,这导致用户难以在短时间内理解所有的辩解,从而影响用户对本体不一致的解释。不论是将本体技术运用到实际项目中,或者是对本体技术进行学术研究,前提都要对涉及到的事物建立本体,本体的质量直接影响在其基础上建立的应用的效果。所以高质量的本体是本体技术的基石。然而,在本体构造或者本体演化过程中常常会出现本体不一致,这将严重影响本体的质量和应用。因此,本体调试技术和本体修复技术是本体工程中重要的组成部分,它们对构建高质量的本体起着关键作用。目前,马里兰大学和曼彻斯特大学的研究人员首先研究了对本体诊断信息进行打分排序的方法。对于一个冲突集中的每个公理按照出现频率、语法相关性、所使用的测试案例等情况进行打分,并综合排序,最后通过改进的碰集树算法找到具有最小排序值的诊断信息提供给用户。这一研究的局限性是为了得到该排序,不得不提供部分先验知识,比如测试案例等,但实际中用户通常无法提供这些额外的信息。为了避免这一问题,奥地利克拉根福大学的Shchekotykhi和Friedrich提出通过向外部信息源(oracle)发出某些设计好的查询来从众多的调试信息中找出目标调试信息。查询的选择方法是利用典型的用户错误概率和信息熵的概念来定义的。实验结果显示该方法能够有效排除无关的调试信息。对本体调试信息进行排序可以作为一种面向用户体验的优化策略在本课题研究中应用。东南大学的季秋等研究人员采取了更加简单的方法来度量调试信息与原始蕴含之间的相关性,即通过定义基于相关性的选择函数来度量调试信息。根据所使用的相关性选择函数的不同,该方法可以支持DL和EL+等不同的语义。通过修改碰集树算法,该方法还支持以增量方式求取蕴含辩解,进而保证在任何时刻中断算法都可以获得最相关的部分调试信息。事实上,从用户的角度而言,调试信息的度量除了应该考虑前述的冲突集中每个公理出现频率、语法相关性等客观因素外,还应该考虑与用户认知理解程度相关的因素。给用户返回复杂的调试信息,不利于普通用户/领域专家理解,也不利于普通用户/领域专家对本体的修正(删除相关公理或用超类进行替换)。在英国曼彻斯特大学的Horridge等人的研究中,引入了一种简单的认知复杂性模型,并对该模型的正确性进行了用户实验验证,其中实验数据来源于真实的NCBOBioPortal本体。该认知复杂性模型的基本思想是将一个蕴含的辩解中的不同组成部分区分为结构组件和语义组件,并分别赋以不同权重,所有组件的加权求和值作为该辩解的复杂度。该模型虽然简单易懂、使用方便,但是偏向于度量辩解的语法复杂度,对语义复杂度关注度较小,而且组件的权重的设置主要依赖于经验,缺乏原理或专门的实验验证。在该模型的基础上,英国公开大学的Nguyen等人提出了一种基于概率的认知复杂度模型。该模型引入证据树来描述辩解的推理过程,用证据树的复杂度来代表辩解的复杂度。该模型的计算过程是首先基于51个推理规则构建证据树,然后将证据树中包含的推理规则的难度指数(facilityindex)的乘积作为证据树的复杂度,即为辩解的复杂度。虽然实验结果显示该模型的准确率高达94%,但是该准确率仅限应用于两步推理。
技术实现思路
针对上述缺陷或不足,本专利技术的目的在于提供一种本体调试信息的度量与排序方法,对蕴含的所有辩解进行度量及排序,选出相对比较容易理解的辩解呈献给用户,帮助用户快速找到冲突原因,进而实施本体修复。为达到以上目的,本专利技术的技术方案为:一种本体调试信息的度量与排序方法,包括:1)、根据用户认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度;2)、采用ListNet排序学习方法构造topk排序模型,根据topk排序模型对特征提取后的辩解进行排序,获取排序前k个易理解的辩解。所述步骤1)中复杂度包括语法复杂度和语义复杂度。所述语法复杂度包含9个组件的基于认知复杂度的辩解度量模型以及3个补充组件,所述补充组件包括:AxiomNumbers、SignatureDifference2以及AxiomOrders;所述AxiomNumbers,用于统计辩解中公理的数量;所述SignatureDifference2,用于检测在辩解中出现但未在蕴含中出现的词汇的数量;所述AxiomOrders,用于检测辩解中公理是否按照辩解推理的顺序呈现。所述语义复杂度包含五个度量辩解:RuleNumber、RuleType、ComplexRuleNumber、TreeDepth以及TreeWidth:RuleNumber用于证据树中规则的数量;RuleType用于证据树中规则的种类;ComplexRuleNumber用于证据树中复杂规则的数量;TreeDepth用于证据树的深度;TreeWidth用于证据树的宽度。所述相关度为辩解和蕴含间的相关度,给定一个辩解和一个蕴含η,将中每个公理α和η的相关度的和称为该辩解和蕴含的相关度,记为所述新颖度定义为该辩解所属的辩解模式θ的信息熵,记为mnow(J→η)=-log2p(θ),其中辩解的mnov越大,表示用户对该辩解越感兴趣。所述步骤2)具体包括:2.1、获取辩解的topk概率;辩解的topk概率指给定辩解集中所有辩解的评分y=(y1,...,yn),排在topk位置的概率;2.2、根据topk概率,获取损失函数;2.3、基于所述损失函数,构建两层神经网络模型,对所述两层神经网络模型使用批量梯度下降算法作为优化算法,通过topk排序模型模型,对于某一蕴含,得到其前k个容易理解的辩解。与现有技术比较,本专利技术的有益效果为:本专利技术提出了一种基于机器学习技术的辩解排序方法。具体而言,首先提出了一套面向用户认知的、度量OW本文档来自技高网
...

【技术保护点】
1.一种本体调试信息的度量与排序方法,其特征在于,包括:1)、根据用户认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度三方面;2)、采用ListNet排序学习方法构造top k排序模型,根据top k排序模型对特征化后的辩解进行排序,获取排序前k个易理解的辩解。

【技术特征摘要】
1.一种本体调试信息的度量与排序方法,其特征在于,包括:1)、根据用户认知,提取辩解的度量标准,所述度量标准包含复杂度、相关度及新颖度三方面;2)、采用ListNet排序学习方法构造topk排序模型,根据topk排序模型对特征化后的辩解进行排序,获取排序前k个易理解的辩解。2.根据权利要求1所述的本体调试信息的度量与排序方法,其特征在于,所述步骤1)中复杂度包括语法复杂度和语义复杂度。3.根据权利要求2所述的本体调试信息的度量与排序方法,其特征在于,所述语法复杂度包含9个组件的基于认知复杂度的辩解度量模型以及3个补充组件,所述补充组件包括:AxiomNumbers、SignatureDifference2以及AxiomOrders;所述AxiomNumbers,用于统计辩解中公理的数量;所述SignatureDifference2,用于检测在辩解中出现但未在蕴含中出现的词汇的数量;所述AxiomOrders,用于检测辩解中公理是否按照辩解推理的顺序呈现。4.根据权利要求3所述的本体调试信息的度量与排序方法,其特征在于,所述语义复杂度包含五个度量辩解:RuleNumber、RuleType、ComplexRuleNumber、TreeDep...

【专利技术属性】
技术研发人员:吴刚邱煜晶乔百友王波涛韩东红刘辉林王国仁
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1