The invention provides a multi object ontology matching method, including ontology division stage, multi target ontology matching stage and integrated ontology block matching results; the body divided stage is the large-scale ontology partition for ontology block, make the ontology matching process only in the relatively small size of the similar body block the multi-objective; ontology matching stage is the automatic selection and combination of different kinds of ontology matching for different ontology block matching process, in which different ontology block matching process is executed concurrently; the integrated ontology block matching results is the integration of different ontology block matching results, and recommend different preferences solution. The invention aims at optimizing the matching results of multiple matcher simultaneously, and does not need to debug multiple combination parameters, and it can provide various preferences for different decision-makers at once.
【技术实现步骤摘要】
一种多目标本体匹配方法及计算机设备
本专利技术涉及一种多目标本体匹配方法及可执行该方法的计算机设备。
技术介绍
本体:指对某个领域中的知识的概念化明确的规范说明,即对某个领域中存在的对象、概念、其他实体以及它们之间的关系的正式的和规范化的描述。本体匹配过程:确定两个异质本体中语义相同的实体对集合的过程。本体匹配技术可以解决本体异质问题(同一个概念在不同本体有不同的名字),实现基于本体的应用程序在语义层面上的协作。由于不同的本体匹配器确定的本体匹配结果各不相同,本体匹配技术通常会通过组合多个本体匹配器来提高本体匹配结果的质量。如何选择和组合不同的本体匹配器以获取高质量的本体匹配结果是本体匹配领域最主要的挑战问题(参见ShvaikoP,EuzenatJ,Ontologymatching:stateoftheartandfuturechallenges,IEEETransactionsonknowledgeanddataengineering25(1)(2013)158–176)。本体作为语义网的核心技术,是一种共享的、正式的信息交换参考模型,它描述了某个领域中存在的对象、概念、其他实体以及它们之间的关系[1]。本体技术在知识管理、信息检索、电子商务和生物医学等领域都具有重要应用,目前语义网上已公布的本体中含有的实体规模已经达到31亿之巨。然而,这些本体间的异质问题(同一个概念在不同本体有不同的名字)是实现语义网中不同应用间语义协作的最大障碍,也是制约语义网发展的瓶颈问题。本体匹配技术是当前解决本体异质问题最有效的方法[2]。可是截至本专利申报书完成之前(201 ...
【技术保护点】
一种多目标本体匹配方法,其特征在于:包括本体划分阶段,多目标本体匹配阶段和集成本体分块匹配结果阶段;所述本体划分阶段是将大规模的本体划分为本体分块,使得后续的本体匹配过程只需在相对小规模的相似本体分块中进行;所述多目标本体匹配阶段是自动选择和组合各类不同的本体匹配器进行不同的本体分块匹配过程,其中不同的本体分块匹配过程是并发执行的;所述集成本体分块匹配结果阶段是集成不同本体分块匹配结果,并推荐不同偏好解。
【技术特征摘要】
1.一种多目标本体匹配方法,其特征在于:包括本体划分阶段,多目标本体匹配阶段和集成本体分块匹配结果阶段;所述本体划分阶段是将大规模的本体划分为本体分块,使得后续的本体匹配过程只需在相对小规模的相似本体分块中进行;所述多目标本体匹配阶段是自动选择和组合各类不同的本体匹配器进行不同的本体分块匹配过程,其中不同的本体分块匹配过程是并发执行的;所述集成本体分块匹配结果阶段是集成不同本体分块匹配结果,并推荐不同偏好解。2.根据权利要求1所述的一种多目标本体匹配方法,其特征在于:所述本体划分阶段是采用面向映射的本体划分算法,具体过程为:(1)通过SemanticAccuaracy度量本体结构的分散性和不平衡性来选择可靠性较强的本体作为源本体;(2)利用扩展自SCAN算法的本体划分算法将源本体划分为本体分块;(3)对每个源本体分块利用概念相关度度量来确定其相似的目标本体分块。3.根据权利要求2所述的一种多目标本体匹配方法,其特征在于:所述多目标本体匹配阶段包括建模过程和匹配过程;所述建模过程具体是:(11)将本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体;则本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;(12)给定本体匹配结果A,其质量由r(A),p(A)和f(A)来度量,三者分别用于近似估计本体匹配结果的查全率,查准率和f度量:其中,|A|是A中的匹配对数量,MC(A)和MR(A)分别计算A的MatchCoverage和MatchRatio的值,δi是A中第i个匹配对的相似度值,α∈[0,1]是调整参数,用于权衡本体匹配结果的查全率和查准率;(13)给定源本体分块Osrc和目标本体分块Otgt,设计多目标本体匹配问题的优化模型如下:该优化模型定义了依据不同的本体匹配器确定的相似度矩阵来一次确定多个非支配本体匹配结果的问题,其中,m是本体匹配器的数量,fi(X),i=1,2,...,m计算第i个本体匹配器结果的f(X)值,|Osrc|和|Otgt|分别表示本体分块Osrc和Otgt中的实体集合的基数,xi,i=1,2,...,|Osrc|表示第i个实体匹配对;每对本体分块的匹配对应分配一个线程,每个线程通过NSGA-III来优化集成m个本体匹配器并确定最终的本体分块匹配结果,各线程并发执行;所述匹配过程具体是:(21)首先通过DasandDennis’s的系统方法产生参考点;产生参考点的过程中,由于所有的目标值都在范围[0,1]中切理想点就是原点,因此每一代进化过程中的归一化不需要执行;(22)初始化当代种群;(23)通过交叉和变异算子产生下一代种群;(24)对所述当前代种群和所述下一代种族进行组合得到组合种群;(25)将组合种群同参考点关联后执行非支配操作;(26)确定下一代种群,回到步骤(23),直到满足终止产生种群的条件。4.根据权利要求3所述的一种多目标本体匹配方法,其特征在于:所述α值同查全率呈正比,同查准率成反比。5.根据权利要求3或4所述的一种多目标本体匹配方法,其特征在于:所述α的取值是0.35。6.根据权利要求3所述的一种多目标本体匹配方法,其特征在于:在确定下一代种群过程中,对于最后一层的个体,先对其进行升序排序,然后按照顺序依次选择。7.根据权利要求1所述的一种多目标本体匹配方法,其特征在于:所述集成本体分块匹配结果阶段是通过贪心算法集成不同本体分块匹配结果在获得的非支配前沿解中,选...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。