一种多目标本体匹配方法及计算机设备组成比例

技术编号:17363627 阅读:56 留言:0更新日期:2018-02-28 13:40
本发明专利技术提供一种多目标本体匹配方法,包括本体划分阶段,多目标本体匹配阶段和集成本体分块匹配结果阶段;所述本体划分阶段是将大规模的本体划分为本体分块,使得后续的本体匹配过程只需在相对小规模的相似本体分块中进行;所述多目标本体匹配阶段是自动选择和组合各类不同的本体匹配器进行不同的本体分块匹配过程,其中不同的本体分块匹配过程是并发执行的;所述集成本体分块匹配结果阶段是集成不同本体分块匹配结果,并推荐不同偏好解。本发明专利技术以同时优化多个匹配器的匹配结果为目标,不需要调试多个组合参数,能够一次为不同决策者提供多种偏好的本体匹配结果。

A multi object ontology matching method and computer equipment

The invention provides a multi object ontology matching method, including ontology division stage, multi target ontology matching stage and integrated ontology block matching results; the body divided stage is the large-scale ontology partition for ontology block, make the ontology matching process only in the relatively small size of the similar body block the multi-objective; ontology matching stage is the automatic selection and combination of different kinds of ontology matching for different ontology block matching process, in which different ontology block matching process is executed concurrently; the integrated ontology block matching results is the integration of different ontology block matching results, and recommend different preferences solution. The invention aims at optimizing the matching results of multiple matcher simultaneously, and does not need to debug multiple combination parameters, and it can provide various preferences for different decision-makers at once.

【技术实现步骤摘要】
一种多目标本体匹配方法及计算机设备
本专利技术涉及一种多目标本体匹配方法及可执行该方法的计算机设备。
技术介绍
本体:指对某个领域中的知识的概念化明确的规范说明,即对某个领域中存在的对象、概念、其他实体以及它们之间的关系的正式的和规范化的描述。本体匹配过程:确定两个异质本体中语义相同的实体对集合的过程。本体匹配技术可以解决本体异质问题(同一个概念在不同本体有不同的名字),实现基于本体的应用程序在语义层面上的协作。由于不同的本体匹配器确定的本体匹配结果各不相同,本体匹配技术通常会通过组合多个本体匹配器来提高本体匹配结果的质量。如何选择和组合不同的本体匹配器以获取高质量的本体匹配结果是本体匹配领域最主要的挑战问题(参见ShvaikoP,EuzenatJ,Ontologymatching:stateoftheartandfuturechallenges,IEEETransactionsonknowledgeanddataengineering25(1)(2013)158–176)。本体作为语义网的核心技术,是一种共享的、正式的信息交换参考模型,它描述了某个领域中存在的对象、概念、其他实体以及它们之间的关系[1]。本体技术在知识管理、信息检索、电子商务和生物医学等领域都具有重要应用,目前语义网上已公布的本体中含有的实体规模已经达到31亿之巨。然而,这些本体间的异质问题(同一个概念在不同本体有不同的名字)是实现语义网中不同应用间语义协作的最大障碍,也是制约语义网发展的瓶颈问题。本体匹配技术是当前解决本体异质问题最有效的方法[2]。可是截至本专利申报书完成之前(2017年2月),已有的本体匹配技术对语义网上已公布的5亿个本体实体匹配结果中有接近45%是错误的[3,4]。因此,业内急需一种能够获取高质量本体匹配结果的本体匹配技术,而前沿的本体匹配技术普遍采用的方法是组合多个不同的本体匹配器的本体匹配结果以提高本体匹配结果的质量。在所有的本体匹配器的组合方式中,并行的组合方式由于其灵活性和可调试性强更易于获取高质量的本体匹配结果,从而成为当前本体匹配技术的首选组合方式[5]。近年来进化算法逐渐成为实现并行组合不同本体匹配器的前沿技术。为了通过进化过程来获取高质量的本体匹配结果,基于单目标进化算法MemticAlgorithm[6-8],以及基于两目标进化算法NSGA-II[9-11]和MOEA/D[12]的本体匹配技术陆续被提出。其中[6]引入了MatchFmeasure度量和UIR度量以实现一次匹配多组本体的目的,[7]通过聚类算法和交互式技术来组合不同的本体匹配器,[8]提出了一种高效的局部搜索策略以提高本体匹配过程的效率;[9]构建了一种两目标的本体匹配优化模型,提出了一种减少算法对优化目标偏好的本体匹配方案,[10]提出了一种近似的本体匹配结果的质量度量技术,[11]构建一种新的两目标的本体匹配优化模型,并设计了一种高效的本体匹配过程,[12]通过将两个优化目标分解为多个子目标以减少算法对优化目标的偏好。已有方法将已有的本体匹配器视为黑箱程序,试图通过确定最优的权重集合来集成并获取最终的本体匹配结果。但是这些技术忽略了本体匹配结果中由不同实体映射对对于本体匹配器的偏好,使得最终的本体匹配结果质量不高。此外,这些方法获取的集成权重集合无法在其他场景中复用,这意味着调试组合参数的意义不大。最后,这些方法无法满足不同的决策者对本体匹配结果的偏好。综上,目前的本体匹配方法具有如下缺点:(1)忽略了本体匹配结果中由不同实体映射对对于本体匹配器的偏好,使得最终的本体匹配结果质量不高;(2)获取的集成权重集合无法在其他场景中复用,这意味着调试组合参数的意义不大;(3)无法满足不同偏好的决策者对本体匹配结果的要求。[1]GarridoA.LogicalFoundationsofArtificialIntelligence[J].BRAIN.BroadResearchinArtificialIntelligenceandNeuroscience,2010,1(2):149-152.[2]ShvaikoP,EuzenatJ.Ontologymatching:stateoftheartandfuturechallenges[J].IEEETransactionsonknowledgeanddataengineering,2013,25(1):158-176.[3]LiuW.Truthdiscoverytoresolveobjectconflictsinlinkeddata[J].arXivpreprintarXiv:1509.00104,2015.[4]LiuW,LiuJ,DuanH,etal.ExploitingSource-ObjectNetworktoResolveObjectConflictsinLinkedData[J].arXivpreprintarXiv:1604.08407,2016.[5]M.Gulic,B.Vrdoljak,M.Banek,CroMatcher:Anontologymatchingsystembasedonautomatedweightedaggregationanditerativefinalalignment,WebSemantics:Science,ServicesandAgentsontheWorldWideWeb41(2016)50–71.[6]X.Xue,Y.Wang,OptimizingOntologyAlignmentsthroughaMemeticAlgorithmUsingbothMatchFmeasureandUnanimousImprovementRatio,ArtificialIntelligence223(2015)65–81.[7]X.Xue,Y.Wang,A.Ren,Optimizingontologyalignmentthroughmemeticalgorithmbasedonpartialreferencealignment,ExpertSystemswithApplications41(7)(2014)3213–3222.[8]G.Acampora,V.Loia,A.Vitiello,Enhancingontologyalignmentthroughamemeticaggregationofsimilaritymeasures,InformationSciences250(2013)1–20.[9]X.Xue,Y.Wang,W.Hao,OptimizingOntologyAlignmentsbyusingNSGA-II,InternationalArabJournalofInformationTechnology12(2)(2015)176–182.[10]X.Xue,Y.Wang,W.Hao,J.Hou,OptimizingOntologyAlignmentsthroughNSGA-IIwithoutUsingReferenceAlignment,ComputingandInformatics33(4)(2014)857–876.[11]G.本文档来自技高网...
一种多目标本体匹配方法及计算机设备

【技术保护点】
一种多目标本体匹配方法,其特征在于:包括本体划分阶段,多目标本体匹配阶段和集成本体分块匹配结果阶段;所述本体划分阶段是将大规模的本体划分为本体分块,使得后续的本体匹配过程只需在相对小规模的相似本体分块中进行;所述多目标本体匹配阶段是自动选择和组合各类不同的本体匹配器进行不同的本体分块匹配过程,其中不同的本体分块匹配过程是并发执行的;所述集成本体分块匹配结果阶段是集成不同本体分块匹配结果,并推荐不同偏好解。

【技术特征摘要】
1.一种多目标本体匹配方法,其特征在于:包括本体划分阶段,多目标本体匹配阶段和集成本体分块匹配结果阶段;所述本体划分阶段是将大规模的本体划分为本体分块,使得后续的本体匹配过程只需在相对小规模的相似本体分块中进行;所述多目标本体匹配阶段是自动选择和组合各类不同的本体匹配器进行不同的本体分块匹配过程,其中不同的本体分块匹配过程是并发执行的;所述集成本体分块匹配结果阶段是集成不同本体分块匹配结果,并推荐不同偏好解。2.根据权利要求1所述的一种多目标本体匹配方法,其特征在于:所述本体划分阶段是采用面向映射的本体划分算法,具体过程为:(1)通过SemanticAccuaracy度量本体结构的分散性和不平衡性来选择可靠性较强的本体作为源本体;(2)利用扩展自SCAN算法的本体划分算法将源本体划分为本体分块;(3)对每个源本体分块利用概念相关度度量来确定其相似的目标本体分块。3.根据权利要求2所述的一种多目标本体匹配方法,其特征在于:所述多目标本体匹配阶段包括建模过程和匹配过程;所述建模过程具体是:(11)将本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体;则本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;(12)给定本体匹配结果A,其质量由r(A),p(A)和f(A)来度量,三者分别用于近似估计本体匹配结果的查全率,查准率和f度量:其中,|A|是A中的匹配对数量,MC(A)和MR(A)分别计算A的MatchCoverage和MatchRatio的值,δi是A中第i个匹配对的相似度值,α∈[0,1]是调整参数,用于权衡本体匹配结果的查全率和查准率;(13)给定源本体分块Osrc和目标本体分块Otgt,设计多目标本体匹配问题的优化模型如下:该优化模型定义了依据不同的本体匹配器确定的相似度矩阵来一次确定多个非支配本体匹配结果的问题,其中,m是本体匹配器的数量,fi(X),i=1,2,...,m计算第i个本体匹配器结果的f(X)值,|Osrc|和|Otgt|分别表示本体分块Osrc和Otgt中的实体集合的基数,xi,i=1,2,...,|Osrc|表示第i个实体匹配对;每对本体分块的匹配对应分配一个线程,每个线程通过NSGA-III来优化集成m个本体匹配器并确定最终的本体分块匹配结果,各线程并发执行;所述匹配过程具体是:(21)首先通过DasandDennis’s的系统方法产生参考点;产生参考点的过程中,由于所有的目标值都在范围[0,1]中切理想点就是原点,因此每一代进化过程中的归一化不需要执行;(22)初始化当代种群;(23)通过交叉和变异算子产生下一代种群;(24)对所述当前代种群和所述下一代种族进行组合得到组合种群;(25)将组合种群同参考点关联后执行非支配操作;(26)确定下一代种群,回到步骤(23),直到满足终止产生种群的条件。4.根据权利要求3所述的一种多目标本体匹配方法,其特征在于:所述α值同查全率呈正比,同查准率成反比。5.根据权利要求3或4所述的一种多目标本体匹配方法,其特征在于:所述α的取值是0.35。6.根据权利要求3所述的一种多目标本体匹配方法,其特征在于:在确定下一代种群过程中,对于最后一层的个体,先对其进行升序排序,然后按照顺序依次选择。7.根据权利要求1所述的一种多目标本体匹配方法,其特征在于:所述集成本体分块匹配结果阶段是通过贪心算法集成不同本体分块匹配结果在获得的非支配前沿解中,选...

【专利技术属性】
技术研发人员:薛醒思
申请(专利权)人:福建工程学院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1