一种基于竞价算法的本体匹配方法组成比例

技术编号:18940821 阅读:31 留言:0更新日期:2018-09-15 11:08
本发明专利技术公开了一种基于竞价算法的本体匹配方法,将本体匹配过程视为二分图的完美匹配问题,并建立相应的优化模型;通过竞价算法确定最优的本体匹配结果。本发明专利技术减少了运行时间。竞价算法的能够在二项式时间内确定最优的本体匹配结果,远低于前沿的基于进化算法的本体匹配技术。本发明专利技术节约了内存消耗。竞价算法所需的内存远低于前沿的基于进化算法的本体匹配技术。本发明专利技术提高了本体匹配结果的质量。前沿的基于进化算法的本体匹配技术确定的是次优的本体匹配结果,而竞价算法可以确定最优的本体匹配结果。

An ontology matching method based on bidding algorithm

The invention discloses an ontology matching method based on bidding algorithm, which regards ontology matching process as a perfect matching problem of bipartite graph, and establishes corresponding optimization model, and determines the optimal ontology matching result through bidding algorithm. The invention reduces running time. Bidding algorithm can determine the optimal ontology matching result in binomial time, which is far lower than the advanced ontology matching technology based on evolutionary algorithm. The invention saves memory consumption. The memory required by the bidding algorithm is much lower than that of the ontology based matching technology based on the evolutionary algorithm. The invention improves the quality of the result of the ontology matching. The frontier ontology matching technology based on evolutionary algorithm determines the sub-optimal ontology matching results, while bidding algorithm can determine the optimal ontology matching results.

【技术实现步骤摘要】
一种基于竞价算法的本体匹配方法
本专利技术属于数据处理领域,尤其涉及一种基于竞价算法的本体匹配方法。
技术介绍
本体是指某个领域中的知识的概念化明确的规范说明,即对某个领域中存在的对象、概念、其他实体以及它们之间的关系的正式的和规范化描述。本体匹配过程:确定两个异质本体中语义相同的实体对集合的过程。本体匹配技术可以解决本体异质问题(同一个概念在不同本体有不同的名字),实现基于本体的应用程序在语义层面上的协作。然而面对大规模的本体概念集合,如何在本体匹配过程中高效地确定相似的本体概念对是本体匹配领域的挑战问题之一本体作为语义网的核心技术,是一种共享的、正式的信息交换参考模型,它描述了某个领域中存在的对象、概念、其他实体以及它们之间的关系。本体技术在知识管理、信息检索、电子商务和生物医学等领域都具有重要应用,目前语义网上已公布的本体中含有的实体规模已经达到31亿之巨。然而,这些本体间的异质问题(同一个概念在不同本体有不同的名字)是实现语义网中不同应用间语义协作的最大障碍,也是制约语义网发展的瓶颈问题。本体匹配技术是当前解决本体异质问题最有效的方法。可是截至本专利申报书完成之前(2017年11月),已有的本体匹配技术对语义网上已公布的5亿个实体匹配结果有接近45%是错误的。因此目前急需一种能够高效获取最优本体匹配结果的本体匹配技术,而前沿的本体匹配技术普遍采用的方法是组合多个不同的本体匹配器的本体匹配结果以提高本体匹配结果的质量,其匹配效率普遍低下。近年来进化算法成为实现本体匹配过程的前沿技术。为了通过进化过程来获取高质量的本体匹配结果,基于单目标进化算法MemticAlgorithm,以及基于两目标进化算法NSGA-II和MOEA/D的本体匹配技术陆续被提出。其中引入了MatchFmeasure度量和UIR度量以实现一次匹配多组本体的目的,通过聚类算法和交互式技术来组合不同的本体匹配器,提出了一种高效的局部搜索策略以提高本体匹配过程的效率;构建了一种两目标的本体匹配优化模型,提出了一种减少算法对优化目标偏好的本体匹配方案,提出了一种近似的本体匹配结果的质量度量技术,构建一种新的两目标的本体匹配优化模型,并设计了一种高效的本体匹配过程,通过将两个优化目标分解为多个子目标以减少算法对优化目标的偏好。但是无论采用什么策略,这些方法都需要消耗大量的运行时间和内存空间(尤其在本体中的概念数量庞大的时候)来确定次优的本体匹配结果,无法满足实际应用的需求。针对这一问题,本专利技术提出了一种基于竞价算法的本体匹配技术,该技术将本体匹配过程视为二分图的完美匹配问题,并在多项式时间内确定最优的本体匹配结果。
技术实现思路
为解决上述问题本专利技术提供了一种基于竞价算法的本体匹配方法。本专利技术是通过如下技术方案实现的:一种基于竞价算法的本体匹配方法,所述本体O包括概念集合C,属性集合P和实例集合I,其中概念,属性和实例统称为本体的实体;本体匹配结果A是一个实体匹配对的集合,表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;所述本体匹配方法包括如下步骤,步骤一)两个待匹配本体为O1={e11,e12,...e1n}和O2={e21,e22,...e2n},e1i,i=1,2,...,n和e2j,j=1,2,...,n分别是两个本体中的实体,建立如下模型:其中:aij是实体e1i和e2j的相似度值;当e1i和e2j匹配上时xij=1,否则xij=0。步骤二)初始化:设置本体O2中所有的实体e2j,j=1,2,...,n所对应的参数pj为0;步骤三)迭代:对于本体O1中某个未匹配上的实体e1i,设置其对应的xij为1,其中j=argmaxaij,j∈{1,2,...,n},更新pj=aij-pj+ω,其中ω是一个很小的正数,可以取0.001;设置xkj=0,k∈{1,2,...,n},k≠i;步骤四)终止条件:若所有的e1i∈O1都实现匹配,则终止。与现有技术相比,本专利技术具有以下优点:本专利技术将本体匹配过程视为二分图的完美匹配问题,并建立相应的优化模型;通过竞价算法确定最优的本体匹配结果。本专利技术减少了运行时间。竞价算法的能够在二项式时间内确定最优的本体匹配结果,远低于前沿的基于进化算法的本体匹配技术。本专利技术节约了内存消耗。竞价算法所需的内存远低于前沿的基于进化算法的本体匹配技术。本专利技术提高了本体匹配结果的质量。前沿的基于进化算法的本体匹配技术确定的是次优的本体匹配结果,而竞价算法可以确定最优的本体匹配结果。本专利技术中的方法可用于语义网、数据信息集成技术、电子商务系统、地理信息系统、Web服务组合和智能语义检索系统。具体实施方式实施例1(1)多目标本体匹配问题在本专利技术中,本体O定义为O={C,P,I},其中C,P和I分别表示本体中的概念集合,属性集合和实例集合,其中概念,属性和实例统称本体的实体。本体匹配结果A是一个实体匹配对的集合,每一个实体匹配对可以表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的关系(在本专利技术中特指等价关系)。给定两个待匹配本体O1={e11,e12,...e1n}和O2={e21,e22,...e2n},e1i,i=1,2,...,n和e2j,j=1,2,...,n分别是两个本体中的实体,本体匹配问题的优化模型如下:其中:aij是实体e1i和e2j的相似度值;当e1i和e2j匹配上时xij=1,否则xij=0。(2)竞价算法1.初始化步骤:设置所有的e2j,j=1,2,...,n对应的参数pj为0;2.迭代步骤:对于某个未匹配上的实体e1i∈O1,设置其对应的xij为1,其中j=argmaxaij,j∈{1,2,...,n},更新pj=aij-pj+ω,其中ω是一个很小的正数,可以取0.001;设置xkj=0,k∈{1,2,...,n},k≠i。3.终止条件:如果所有的e1i∈O1都匹配上了,算法终止。以上实施例仅用于说明本专利技术,但不用来限制本专利技术的范围,凡是依据本专利技术的技术实质对以下实例所作的任何简单修改、等同变化与修饰,均仍属于本专利技术技术方案的范围内。本文档来自技高网
...

【技术保护点】
1.一种基于竞价算法的本体匹配方法,其特征在于,所述本体O包括概念集合C,属性集合P和实例集合I,其中概念,属性和实例统称为本体的实体;本体匹配结果A是一个实体匹配对的集合,表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;所述本体匹配方法包括如下步骤:步骤一)两个待匹配本体为O1={e11,e12,...e1n}和O2={e21,e22,...e2n},e1i,i=1,2,...,n和e2j,j=1,2,...,n分别是两个本体中的实体,建立如下模型:

【技术特征摘要】
1.一种基于竞价算法的本体匹配方法,其特征在于,所述本体O包括概念集合C,属性集合P和实例集合I,其中概念,属性和实例统称为本体的实体;本体匹配结果A是一个实体匹配对的集合,表示为一个四元组{e,e',n,rel},其中e和e'分别表示元本体和目标本体的实体,n是e和e'关系的可信度值,rel是e和e'之间的等价关系;所述本体匹配方法包括如下步骤:步骤一)两个待匹配本体为O1={e11,e12,...e1n}和O2={e21,e22,...e2n},e1i,i=1,2,...,n和e2j,j=1,2,...,n分...

【专利技术属性】
技术研发人员:薛醒思章静
申请(专利权)人:福建工程学院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1