一种基于紧凑进化算法的本体匹配方法组成比例

技术编号:14558140 阅读:57 留言:0更新日期:2017-02-05 12:35
本发明专利技术公开了一种基于紧凑进化算法的本体匹配方法,包括如下步骤:步骤1)给定两个本体O1和O2,针对不同相似度度量技术获取不同的本体匹配结果;步骤2)采用基于元模型的紧凑遗传算法求解获取最优的集成权重向量。本发明专利技术针对现有的基于进化算法的本体元匹配系统在本体匹配过程中构建完整的群体参与进化过程导致内存消耗过大的问题以及在实际应用中评价个体消耗的内存和时间太大的问题,提出了采用紧凑遗传算法来减少群体消耗的内存量,并在紧凑遗传算法中利用元模型来进一步减少算法在求解过程中所需的内存量和时间。

An ontology matching method based on compact evolutionary algorithm

The invention discloses a method of matching compact evolutionary algorithm based on ontology, which comprises the following steps: Step 1) given two body O1 and O2, according to the different similarity measurement techniques to obtain different matching results; step 2) using integrated weight vector compact genetic algorithm to obtain the optimal solution based on element model. The present invention of the meta ontology evolution algorithm matching system based on Ontology Matching in the process of building a complete group involved in the evolutionary process leading to excessive consumption of memory problems and individual consumption of memory and time evaluation in practical application is too large, the compact genetic algorithm to reduce the amount of memory consumption and population. To reduce the algorithm needed in the process of solving the amount of memory and time further using meta model in compact genetic algorithm.

【技术实现步骤摘要】

本专利技术属于计算机信息领域,具体地,本专利技术涉及一种基于紧凑进化算法的本体匹配方法。
技术介绍
元模型:元模型是一种利用已有信息构建的替代评价模型,该模型可以通过已经评价的点来近似一个多变量函数以预测新的点的评价值。随着语义网的发展,出现了大量的本体。由于应用目的相似,许多本体共存于同一个领域中。然而由于人的主观性,同一个应用领域的不同本体可能用不同的方式定义同一个实体对象,产生了本体异质问题。为了能够通过本体实现不同的应用系统在语义层面的协作,需要确定不同本体中元素之间的语义对应关系。对于拥有上百万个概念实体的大规模的本体而言,通过人为的方式来完成本体匹配是不现实的。因此,需要开发高效的本体匹配系统来自动完成本体匹配过程。由于用户无法等待太长的系统响应过程,因此对于动态的应用场景而言,本体匹配系统十分强调在有限的运行时间内完成本体匹配过程。从这个意义上来说,除了本体匹配结果的质量之外,本体匹配过程的效率(匹配过程所需的运行时间和消耗的内存量)至关重要。当前已有的基于进化算法的本体匹配系统虽然都采用了不同的策略来提高本体匹配过程的效率,但是由于采用的基础算法框架没有本质的提升,所以高效且智能的本体匹配过程仍然是一个挑战问题。目前在基于进化算法的本体匹配系统中,最著名的是GOAL(GeneticsforOntologyALignments)。GOAL无法直接计算两个本体间的匹配,而是r>通过进化算法来确定最优的权重配置以集成不同相似度度量技术。类似的思想在近期的一些文章中也得以体现。在一篇文章中,给定部分参考匹配结果的前提下,各种方法如进化算法被应用于确定最优的系统参数。此外,Vitiello等在2012年提出通过混合进化算法求解本体匹配问题。由于混合进化算法在传统进化算法中加入了局部搜索算子,提升了进化寻优过程的效率。紧凑算法是一类估计分布式算法,可以将完整的种群通过概率分布函数来表示。第一个紧凑遗传算法是紧凑遗传算法,该算法模拟了标准二进制编码的遗传算法的行为。扩展紧凑遗传算法的思想是选择一个好的概率分布函数等价于链接学习。集成了Nelder-Mead算法的混合扩展紧凑遗传算法也已经在文献中被提出。为了提高智能计算的效率,近年来各种各样的元模型方法被应用于人工神经网络和高斯随机域建模中。在人工神经网络中,元模型方法被应用在多层神经元或基于插值的放射基础函数网络。在此过程中,元模型的形式有的是标准形式,有的是加入同输入变量相对重要性有关的特征。在高斯随机域建模中,元模型通过之前的评价结果来预测候选解的目标函数值。同人工神经网络不同,高斯随机域建模不仅预测函数值,还预测了可靠的取值区间。近期的文献表示,基于高斯随机域的元模型在许多应用领域中获得了成功。现有的基于进化算法的本体匹配系统在匹配本体的过程中消耗的内存过大、运行时间太长。
技术实现思路
为解决上述问题,本专利技术提供了一种基于紧凑进化算法的本体匹配方法。本专利技术针对现有的基于进化算法的本体匹配系统在本体匹配过程中构建完整的群体参与进化过程导致内存消耗过大的问题以及在实际应用中评价个体消耗的内存和时间太大的问题,提出了采用紧凑遗传算法来减少群体消耗的内存量,并在紧凑遗传算法中集成元模型来进一步减少算法在求解过程中所需的内存量和时间。为达到上述技术效果,本专利技术的技术方案是:一种基于紧凑进化算法的本体匹配方法,包括如下步骤:步骤1)给定两个本体O1=(C1,P1,I1),O2=(C2,P2,I2);其中O1和O2分别表示两个本体;C1和C2分别为O1和O2中概念的集合;P1和P2分别为O1和O2中概念之间关系的集合;I1和I2分别为O1和O2中实例的集合,所述实例为概念对应的实际对象;生成配对矩阵,配对矩阵的行和列分别为O1和O2中的实例,通过相似度度量技术对配对矩阵内的实例对进行相似度评价生成相似度值并形成相似度矩阵,每种相似度度量技术对应一个相似度矩阵;对每个相似度矩阵分别设置权重向量;集合所有的权重向量形成集成权重向量,根据集成权重向量将各相似度矩阵合并生成最终相似度矩阵;集成权重向量的生成方法为:通过在区间[0,1]中随机确定分割点来间接地表示每个相似度矩阵的权重;分割点集合为:c'={c1',c'2,...,c'p-1本文档来自技高网...

【技术保护点】
一种基于紧凑进化算法的本体匹配方法,其特征在于,包括如下步骤:步骤1)给定两个本体O1=(C1,P1,I1),O2=(C2,P2,I2);其中O1和O2分别表示两个本体;C1和C2分别为O1和O2中概念的集合;P1和P2分别为O1和O2中概念之间关系的集合;I1和I2分别为O1和O2中实例的集合,所述实例为概念对应的实际数据对象;生成配对矩阵,配对矩阵的行和列分别为O1和O2中的实例,通过相似度度量技术对配对矩阵内的实例对进行相似度评价生成相似度值并形成相似度矩阵,每种相似度度量技术对应一个相似度矩阵;对每个相似度矩阵分别设置权重向量;集合所有的权重向量形成集成权重向量,根据集成权重向量将各相似度矩阵合并生成最终相似度矩阵;集成权重向量的生成方法为:通过在区间[0,1]中随机确定分割点来间接地表示每个相似度矩阵的权重;分割点集合为:c'={c′1,c′2,...,c′p‑1},其中P表示采用的相似度度量技术的数量;将分割点集合中的元素按照升序排列,得到新的集合c={c1,c2,...,cp‑1};根据新的集合c={c1,c2,...,cp‑1},某一相似度矩阵的权重wk为:wk=c1,k=1ck-ck-1,1<k<p1-cp-1,k=p---(1)]]>根据相似度矩阵的权重wk集成所有的相似度矩阵:φ(s→(c),-w→)=Σi=1nwisi(c)---(2)]]>其中,表示通过权重向量生成的最终相似度矩阵;为所有相似度矩阵的集合;为所有权重向量的集合;n为相似度度量技术的个数;si(C)表示第i个相似度矩阵;wi表示第i个权重向量;c表示配对矩阵;步骤2)求解本体元匹配问题:2.1)建立本体元匹配问题的优化模型:maxf-measure(X)s.t.X=(x1,x2,...,xn+1)Txi∈[0,1],i=1...n+1---(3)]]>其中,max f‑measure(X)表示目标函数是最大化f‑measure值,f‑measure(X)用于度量匹配结果的质量;X表示本体源匹配系统中所需要确定的的参数向量;xi表示参数值;n表示采用的相似度度量技术的个数,xn+1表示用于过滤最终匹配结果的阈值;2.2)使用进化算法重复步骤1),并且使用优化模型评价最终相似度矩阵;其中,根据每次生成的集成权重向量和优化模型的评价结果建立集成权重向量的元模型,根据元模型计算出下次生成最终相似度矩阵时使用的集成权重向量;至得到最优解,所述最优解为最接近max f‑measure(X)的值的最终相似度矩阵。...

【技术特征摘要】
1.一种基于紧凑进化算法的本体匹配方法,其特征在于,包括如下步
骤:
步骤1)给定两个本体O1=(C1,P1,I1),O2=(C2,P2,I2);
其中O1和O2分别表示两个本体;C1和C2分别为O1和O2中概念的集合;
P1和P2分别为O1和O2中概念之间关系的集合;I1和I2分别为O1和O2中实例
的集合,所述实例为概念对应的实际数据对象;
生成配对矩阵,配对矩阵的行和列分别为O1和O2中的实例,通...

【专利技术属性】
技术研发人员:薛醒思
申请(专利权)人:福建工程学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1