一种场站设备的多策略本体语义匹配改进方法及终端技术

技术编号:32806335 阅读:12 留言:0更新日期:2022-03-26 19:58
本发明专利技术公开了一种场站设备的多策略本体语义匹配改进方法及终端,包括步骤:步骤S1、根据多个相似度度量算法建立多元线性回归模型,根据多元线性回归模型,计算出初始的相似度矩阵M

【技术实现步骤摘要】
一种场站设备的多策略本体语义匹配改进方法及终端


[0001]本专利技术涉及模型匹配
,特别涉及一种场站设备的多策略本体语义匹配改进方法及终端。

技术介绍

[0002]随着智能电网建设的不断推进,数据共享和信息交互是其发展的必然要求。IEC61970是针对智能调度中心定义的标准,其中最核心的部分是CIM(Common Information Model,公共信息模型),电力系统中的所有对象都可以通过CIM进行抽象。
[0003]而智能变电站认同的描述和配置语言是IEC61850标准中的SCL(Substation Configuration Language,变电站配置语言),用来描述变电站中的对象,两者模型的差异较大,导致双方很难直接通信,进而实现数据共享和信息交互。为了解决调度中心与变电站因数据模型不同导致的数据交互困难,为此,有必要建立SCL本体到CIM本体的匹配映射。
[0004]基础的匹配技术方法主要有三种:
[0005](1)字符串的匹配技术
[0006]本体匹配的过程中,一般都会借助字符串相关的算法来进行。本质而言,其就是对不同元素的名称、解释等展开运算,以下重点论述4类一般性的相似性运算手段。
[0007]prefix:参照单词的前缀展开运算,查看相似程度,例如"net"和"network"。
[0008]suffix:比较单词的后缀计算相似性,例如"word"和"sword"。
[0009]Editdistance:把一个单词转变成另外的单词,对于增加、删除等步骤的任务量展开运算,查看其具体的相似程度表现,比如EditDistance(bike,book)=0.3。
[0010]n

gram:把单词划分成n个子串,经过运算同样子串的数目,得到相似性结果。
[0011](2)语言学的匹配技术
[0012]通过自然语言的操作方法和相关技术,得到相关实体内部的名称、解释等信息,随后开展相应的实体匹配环节。另外,在术语等外部资源中也可以找到本体元素的相似性水平。
[0013]Tokenization:把一个较长的单词进行拆分,得到多个单词短语等。如把
[0014]"friendly

kind

people"划分为"friendly"、"kind"、"people"。
[0015]Lemmatization:词形还原,例如"dogs"还原为"dog","walking"还原为"walk"。
[0016]Sense

based:在WordNet部分,
[0017]假如A为B的下位词,比如
[0018]假若A是B的上位词,比如
[0019]A=B:假若A与跟B为同义词,比如AmountQuantity=Amount。
[0020]A

B:假若处在一样的层次中,那么二者构成反义词。
[0021](3)结构特征本体匹配方法
[0022]这种方法是一种以相似度传播算法为基础的算法:通过计算本体之间在结构上的相似程度,进而寻找潜在的匹配对,换句话说就是相似实体匹配到的邻居实体也是具有相
似性的,相似度值将传递到周围的邻居节点。该类匹配方法主要包括图匹配方法、实体层次结构树匹配方法等。其中前者主要是针对匹配本体拓扑框架比较类似的情形,图中边表示实体间的关系。主要原理是寻找合适的匹配作为锚点,然后在这个找到的锚点周围分析合适的邻居实体的相似性,最后由此找到更多的匹配对完成匹配工作。而后者的关注重点则和前者存在区别,结构树匹配方法只着眼于本体中实体的继承关系,即subClassOf关系。
[0023]结合语言学特征开展相关的匹配操作,重点在于找到语义的相似性,而结构特征的匹配主要将关注的重点放在框架结构方面,寻找相似性表现,这样才能达到最佳的匹配效果。在具体的操作中,为了实现更良好的映射,研究人员一般借助这两种特征相结合的方法进行具体的匹配操作,目前主流的匹配方法是先进行多匹配算法静态组合,然后在组合结果中人工调节参数。这一方法的优点是匹配方法的综合应用可以发挥各种算法的优势,减少单一算法的存在的弊端,但是在特定的匹配过程中如果采用这种方法,则无法达到很好的匹配效果。

技术实现思路

[0024]本专利技术所要解决的技术问题是:提供一种场站设备的多策略本体语义匹配改进方法及终端,能较好的建立SCL本体和CIM本体的匹配映射。
[0025]为了解决上述技术问题,本专利技术采用的技术方案为:
[0026]一种场站设备的多策略本体语义匹配改进方法,包括步骤:
[0027]步骤S1、根据多个相似度度量算法建立多元线性回归模型,根据多元线性回归模型,计算出初始的相似度矩阵M
Init
,将满足M
Init
(i,j)>thre1的元素进行配对并记录为锚点,式中,thre1是设定的第一阈值;
[0028]步骤S2、根据相似度矩阵,对相似度繁殖图内任意等待运算的匹配对(m,n),进行迭代运算,得到最终相似度矩阵M
struct
,将M
struct
(i,j)>thre2的元素进行配对以完成匹配,式中,thre2是设定的第二阈值。
[0029]为了解决上述技术问题,本专利技术采用的另一种技术方案为:
[0030]一种场站设备的多策略本体语义匹配改进终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0031]步骤S1、根据多个相似度度量算法建立多元线性回归模型,根据多元线性回归模型,计算出初始的相似度矩阵M
Init
,将满足M
Init
(i,j)>thre1的元素进行配对并记录为锚点,式中,thre1是设定的第一阈值;
[0032]步骤S2、根据相似度矩阵,对相似度繁殖图内任意等待运算的匹配对(m,n),进行迭代运算,得到最终相似度矩阵M
struct
,将M
struct
(i,j)>thre2的元素进行配对以完成匹配,式中,thre2是设定的第二阈值。
[0033]本专利技术的有益效果在于:提供一种场站设备的多策略本体语义匹配改进方法,通过采用多个相似度算法建立多元线性回归模型,并通过多元线性回归模型计算得到初始的相似度矩阵,再对相似度矩阵迭代以得到最终的相似度矩阵,将相似度矩阵中满足调节的匹配对进行匹配,较好的建立了SCL本体和CIM本体的匹配映射,极大的提高了SCL本体和CIM本体的匹配效果。
附图说明
[0034]图1为本专利技术实施例的一种场站设备的多策略本体语义匹配改进方法的流程示意图;
[0035]图2为本专利技术实施例涉及的语义匹配部分的流程示意图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种场站设备的多策略本体语义匹配改进方法,其特征在于,包括步骤:步骤S1、根据多个相似度度量算法建立多元线性回归模型,根据多元线性回归模型,计算出初始的相似度矩阵M
Init
,将满足M
Init
(i,j)>thre1的元素进行配对并记录为锚点,式中,thre1是设定的第一阈值;步骤S2、根据相似度矩阵,对相似度繁殖图内任意等待运算的匹配对(m,n),进行迭代运算,得到最终相似度矩阵M
struct
,将M
struct
(i,j)>thre2的元素进行配对以完成匹配,式中,thre2是设定的第二阈值。2.根据权利要求1所述的一种场站设备的多策略本体语义匹配改进方法,其特征在于,所述步骤S1包括:步骤S11、根据多个相似度度量算法建立矩阵similarity;步骤S12、根据步骤S11中的矩阵similarity建立多元回归模型,并求得多元回归模型的各个回归系数;步骤S13、利用步骤S12中求得的多元线性回归模型计算出各个不同的影响因素的相似度矩阵,并根据不同影响因素的重要程度对影响因素的相似度矩阵进行赋权,并相加各个影响因素的相似度矩阵以得到初始的相似度矩阵M
Init
;步骤S14、将满足M
Init
(i,j)>thre1的元素展开配对,并记录为锚点。3.根据权利要求2所述的一种场站设备的多策略本体语义匹配改进方法,其特征在于,多个所述相似度度量算法包括SMOA,Sub

string,Levenshtein,Ngram四种字符串相似度度量算法。4.根据权利要求2所述的一种场站设备的多策略本体语义匹配改进方法,其特征在于,所述影响因素包括名称、标签和注释,所述初始的相似度矩阵M
Init
具体为:M
Init
=γ*M
n
+θ*M
l
+ω*M
c
;式中,M
n
、M
l
和M
c
分别是根据步骤S12中求得的多元线性回归模型计算出的名称、标签和注释的相似度矩阵,γ、θ、ω是权值内容,其中γ=0.3,θ=0.1,ω=0.6。5.根据权利要求1所述的一种场站设备的多策略本体语义匹配改进方法,其特征在于,所述步骤S2包括:步骤S21、对相似度繁殖图内任意等待运算的匹配对(m,n),以下式进行迭代运算:上述式中S
k+1
(m,n)代表匹配对(m,n)第k+1次迭代后对应的数据,M代表跟匹配对(m,n)具备关联特征的锚点集合,S
ik
代表锚点i在第k次迭代对应的相似度数据,取k=0时,按照开始情形下矩阵M
Init
中的相似值,Wi代表相似度因子;所述相似度因子,以下式求得:式中N代表匹配对(m,n)跟锚点之间距离的最远值,而M代表跟匹配对(m,n)具备关联特征的锚点集合;Arci表示锚点集合M内的实体各自跟m和n的边数的和,M
Init
代表的是相似度
矩阵,每次迭代后根据迭代的结果进行修改;步骤S22、将相关度S
k+1
(m,n)>thre2的匹配对作为锚点,并根据迭代结果对相关度因子进行修改;迭代执行步骤S21和S22,直到没有新的锚点或满足相关的收敛性特征,得到最终相似度矩阵M
struct
,将M
struct
(i,j)>thre2的元素进行配对以完成匹配。6.一种场站设备的多策略本体语义匹配改进终端,包括存储器、...

【专利技术属性】
技术研发人员:郝悍勇刘文亮王楚罗富财林峰黄金魁张诗鹏吴飞王忠锋董衍旭陈跃飞李怡然陈闽江陈烨林宇洲黄沁铖
申请(专利权)人:国网福建省电力有限公司检修分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1