一种改进的基于信息论的概念语义相似度计算方法技术

技术编号:15258385 阅读:103 留言:0更新日期:2017-05-03 09:09
一种改进的基于信息论的概念语义相似度计算方法,初始化本体概念领域模块,并求解本体概念共同父节点在树状层次结构中的信息量值,之后分别求解两本体概念在树状层次结构中的信息量值,根据所求得的信息量值便可以得到语义相似度。本发明专利技术相比较传统的基于信息论方法求解语义相似度准确度更高;在量化概念上更接近专家的经验值;更好的提高了本体推理的效果;具有更广泛的应用研究价值。

An improved semantic similarity calculation method based on information theory

An improved method of concept semantic similarity computation based on information theory, the concept of ontology module initialization field, and the amount of information to solve the ontology concept common parent node in a tree hierarchy of values, then the amount of information are solved two ontology concepts in a tree hierarchy of values, according to the amount of information can be obtained by value semantics similarity. The present invention compared with the traditional information theory method based on semantic similarity is more accurate; in the quantitative concept closer to the experience of experts; improve the ontology reasoning effect; with more extensive application and research value.

【技术实现步骤摘要】

本专利技术涉及语义网络
,具体涉及一种改进的基于信息论的概念语义相似度计算方法
技术介绍
现今,语义相似度计算被广泛应用于信息检索、语义web、自然语言处理等领域。由于本体能够将领域中的各种概念和关系进行显示地、形式化地表达,因此本体在概念语义相似度计算中发挥重要的作用。传统的基于本体的概念语义相似度计算方法主要分为2种:一种是基于信息论的方法,该方法利用信息论来计算2个概念共享信息的程度,具有较高的理论严谨性,但是只能粗略地量化概念之间的语义相似度,不能实现概念语义相似度的细致区分;另一种方法是基于语义距离的方法。为了提高基于信息论方法求解概念语义相似度准确度,本专利技术提供了一种改进的基于信息论的概念语义相似度计算方法。
技术实现思路
针对于如何提高基于信息论方法求解概念语义相似度的准确度问题,本专利技术提供了一种改进的基于信息论的概念语义相似度计算方法。为了解决上述问题,本专利技术是通过以下技术方案实现的:步骤1:初始化本体概念领域模块。步骤2:求解其共同父节点在在树状层次结构中的信息量值I(pr)。步骤3:分别求解两本体概念(g1,g2)在树状层次结构中的信息量值I(g1)、I(g2)。步骤4:基于信息量,可以得出两本体概念间的语义相似度sim(g1,g2)。本专利技术的有益效果是:1、相比较传统的基于信息论方法求解语义相似度,此方法准确度更高。2、此计算语义相似度的方法在量化概念上更接近专家的经验值。3、更好的提高了本体推理的效果。4、具有更广泛的应用研究价值。附图说明图1为一种改进的基于信息论的概念语义相似度计算方法结构流程图。图2为本体概念领域模块语义树形图。具体实施方式为了提高基于信息论方法求解概念语义相似度的准确度问题,结合图1对本专利技术进行了详细说明,其具体实施步骤如下:步骤1:初始化本体概念领域模块。步骤2:分别求解其共同父节点在在树状层次结构中的信息量值I(pr),其具体计算过程如下:基于信息内容的计算相似度方法主要是通过衡量概念所包含的信息量来计算相似度。概念是对其祖先节点的继承,是祖先节点的又一次细化,所以可通过祖先节点包含的信息量来衡量两个概念的共享信息。求解其共同父节点在树状层次结构中的信息量值I(pr)根据图2,得出两本体概念(g1,g2)共同父节点在树状层次结构中每层出现的概率值p(pr)p(pr)=(p1(pr),p2(pr),…,pk(pr))上式k为两本体概念(g1,g2)共同父节点在树状层次结构中的层数。E[p(pr)]为两本体概念(g1,g2)共同父节点在树状层次结构中的概率均值。步骤3:分别求解两本体概念(g1,g2)在树状层次结构中的信息量值I(g1)、I(g2),其具体求解过程如下:求解两本体概念的在树状层次结构中的信息量值I(g1)、I(g2)同理,根据图2,得出两本体概念(g1,g2)在树状层次结构中每层的概率值p(g1)、p(g2)p(g1)=(p1(g1),p2(g1),…,pi(g1))p(g2)=(p1(g2),p2(g2),…,pj(g2))上式i为本体概念g1在树状层次结构中的层数,同理,j为本体概念g2在树状层次结构中的层数。上式E[p(g1)]、E[p(g2)]分别为两本体概念(g1,g2)在树状层次结构中的概率均值。由此可得两本体概念的在树状层次结构中的信息量值I(g1)、I(g2)步骤4:基于信息量,可以得出两本体概念间的语义相似度sim(g1,g2),其具体计算过程如下:两本体概念(g1,g2)的共同父节点包含的信息量仅仅只能表示两概念包含的相同信息。根据经验可得两本体概念(g1,g2)间的语义相似度sim(g1,g2)。本文档来自技高网...
一种改进的基于信息论的概念语义相似度计算方法

【技术保护点】
一种改进的基于信息论的概念语义相似度计算方法,本专利技术涉及语义网络技术领域,具体涉及一种改进的基于信息论的概念语义相似度计算方法,其特征是,包括如下步骤:步骤1:初始化本体概念领域模块步骤2:求解其共同父节点在在树状层次结构中的信息量值步骤3:分别求解两本体概念在树状层次结构中的信息量值步骤4:基于信息量,可以得出两本体概念间的语义相似度。

【技术特征摘要】
2016.08.11 CN 20161065897481.一种改进的基于信息论的概念语义相似度计算方法,本发明涉及语义网络技术领域,具体涉及一种改进的基于信息论的概念语义相似度计算方法,其特征是,包括如下步骤:步骤1:初始化本体概念领域模块步骤2:求解其共同父节点在在树状层次结构中的信息量值步骤3:分别求解两本体概念在树状层次结构中的信息量值步骤4:基于信息量,可以得出两本体概念间的语义相似度。2.根据权利要求1中所述的一种改进的基于信息论的概念语义相似度计算方法,其特征是,以上所述步骤2中的具体计算过程如下:步骤2:分别求解其共同父节点在在树状层次结构中的信息量值,其具体计算过程如下:基于信息内容的计算相似度方法主要是通过衡量概念所包含的信息量来计算相似度,概念是对其祖先节点的继承,是祖先节点的又一次细化,所以可通过祖先节点包含的信息量来衡量两个概念的共享信息求解其共同父节点在树状层次结构中的信息量值两本体概念共...

【专利技术属性】
技术研发人员:金平艳
申请(专利权)人:四川用联信息技术有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1