一种新的本体概念词汇语义相似度求解方法技术

技术编号：15271060 阅读：54 留言：0更新日期：2017-05-04 09:08

一种新的本体概念词汇语义相似度求解方法，计算出输入到统计方法模块中的待比较词的深度最大的本体概念的相似度，计算出待比较词之间的词形相似度，计算两待比较词最近共同祖先深度对两待比较词相似度的影响，构造影响因子函数，最终，计算两待比较词的相似度。本发明专利技术在量化概念上更接近专家的经验值；更充分、更综合考虑了待比较词对应深度最大的本体概念间的距离、深度与密度等因素，大大的提高了语义相似度结果的准确性；更好的提高了本体推理的效果；考虑了词语本身具有的词形相似度、语义相似度结果的准确度得到了更好的提高；各种影响因子的数据处理更规范；更符合实际应用效果。

A new method for solving semantic similarity of ontology concepts

A new concept of ontology semantic similarity calculation method, calculates the similarity of input to statistical methods in the module to compare words the maximum depth of the concept of ontology, calculate the morphological similarity between words to be compared, calculated to compare two words the last common ancestor depth on the effect of two words to compare the similarity of structure influence factor finally, the calculation of similarity function, comparative word to two. The present invention in the quantitative concept is more close to the expert experience; more fully and more comprehensive consideration of factors such as distance, depth and density to compare words corresponding to the maximal depth between ontology concepts, and greatly improve the accuracy of semantic similarity results; improve the ontology reasoning effect; considering the morphological similarity, the word semantic similarity has the accuracy has been better improved; various factors of the data processing more standardized and more practical effect.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语义网络
，具体涉及一种新的本体概念词汇语义相似度求解方法。
技术介绍
目前，很多学者在关注本体概念相似度的计算方法，相似度问题在哲学、语义学等多个学科中被深入的研究和分析。传统的基于本体的概念语义相似度计算方法主要分为2种：一种是基于信息论的方法，该方法利用信息论来计算2个概念共享信息程度，具有较高的理论严谨性，但是只能粗略地量化概念间的语义相似度，不能实现概念语义相似度的细致细分；另一种方法是基于距离的方法，该方法以概念之间路径的长短作为衡量语义距离的长短，通过计算两概念间的语义距离来实现概念语义相似度的计算，该方法简单、直观，但忽略了影响语义距离的其他很多因素。针对上述方法的缺陷，概念语义相似度不仅与语义距离有关系，而且还受概念在本体树中层次深度、以及待比较词间词形相似度等综合因子的影响，为了满足上述需求，本专利技术提出了一种新的本体概念词汇语义相似度求解方法。
技术实现思路
针对如何更精准获得每一个术语的相似术语问题以及考虑词形、本体概念、本体概念共同祖先深度等影响因子，本专利技术提供了一种新的本体概念词汇语义相似度求解方法。为了解决上述问题，本专利技术是通过以下技术方案实现的：步骤1：初始化统计方法模块。步骤2：将待比较词(c1，c2)输入初始化统计方法模块中。步骤3：将待比较词(c1，c2)映射到本体概念模块中。步骤4：分别选取待比较词(c1，c2)对应深度最大的本体概念g1、g2。步骤5：计算待比较词(c1，c2)对应深度最大的两本体概念间的相似度gaisim(g1，g2)。步骤6：待比较词(c1，c2)之间的词形相似度xi...
一种新的本体概念词汇语义相似度求解方法

【技术保护点】
一种新的本体概念词汇语义相似度求解方法，本专利技术涉及语义网络技术领域，具体涉及一种新的本体概念词汇语义相似度求解方法，其特征是，包括如下步骤：步骤1：初始化统计方法模块步骤2：将待比较词输入初始化统计方法模块中步骤3：将待比较词映射到本体概念模块中步骤4：分别选取待比较词对应深度最大的本体概念步骤5：计算待比较词对应深度最大的两本体概念间的相似度步骤6：待比较词之间的词形相似度步骤7：经过上述步骤，计算两待比较词最近共同祖先的深度对两待比较词相似度的影响，构造影响因子函数步骤8：综合上述步骤，计算两待比较词的相似度。

【技术特征摘要】
2016.08.04 CN 20161063327581.一种新的本体概念词汇语义相似度求解方法，本发明涉及语义网络技术领域，具体涉及一种新的本体概念词汇语义相似度求解方法，其特征是，包括如下步骤：步骤1：初始化统计方法模块步骤2：将待比较词输入初始化统计方法模块中步骤3：将待比较词映射到本体概念模块中步骤4：分别选取待比较词对应深度最大的本体概念步骤5：计算待比较词对应深度最大的两本体概念间的相似度步骤6：待比较词之间的词形相似度步骤7：经过上述步骤，计算两待比较词最近共同祖先的深度对两待比较词相似度的影响，构造影响因子函数步骤8：综合上述步骤，计算两待比较词的相似度。2.根据权利要求1中所述的一种新的本体概念词汇语义相似度求解方法，其特征是，以上所述步骤5中的具体计算过程如下：步骤5：计算待比较词对应深度最大的两本体概念间的相似度需先求两本体概念间义原项的相似度再计算两本体概念间相对深度具体计算过程如下：5.1）两本体概念间义原项的相似度设对应深度最大的本体概念中含有n个义原，即对应深度最大的本体概念中含有m个义原，即分别两两计算与中义原的相似度，即可以得与中义原项相似度矩阵如下：...

【专利技术属性】
技术研发人员：金平艳，
申请(专利权)人：四川用联信息技术有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人