基于表现语义分析的概念相关度计算方法技术

技术编号:7898233 阅读:171 留言:0更新日期:2012-10-23 04:23
本发明专利技术公开了一种基于表现语义分析的概念相关度计算方法,包括如下步骤:(1)基于解释关系构造概念语义特征向量;(2)实现语义特征赋权和特征降维;(3)通过向量距离量化表征不同概念之间的相关度。通过实验比较,本发明专利技术所提供的基于表现语义分析的概念相关度计算方法明显优于现有的正向构造法和逆向构造法,而且该方法相比较基于明确语义分析的概念相关度计算更适用于概念关系的发现。

【技术实现步骤摘要】

本专利技术涉及一种概念相关度计算方法,尤其涉及一种,属于语义网络

技术介绍
在自然语言世界中,概念是对客观实体的抽象描述。不同概念间相互关联衍生出缤纷复杂的语义关系,构成自然语言世界的基础。为适应语义推理和智能化服务的需求,语义Web为代表的下一代信息互联网络,试图在任何微小数据间构建连接,而概念关系正是构建语义网络的基础。此外,概念关系抽取在信息检索、自动问答、机器翻译等领域也都有着广泛应用。在实践中,不同概念之间的关系可以简单归纳为四种类属关系,属值关系,上下文共现和解释关系。其中解释关系是指如果词条b在词条a正文中具有说明意义的出现,则称词条b解释词条a,词条a被词条b解释,a为解释关系的主体,b为解释关系的客体。在本专利技术中,使用标记explain(b, a)代表b解释a的解释关系。上述“解释关系”是包含语义的。不同的概念被不同的概念集合解释,但是这些概念集合又是有交集的,这就为通过解释关系窥探概念的相关度构造了可行的渠道,即比较解释关系的集合在代数意义上的相似。解释关系和被解释关系都是一种语义元素重合的表现。语义元素的重合是没有方向性的,因此一般认为解释关系的本文档来自技高网...

【技术保护点】
一种基于表现语义分析的概念相关度计算方法,其特征在于包括如下步骤:(1)基于解释关系构造概念语义特征向量:基于解释关系的语义特征方向无关性,将概念的解释集和被解释集同等视作表现语义,进而构造语义特征向量;(2)实现语义特征赋权和特征降维:首先使用优化后的逆文档频率代替逆文档频率进行语义特征赋权,优化后的逆文档频率使用odf表示,计算公式如下:odfb,a=log(nb,aTFb*|D|)其中,nb,a表示概念b在概念a百科文章中的出现频率,TFb为概念b的解释集词频和,D为百科语料库中的概念总数;接着使用带监督器的滑动窗口进行特征降维;(3)通过向量距离量化表征不同概念之间的相关度。

【技术特征摘要】

【专利技术属性】
技术研发人员:张辉马永星胡红萍左源
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1