【技术实现步骤摘要】
本专利技术涉及一种概念相关度计算方法,尤其涉及一种,属于语义网络
技术介绍
在自然语言世界中,概念是对客观实体的抽象描述。不同概念间相互关联衍生出缤纷复杂的语义关系,构成自然语言世界的基础。为适应语义推理和智能化服务的需求,语义Web为代表的下一代信息互联网络,试图在任何微小数据间构建连接,而概念关系正是构建语义网络的基础。此外,概念关系抽取在信息检索、自动问答、机器翻译等领域也都有着广泛应用。在实践中,不同概念之间的关系可以简单归纳为四种类属关系,属值关系,上下文共现和解释关系。其中解释关系是指如果词条b在词条a正文中具有说明意义的出现,则称词条b解释词条a,词条a被词条b解释,a为解释关系的主体,b为解释关系的客体。在本专利技术中,使用标记explain(b, a)代表b解释a的解释关系。上述“解释关系”是包含语义的。不同的概念被不同的概念集合解释,但是这些概念集合又是有交集的,这就为通过解释关系窥探概念的相关度构造了可行的渠道,即比较解释关系的集合在代数意义上的相似。解释关系和被解释关系都是一种语义元素重合的表现。语义元素的重合是没有方向性的,因 ...
【技术保护点】
一种基于表现语义分析的概念相关度计算方法,其特征在于包括如下步骤:(1)基于解释关系构造概念语义特征向量:基于解释关系的语义特征方向无关性,将概念的解释集和被解释集同等视作表现语义,进而构造语义特征向量;(2)实现语义特征赋权和特征降维:首先使用优化后的逆文档频率代替逆文档频率进行语义特征赋权,优化后的逆文档频率使用odf表示,计算公式如下:odfb,a=log(nb,aTFb*|D|)其中,nb,a表示概念b在概念a百科文章中的出现频率,TFb为概念b的解释集词频和,D为百科语料库中的概念总数;接着使用带监督器的滑动窗口进行特征降维;(3)通过向量距离量化表征不同概念之间的相关度。
【技术特征摘要】
【专利技术属性】
技术研发人员:张辉,马永星,胡红萍,左源,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。