当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于实体语义融合的关系抽取方法技术

技术编号:33332783 阅读:21 留言:0更新日期:2022-05-08 09:14
本发明专利技术公开了一种基于实体语义融合的关系抽取方法,包括:获取待抽取关系的目标语句;构建目标语句的预置向量;构建目标语句的句法依存树,并建立句法依存树的邻接矩阵;其中,句法依存树以实体节点作为全局节点,并增设全局节点到其他节点的连接以及所有节点到自身的连接;将预置向量及邻接矩阵输入GCN神经网络进行语义提取,得到第一特征向量;将第一特征向量输入PCNN分段卷积神经网络进行特征提取,得到第二特征向量;将第二特征向量输入Softmax分类器进行关系类别预测,实现实体关系抽取。解决了现有技术中实体关系抽取效果不佳的问题。佳的问题。佳的问题。

【技术实现步骤摘要】
一种基于实体语义融合的关系抽取方法


[0001]本专利技术涉及信息处理
,尤其涉及一种基于实体语义融合的关系抽取方法。

技术介绍

[0002]近年来,随着人工智能时代的到来,构建知识网络作为智能推荐系统中重要的一环越来越被人们所重视,其中实体关系抽取可以有效地从非结构化文本中抽取出实体之间的关系从而构建实体关系三元组并实现实体之间的关系分类。关系抽取任务可以描述为:对于给定目标文本T,确定其中实体对e1和e2的关系r表达式为<e1,r,e2>。通过探索自然语言文本中的语义关系更好地理解用户需求并挖掘出实体之间更为准确的实体关系,从而构建知识网络提供更为准确地推荐功能。
[0003]传统的关系抽取依赖于机器学习如支持向量机SVM,但其难以解决多分类问题。随着神经网络的发展以及强大的学习能力,学者逐渐采用神经网络取代传统的机器学习用于关系分类任务中,比如CNN、RNN经典模型。随着GCN网络出现,在关系抽取任务重可以通过将目标文本序列转为图结构可从而富其节点的邻域信息。但GCN网络获取临域特征时具有一定的局本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于实体语义融合的关系抽取方法,其特征在于,包括:获取待抽取关系的目标语句;构建目标语句的预置向量,该预置向量包含目标语句中每个单词、单词的词性及实体标签;构建目标语句的句法依存树,并建立句法依存树的邻接矩阵;其中,句法依存树以实体节点作为全局节点,并增设全局节点到其他节点的连接以及所有节点到自身的连接;将预置向量及邻接矩阵输入GCN神经网络进行语义提取,得到第一特征向量;将第一特征向量输入PCNN分段卷积神经网络进行特征提取,得到第二特征向量;将第二特征向量输入Softmax分类器进行关系类别预测,实现实体关系抽取。2.根据权利要求1所述的基于实体语义融合的关系抽取方法,其特征在于,所述构建目标语句的预置向量具体包括:采用词嵌入模型将目标语句中的单词映射到维度为d
w
的向量空间;采用句法分析工具对目标语句构造词性标注及实体标签,并将词性及实体标签分别映射到维度为d
s
的向量空间;将目标语句的每个单词、词性及实体标签进行拼接,得到目标语句的预置向量S={X1,X2,X3,......,X
m
},其中m为目标语句长度,表示第i个单词,表示第i个单词的词性,表示第i个单词的实体标签。3.根据权利要求1所述的基于实体语义融合的关系抽取方法,其特征在于,所述构建目标语句的句法依存树,并建立句法依存树的邻接矩阵,具体包括:针对目标语句,使用句法分析工具构建以实体节点作为全局节点的语法依存树;构建全局节点到其他节点的的连接,建立第一邻接矩阵;增设每个节点到自身的连接,建立单位矩阵;将第一邻接矩阵与单位矩阵相加,得到最终的邻接矩阵。4.根据权利要求2所述的基于实体语义融合的关系抽取方法,其特征在于,所述GCN神经网络的公式表示如下:其中,表示第l层第i个节点的隐藏层表示;ρ表示ReLU激活函数;表示邻接矩阵,表示i节...

【专利技术属性】
技术研发人员:龙军刘磊李浩然向一平
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1