一种远监督关系抽取方法、装置、设备及存储介质制造方法及图纸

技术编号:25440262 阅读:18 留言:0更新日期:2020-08-28 22:28
本发明专利技术公开了一种远监督关系抽取方法、装置、设备及存储介质,该方法包括:获取句子信息,将句子信息转换为文本向量;将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;从隐层状态向量中提取句子低维向量;将句子低维向量输入至分类器,输出得到关系抽取结果。该方法实现提升抽取结果的准确性。

【技术实现步骤摘要】
一种远监督关系抽取方法、装置、设备及存储介质
本专利技术涉及计算机
,特别是涉及一种远监督关系抽取方法、装置、设备及存储介质。
技术介绍
目前,在智能机器人交互中,机器人通过计算机系统与操作员或程序员进行人机对话,实现对机器人的控制与操作。随着人工智能技术的高速发展,各种各样的智能对话机器人在日常生活的不同领域中大放异彩。自然语言理解作为对话系统的唯一输入接口,对于整个系统的重要性不言而喻。其接受纯文本形式的自然语言,也可通过语音技术将语音转为文字,首先必须经过实体识别和关系抽取将无结构化的数据转化为结构化数据,才能进行后续的意图识别、对话管理和答案生成等步骤。一个性能良好的实体关系抽取模型,对于对话系统中的自然语言理解和知识库的构建起到了至关重要的作用。利用远程监督方法进行关系抽取,是目前在学术研究领域中运用最广泛、最成熟和最有效的关系抽取方法之一。其主要思想是,通过自动标注数据的方式来扩充训练数据集,以此提升模型的整体性能。目前的远程监督关系抽取方法大多基于浅层神经网络,然而由于浅层神经网络层数较少,所以基于浅层神经网络的远程监督关系抽取方法对应的抽取结果的准确性较低。因此,如何提升抽取结果的准确性是亟待解决的技术问题。
技术实现思路
本专利技术的目的是提供一种远监督关系抽取方法、装置、设备及存储介质,以实现提升抽取结果的准确性。为解决上述技术问题,本专利技术提供一种远监督关系抽取方法,包括:获取句子信息,将句子信息转换为文本向量;将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;从隐层状态向量中提取句子低维向量;将句子低维向量输入至分类器,输出得到关系抽取结果。优选的,所述将句子信息转换为句子文本向量,包括:对于句子信息,获取每个单词的词嵌入和位置嵌入;将每个单词的词嵌入和位置嵌入进行拼接,得到句子文本向量。优选的,所述深层神经网络为残差神经网络。优选的,所述将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量之前,还包括:对残差神经网络的残差块构建补偿机制,调整残差神经网络的信息流。优选的,所述补偿机制的公式如下:c=(c+C)(1-g(C))+c0g(C);g(C)=tan(C)+b;其中,c代表残差操作中的自身映射,C代表残差操作中的短路连接,g(C)为门控机制,c0为残差神经网络的原始输入,tan为正切函数,b为偏置,b0为初始化偏置,是偏置的变化率,i代表残差块在残差神经网络中的深度。优选的,所述从隐层状态向量中提取句子低维向量,包括:通过池化操作提取隐层状态向量中的最大值作为特征向量,通过特征向量获取句子低维向量。优选的,所述池化操作为分段最大池化操作。本专利技术还提供一种远监督关系抽取装置,包括:转换模块,用于获取句子信息,将句子信息转换为文本向量;第一输入模块,用于将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;提取模块,用于从隐层状态向量中提取句子低维向量;第二输入模块,用于将句子低维向量输入至分类器,输出得到关系抽取结果。本专利技术还提供一种远监督关系抽取设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上任一项所述的远监督关系抽取方法的步骤。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的远监督关系抽取方法的步骤。本专利技术所提供的一种远监督关系抽取方法、装置、设备及存储介质,获取句子信息,将句子信息转换为文本向量;将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;从隐层状态向量中提取句子低维向量;将句子低维向量输入至分类器,输出得到关系抽取结果。可见,采用深层神经网络来完成远程监督的关系抽取,由于深层神经网络的层数比浅层神经网络多,深层神经网络所对应的抽取结果相对于浅层神经网络更加准确,实现提升抽取结果的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术所提供的一种远监督关系抽取方法的流程图;图2为相对位置示意图;图3为远程监督的关系抽取框架图;图4为基于远程监督的关系抽取模型结构图;图5为本专利技术所提供的一种远监督关系抽取装置结构示意图;图6为本专利技术所提供的一种远监督关系抽取设备结构示意图。具体实施方式本专利技术的核心是提供一种远监督关系抽取方法、装置、设备及存储介质,以实现提升抽取结果的准确性。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术所提供的一种远监督关系抽取方法的流程图,该方法包括以下步骤:S11:获取句子信息,将句子信息转换为文本向量;S12:将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;S13:从隐层状态向量中提取句子低维向量;S14:将句子低维向量输入至分类器,输出得到关系抽取结果。可见,该方法中,采用深层神经网络来完成远程监督的关系抽取,由于深层神经网络的层数比浅层神经网络多,深层神经网络所对应的抽取结果相对于浅层神经网络更加准确,实现提升抽取结果的准确性。基于上述方法,进一步的,步骤S11中,将句子信息转换为句子文本向量的过程包括以下步骤:S21:对于句子信息,获取每个单词的词嵌入和位置嵌入;S22:将每个单词的词嵌入和位置嵌入进行拼接,得到句子文本向量。其中,在关系抽取任务中,所处理的文本的基本单位为句子,其目标是识别出句子中实体之间所存在的关系。关系抽取任务的第一步是将句子文本转化为向量化表示。句子中的每个单词被转化为词嵌入表示和位置嵌入表示。在句子S={x1,x2,…,xm}中,xi为句子中第i个单词,设置e1和e2分别为句子中对应的两个实体。在关系抽取任务中,目的是为了捕获句子中两个实体之间的关系。句子中单词和两个实体之间的距离,蕴含着十分重要的意义。本专利技术采用位置特征结合了当前单词同两个实体之间的相对距离。如图2所示,图2为相对位置示意图,词组京东公司距离词组刘强东和首席执行官的相对距离分别为2和-2。然后通过随机初始化的位置矩阵,将每个单词的两个相对距离分别转换成低维位置嵌入R为本文档来自技高网
...

【技术保护点】
1.一种远监督关系抽取方法,其特征在于,包括:/n获取句子信息,将句子信息转换为文本向量;/n将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;/n从隐层状态向量中提取句子低维向量;/n将句子低维向量输入至分类器,输出得到关系抽取结果。/n

【技术特征摘要】
1.一种远监督关系抽取方法,其特征在于,包括:
获取句子信息,将句子信息转换为文本向量;
将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量;
从隐层状态向量中提取句子低维向量;
将句子低维向量输入至分类器,输出得到关系抽取结果。


2.如权利要求1所述的方法,其特征在于,所述将句子信息转换为句子文本向量,包括:
对于句子信息,获取每个单词的词嵌入和位置嵌入;
将每个单词的词嵌入和位置嵌入进行拼接,得到句子文本向量。


3.如权利要求1所述的方法,其特征在于,所述深层神经网络为残差神经网络。


4.如权利要求3所述的方法,其特征在于,所述将文本向量作为输入参数,输入至深层神经网络中,输出隐层状态向量之前,还包括:
对残差神经网络的残差块构建补偿机制,调整残差神经网络的信息流。


5.如权利要求4所述的方法,其特征在于,所述补偿机制的公式如下:
c=(c+C)(1-g(C))+c0g(C);
g(C)=tan(C)+b;
b=b0+▽b×i;
其中,c代表残差操作中的自身映射,C代表残差操作中的短路连接,g(C)为门控机制,c0为残差神经网络的原始输入,tan为正切...

【专利技术属性】
技术研发人员:李净
申请(专利权)人:北京慧闻科技集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1