一种远监督关系抽取方法、装置、设备及存储介质制造方法及图纸

技术编号：25440262 阅读：18 留言：0更新日期：2020-08-28 22:28

本发明专利技术公开了一种远监督关系抽取方法、装置、设备及存储介质，该方法包括：获取句子信息，将句子信息转换为文本向量；将文本向量作为输入参数，输入至深层神经网络中，输出隐层状态向量；从隐层状态向量中提取句子低维向量；将句子低维向量输入至分类器，输出得到关系抽取结果。该方法实现提升抽取结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种远监督关系抽取方法、装置、设备及存储介质
本专利技术涉及计算机
，特别是涉及一种远监督关系抽取方法、装置、设备及存储介质。
技术介绍
目前，在智能机器人交互中，机器人通过计算机系统与操作员或程序员进行人机对话，实现对机器人的控制与操作。随着人工智能技术的高速发展，各种各样的智能对话机器人在日常生活的不同领域中大放异彩。自然语言理解作为对话系统的唯一输入接口，对于整个系统的重要性不言而喻。其接受纯文本形式的自然语言，也可通过语音技术将语音转为文字，首先必须经过实体识别和关系抽取将无结构化的数据转化为结构化数据，才能进行后续的意图识别、对话管理和答案生成等步骤。一个性能良好的实体关系抽取模型，对于对话系统中的自然语言理解和知识库的构建起到了至关重要的作用。利用远程监督方法进行关系抽取，是目前在学术研究领域中运用最广泛、最成熟和最有效的关系抽取方法之一。其主要思想是，通过自动标注数据的方式来扩充训练数据集，以此提升模型的整体性能。目前的远程监督关系抽取方法大多基于浅层神经网络，然而由于浅层神经网络层数较少，所以基于浅层神经网络的远程监督关系抽取方法对应的抽取结果的准确性较低。因此，如何提升抽取结果的准确性是亟待解决的技术问题。
技术实现思路
本专利技术的目的是提供一种远监督关系抽取方法、装置、设备及存储介质，以实现提升抽取结果的准确性。为解决上述技术问题，本专利技术提供一种远监督关系抽取方法，包括：获取句子信息，将句子信息转换为文本向量；将文本向量作为输...

【技术保护点】
1.一种远监督关系抽取方法，其特征在于，包括：/n获取句子信息，将句子信息转换为文本向量；/n将文本向量作为输入参数，输入至深层神经网络中，输出隐层状态向量；/n从隐层状态向量中提取句子低维向量；/n将句子低维向量输入至分类器，输出得到关系抽取结果。/n

【技术特征摘要】
1.一种远监督关系抽取方法，其特征在于，包括：
获取句子信息，将句子信息转换为文本向量；
将文本向量作为输入参数，输入至深层神经网络中，输出隐层状态向量；
从隐层状态向量中提取句子低维向量；
将句子低维向量输入至分类器，输出得到关系抽取结果。

2.如权利要求1所述的方法，其特征在于，所述将句子信息转换为句子文本向量，包括：
对于句子信息，获取每个单词的词嵌入和位置嵌入；
将每个单词的词嵌入和位置嵌入进行拼接，得到句子文本向量。

3.如权利要求1所述的方法，其特征在于，所述深层神经网络为残差神经网络。

4.如权利要求3所述的方法，其特征在于，所述将文本向量作为输入参数，输入至深层神经网络中，输出隐层状态向量之前，还包括：
对残差神经网络的残差块构建补偿机制，调整残差神经网络的信息流。

5.如权利要求4所述的方法，其特征在于，所述补偿机制的公式如下：
c＝(c+C)(1-g(C))+c0g(C)；
g(C)＝tan(C)+b；
b＝b0+▽b×i；
其中，c代表残差操作中的自身映射，C代表残差操作中的短路连接，g(C)为门控机制，c0为残差神经网络的原始输入，tan为正切...

【专利技术属性】
技术研发人员：李净，
申请(专利权)人：北京慧闻科技集团有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人