一种基于迁移学习的实体关系联合抽取方法技术

技术编号：23984724 阅读：43 留言：0更新日期：2020-04-29 12:58

本发明专利技术公开了一种基于迁移学习的实体关系联合抽取方法，该方法具体为：将中文信息抽取数据集作为数据源，对输入句子预处理，使用Bert预训练模型，将embedding层的向量输入到编码器中，得到编码序列，将字向量传入全连接的Dense层和sigmoid激活函数，得到主实体的编码向量，将主实体的编码向量传到全联接的Dense网络，预测客实体和关系类型，与主实体结合，最终得到三元组。该方法通过将迁移学习应用在中文文本的实体‑关系联合抽取问题中，能够直接对三元组进行建模，从非结构化文本中提取出三元组信息，显著地提高了关系抽取的效率和准确率。

A joint entity relationship extraction method based on Transfer Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的实体关系联合抽取方法
本专利技术涉及自然语言处理
，具体来说，涉及一种基于迁移学习的实体关系联合抽取方法。
技术介绍
实体及其关系的抽取方法主要分为串联抽取方法及联合抽取方法。其中，联合抽取方法能够整合实体及其关系之间的信息。随着深度学习在NLP任务上的成功，神经网络也广泛应用到实体、关系事实的提取。2016年“基于LSTM的序列和树结构端到端关系提取”(计算语言学协会第54届年会论文集)为减少人工抽取特征工作，提出基于神经网络的端到端模型，但因在模型实现过程分开抽取实体及其关系而导致信息冗余。“基于全局优化的端到端神经关系提取”（2017年自然语言处理经验方法会议论文集,1730-1740页)采用端到端的模型将关系抽取问题转化为了表格填充问题。但目前大多数关系抽取的标注数据不稳定，有标注的数据通用性比较低，使用场景也经常更新。迁移学习能够让模型在大量通用数据上进行预训练，再将预训练的模型迁移到具体的下游任务中，从而加快并优化模型的学习效率。如google提出的Bert，先利用大规模无监督数据预训练神经网络模型，再用目标数据对模型进行微调，以适应当前任务，在中文数据方面，基于迁移学习对实体-关系联合抽取的研究还很匮乏。
技术实现思路
针对相关技术中的上述技术问题，本专利技术提出一种基于迁移学习的实体关系联合抽取方法，能够克服现有技术的上述不足。为实现上述技术目的，本专利技术的技术方案是这样实现的：一种基于迁移学习的实体关系联合抽取方法，该实体关系联合...

【技术保护点】
1.一种基于迁移学习的实体关系联合抽取方法，其特征在于，包括以下步骤：/n将百度公开的基于schema的中文信息抽取数据集作为数据源；/n对输入句子先进行预处理；/n使用Bert预训练模型，将token embedding、segment embedding和positionembedding三种向量合并组成embedding层作为Bert的输入；/n将embedding层的向量输入到编码器中，得到编码序列；/n将字向量传入全连接的Dense层和sigmoid激活函数，得到主实体的编码向量；/n对于得到的主实体集合，随机采样一个主实体，获得其编码向量；/n将主实体的编码向量再传到全联接的Dense网络，对于每一种关系类型都构建两个客实体的首尾向量，预测出客实体和关系类型，与主实体结合，最终得到三元组；/n使用Precision，Recall以及F1值来作为模型预测结果的评价标准。/n

【技术特征摘要】
1.一种基于迁移学习的实体关系联合抽取方法，其特征在于，包括以下步骤：
将百度公开的基于schema的中文信息抽取数据集作为数据源；
对输入句子先进行预处理；
使用Bert预训练模型，将tokenembedding、segmentembedding和positionembedding三种向量合并组成embedding层作为Bert的输入；
将embedding层的向量输入到编码器中，得到编码序列；
将字向量传入全连接的Dense层和sigmoid激活函数，得到主实体的编码向量；
对于得到的主实体集合，随机采样一个主实体，获得其编码向量；
将主实体的编码向量再传到全联接的Dense网络，对于每一种关系类型都构建两个客实体的首尾向量，预测出客实体和关系类型，与主实体结合，最终得到三元组；
使用Precision，Recal...

【专利技术属性】
技术研发人员：徐汕，胡博钦，梁炬，张晶亮，郝志强，
申请(专利权)人：北京航天云路有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人