关系抽取方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:37105764 阅读:30 留言:0更新日期:2023-04-01 05:04
本发明专利技术公开了一种关系抽取方法、装置、设备及计算机可读存储介质。该关系抽取方法包括:获取待抽取文本;将所述待抽取文本输入至预训练模型,得到第一文本向量;将所述第一文本向量传入第一卷积神经网络的全连接层,使用半指针

【技术实现步骤摘要】
关系抽取方法、装置、设备及计算机可读存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种关系抽取方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]信息抽取(information extraction),是从自然语言文本中抽取实体、属性、关系及事件等事实类信息的文本处理技术,是信息检索、智能问答、智能对话等人工智能应用的重要基础。信息抽取主要包括:实体抽取与链指、关系抽取和事件抽取。
[0003]关系抽取通常采用有监督学习的模式来实现,具体包括Pipline Model(串联模型)和Joint Model(联合模型)这两类。其中,Pipline Model是将实体抽取和关系抽取看作串联的任务、分步进行,没有考虑到两个子任务之间的相关性,从而导致关系抽取任务的结果严重依赖于实体抽取的结果,进而导致误差累积的问题;而Joint Model则是实体抽取与关系抽取同时进行,虽然表面上避免了误差累积,但其难以解决实体重叠、“一对多”等问题,即,其抽取结果的准确性较差。

技术实现思路

>[0004]本专利本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种关系抽取方法,其特征在于,所述关系抽取方法包括:获取待抽取文本;将所述待抽取文本输入至预训练模型,得到第一文本向量;将所述第一文本向量传入第一卷积神经网络的全连接层,使用半指针

半标注结构预测得到主实体的首尾位置;将所述第一文本向量传入自注意力网络层,得到第二文本向量;将所述第二文本向量传入第二卷积神经网络的全连接层,使用多个半指针

半标注结构预测得到客实体的首尾位置和关系类型。2.如权利要求1所述的关系抽取方法,其特征在于,所述将所述待抽取文本输入至预训练模型,得到第一文本向量的步骤包括:将所述待抽取文本按字进行拆分,得到分字集合;将所述分字集合中的每一个字输入至预训练模型进行运算,得到与所述分字集合中每一个字对应的字向量,其中,第一文本向量是由每一个字对应的字向量组合得到的。3.如权利要求1所述的关系抽取方法,其特征在于,所述预训练模型为BERT模型,或BiLSTM

Attention神经网络模型。4.如权利要求1所述的关系抽取方法,其特征在于,所述预训练模型为预先训练好的BERT模型,或预先训练好的BiLSTM

Attention神经网络模型。5.如权利要求4所述的关系抽取方法,其特征在于,所述将所述待抽取文本输入至预训练模型,得到第一文本向量的步骤之前,所述关系抽取方法还包括:获取原始文本集;对所述原始文本集中的各原始文本进行标注,得到训练文本集;通过所述训练文本集对预设模型进行训练,得到所述预训练模型。6.如权利要求1至5中任一项所述的关系抽取方法,其特征在于,所述将所述第二文本向量传入第二卷积神经网络的全连接层,使用多个半指针

半标注结构预测得到客实体的首尾位置和关系类型的步骤包括...

【专利技术属性】
技术研发人员:刘光辉赵国庆权佳成
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1