【技术实现步骤摘要】
一种单表建模实体关系抽取方法
[0001]本专利技术涉及语言处理
,尤其涉及一种单表建模实体关系抽取方法。
技术介绍
[0002]实体和关系的联合抽取是自然语言处理和知识图谱构建领域中的重要任务。常见的技术主要分为两种:其一是管道(Pipeline)式方法,将实体抽取与关系分类作为两个独立的模块,这种方法忽略了实体与关系的相关性,且实体抽取错误会影响关系抽取模块,容易产生级联错误;其二是联合(Joint)方法,通过共享参数或联合解码将实体抽取与关系分类模型有机结合,完成多任务的关系抽取。常用模型有TPLinker,和OneRel等联合抽取模型,然而,这些工作忽视了实体间交互、实体关系间交互作用,并增加了时间和空间的开销。
[0003]在专利技术专利【关系抽取联合模型训练方法、关系抽取方法、设备及介质】(申请号:202210503511.X)中,公开了一种关系抽取联合模型训练方法、关系抽取方法、设备及介质,此专利技术将联合文本二分类模型与关系抽取模型以得到联合模型,关系抽取分为离散的步骤。这样的方式忽略了实体与关 ...
【技术保护点】
【技术特征摘要】
1.一种单表建模实体关系抽取方法,其特征在于,包括如下步骤:步骤1:对训练集进行预处理,处理后的训练集作为抽取模型输入参数;步骤2:抽取模型构建当前句子的一张二维交互表,其中,二维交互表包括:主实体
‑
客实体交互表、主实体
‑
关系交互表和客实体
‑
关系交互表;步骤3:将当前句子与三元组中全部的关系拼接成一个序列;步骤4:将序列作为抽取模型中基于自注意力模型的预训练语言模型编码器的输入,得到BERT模型的向量表示,并根据BERT模型的向量表示构建交互表;步骤5:将交互表与二维交互表通过改进的交叉熵损失函数进行比较,并反馈给BERT模型,BERT模型根据改进的交叉熵损失函数的损失值进行权重调整;步骤6:重复步骤2
‑
5直至抽取模型训练完成;步骤7:将待抽取的未知文本作为抽取模型的输入,得到交互表;步骤8:对交互表进行解码,得到抽取出的关系三元组。2.如权利要求1所述的单表建模实体关系抽取方法,其特征在于,所述二维交互表包括四个区域,分别为:左上区域、右上区域、左下区域、右下区域;其中,左上区域为主实体
‑
客实体交互表;右上区域为主实体
‑
关系交互表;左下区域为客实体
‑
关系交互表;右下区域为空,二维交互表的列数为主实体
‑
客实体交互表的列数与主实体
‑
关系交互表的列数之和;二维交互表的行数为主实体
‑
客实体交互表的行数与客实体
‑
关系交互表的行数之和。3.如权利要求1或2所述的单表建模实体关系抽取方法,其特征在于,所述二维交互表中每个元素的值表示对应的实体和关系、实体和另一个实体是否存在交互,当存在关系是赋予一种标识;当不存在关系时赋予另一种标识。4.如权利要求1所述的单表建模实体关系抽取方法,其特征在于,所述抽取模型根据当前句子中每个词构建当前句子的二维交互表。5.如权利要求1所述的单表建模实体关系抽取方法,其特征在于,所述主实体
‑
客...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。