【技术实现步骤摘要】
本专利技术涉及提取结构化实体关系,具体涉及多角度构建实体交互特征的细粒度增量式三元组关系抽取方法。
技术介绍
1、从非结构化文本中提取结构化实体关系三元组是自然语言处理领域的一个重要任务,涉及从文本中识别实体和实体对之间的关系分类。该任务在信息抽取、知识图谱构建、问答系统等应用中扮演着关键的角色。传统基于流水线的实体关系抽取方法通常将任务拆分为两个独立的子任务:实体识别和关系分类。这类方法结构简单,流程清晰,但分离式的架构存在级联误差问题,早期步骤中的错误无法被修改,影响后续步骤的预测结果。
2、为了克服传统方法中存在的级联误差问题,近年来,研究人员提出了联合式实体关系抽取方法。该方法将实体识别和关系分类任务联合解码,同时预测实体和关系。现有研究根据联合式方法的提取步骤将这类方法分为两种:
3、1)多阶段(multi-stage)式三元组提取。这类模型利用了不同层次的信息,通过逐步挖掘句子信息对特征进行约束,逐渐逼近真实结果,仍存在误差累积和暴露偏差问题。
4、2)单阶段(one stage)式三元组
...【技术保护点】
1.多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,包括:
2.根据权利要求1所述多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,句子S={w1,w2,w3,…,wL}中包括数量为L的实体和数量为K的关系R={r1,r2,r3,...,rK};句子S中所有可能的三元组其中N是句子中包含的三元组的数量,hi和ti分别是几个连续的组成的头实体和尾实体,ri表示实体对在句子中对应的关系。
3.根据权利要求2所述多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,使用预训练模型BERT获取句子S中
...【技术特征摘要】
1.多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,包括:
2.根据权利要求1所述多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,句子s={w1,w2,w3,…,wl}中包括数量为l的实体和数量为k的关系r={r1,r2,r3,...,rk};句子s中所有可能的三元组其中n是句子中包含的三元组的数量,hi和ti分别是几个连续的组成的头实体和尾实体,ri表示实体对在句子中对应的关系。
3.根据权利要求2所述多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,使用预训练模型bert获取句子s中每个token ei在上下文中的深层语义特征,具体为:
4.根据权利要求2所述多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,双向映射模块fiere将所有token的特征同时向头实体和尾实体特征空间映射,具体映射方式为:
5.根据权利要求4所述多角度构建实体交互特征的细粒度增量式三元组关系抽取方法,其特征在于,将头实体特征{h1,h2,…,hl}、尾实体特征{t1,t2,…,tl}按照对应维度拼接得到初始实体间交互矩阵的形状为l×l×(h×2),其中l为句子中token的总数,h为特征的维度,将所述初始实体间交互矩阵输入至特征融合模块,构建统一特征空间的句子内部所有实体间交互矩阵mfinal:
6.根据权...
【专利技术属性】
技术研发人员:张强,钟兆前,车超,吴俊贤,李家兴,
申请(专利权)人:大连大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。