三元组关系抽取方法、装置、设备和存储介质制造方法及图纸

技术编号:39997389 阅读:29 留言:0更新日期:2024-01-09 02:54
本申请的一种三元组关系抽取方法,包括:获取待测语句。对待测语句进行编码,得到语句向量。根据语句向量初始化全局矩阵,全局矩阵用于描述语句主语和语句宾语的对齐关系。将语句向量和关系语义向量输入PRGC模型的关系预测模块进行关系预测,得到关系预测子集。根据关系预测标签调节关系预测子集。将语句向量和调节后的关系预测子集输入PRGC模型的主语宾语标注模块进行计算,得到语句主语和语句宾语。将语句主语和语句宾语输入PRGC模型的主语宾语对齐模块进行对齐,基于对齐结果对全局矩阵进行裁剪,得到三元组关系。相比于基于原始PRGC模型的三元组抽取方法,本申请方法能够加强子任务间的耦合,具有更高的准确率和运算效率。

【技术实现步骤摘要】

本申请涉及语义解析,例如涉及一种三元组关系抽取方法、装 置、设备和存储介质。


技术介绍

1、关系型三元组通常以主语、关系谓语和宾语的三元形式表示,其中主语、 宾语为有意义的命名实体,而关系谓语通常是预定义的若干种关系类型之一。 三元组关系抽取指的是从非结构化的文本中提取结构化的三元组,它是文本 信息抽取的重要任务之一。

2、prgc模型将三元组关系抽取建模为三个学习任务,即:关系预测、主宾 语序列标注和主宾语对齐三个任务。prgc的缺点有两个:(1)各个任务过 于独立,在关系预测任务中,关系语义向量没有参与计算。(2)关系预测任 务在训练和推理阶段存在不匹配的情况,训练过程将多分类视为多个二分类 问题,推理过程中则视为排序问题。


技术实现思路

1、本申请目的在于:提供一种三元组关系抽取方法、装置、设备和介质, 其能够加强关系预测子任务间的耦合,具有更高的三元组关系抽取准确率和 运算效率。

2、为达到上述目的,本申请提供了一种三元组关系抽取方法,包括:

3、获取待测语句;对所本文档来自技高网...

【技术保护点】

1.一种三元组关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和关系语义向量输入PRGC模型的关系预测模块进行关系预测,得到关系预测子集,包括:

3.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述损失函数包括:第一损失函数、第二损失函数和第三损失函数;

4.根据权利要求2所述的三元组关系抽取方法,其特征在于,所述根据关系预测标签调节所述关系预测子集,包括:

5.根据权利要求3所述的三元组关系抽取方法,其特征在于,所述PRGC模型由损失函数训练得到,包括

6....

【技术特征摘要】

1.一种三元组关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和关系语义向量输入prgc模型的关系预测模块进行关系预测,得到关系预测子集,包括:

3.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述损失函数包括:第一损失函数、第二损失函数和第三损失函数;

4.根据权利要求2所述的三元组关系抽取方法,其特征在于,所述根据关系预测标签调节所述关系预测子集,包括:

5.根据权利要求3所述的三元组关系抽取方法,其特征在于,所述prgc模型由损失函数训练得到,包括:

6.根据权利要求1所述的三元组关系抽取方法,其特征在于,所述将所述语句向量和调节后的所述关系预测子集输...

【专利技术属性】
技术研发人员:张似衡
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1