一种数据处理方法、装置及设备、介质、产品制造方法及图纸

技术编号:41513879 阅读:17 留言:0更新日期:2024-05-30 14:51
一种数据处理方法、装置及设备、介质、产品;该方法包括:获取第一学习任务,第一学习任务包括支持集和询问集;调用关系抽取模型按照支持集中支持实例之间的实例相关性,对支持实例的标注关系标签进行修正处理得到标签修正结果,并基于标签修正结果和支持实例的特征生成每种第一关系类别的关系原型表示;调用关系抽取模型基于询问集中询问实例的特征分别与每种第一关系类别的关系原型表示之间的相似性,对询问实例进行关系预测处理得到询问实例的第一预测关系标签;基于支持实例的真实关系标签,以及询问实例的真实关系标签和第一预测关系标签训练关系抽取模型;可以提升训练好的关系抽取模型的准确性,进而准确预测目标实例所属的关系类别。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及人工智能,具体涉及一种数据处理方法、一种数据处理装置、一种计算机设备、一种计算机可读存储介质以及一种计算机程序产品。


技术介绍

1、关系抽取模型可用于确定自然语言文本(可简称为文本,即本申请实施例中的实例)中实体对之间的关系,目前,在训练关系抽取模型时,发现关系抽取模型对支持集中的噪声数据(即支持集中真实所属的关系类别与被标注的关系类别不相同的支持实例)非常敏感,导致训练好的关系抽取模型的准确性较差,容易产生错误的预测结果。


技术实现思路

1、本申请实施例提供了一种数据处理方法、装置及设备、介质、产品,旨在自动修正支持集中的噪声数据,来提升训练好的关系抽取模型的准确性,进而通过训练好的关系抽取模型对目标实例进行更准确的关系类别预测。

2、一方面,本申请实施例提供了一种数据处理方法,该方法包括:

3、获取第一学习任务,第一学习任务包括支持集和询问集,支持集中包含n种第一关系类别,每种第一关系类别下具备k个支持实例,每个支持实例具备各自的真实关系标签和标注关系标签本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述关系抽取模型包括标签修正模块,所述标签修正模块包括图神经网络子层和迭代修正子层;

3.如权利要求2所述的方法,其特征在于,所述支持集中各个支持实例在所述关系表示空间中具备各自的关系特征表示;

4.如权利要求3所述的方法,其特征在于,所述支持集中包含标注关系标签n,所述支持集中共有M个支持实例具备所述标注关系标签n,所述M个支持实例中的任一个表示为支持实例m;n为小于或者等于N的正整数,m为小于或者等于M的正整数;

5.如权利要求3所述的方法,其特征在于,所...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述关系抽取模型包括标签修正模块,所述标签修正模块包括图神经网络子层和迭代修正子层;

3.如权利要求2所述的方法,其特征在于,所述支持集中各个支持实例在所述关系表示空间中具备各自的关系特征表示;

4.如权利要求3所述的方法,其特征在于,所述支持集中包含标注关系标签n,所述支持集中共有m个支持实例具备所述标注关系标签n,所述m个支持实例中的任一个表示为支持实例m;n为小于或者等于n的正整数,m为小于或者等于m的正整数;

5.如权利要求3所述的方法,其特征在于,所述标签传播算法包括标签传播矩阵和类别标签矩阵;所述按照标签传播算法对所述支持集中各个所述支持实例的参考关系标签进行传播处理,得到标签修正结果,包括:

6.如权利要求1所述的方法,其特征在于,所述标签修正结果包括所述支持集中各个支持实例的修正关系标签;第一关系类别n是所述n种第一关系类别中的任一个,n为小于或者等于n的正整数;所述关系抽取模型包括实例编码器和关系分类模块,所述关系分类模块包括编码子层;

7.如权利要求6所述的方法,其特征在于,所述关系分类模块还包括分类子层,所述分类子层包括每种第一关系类别的关系原型表示;

8.如权利要求2所述的方法,其特征在于,所述关系抽取模型还包括实例编码器;所述调用所述图神经...

【专利技术属性】
技术研发人员:张亮杨振孟凡东苏劲松
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1