【技术实现步骤摘要】
本申请涉及计算机,尤其涉及人工智能,具体涉及一种数据处理方法、一种数据处理装置、一种计算机设备、一种计算机可读存储介质以及一种计算机程序产品。
技术介绍
1、关系抽取模型可用于确定自然语言文本(可简称为文本,即本申请实施例中的实例)中实体对之间的关系,目前,在训练关系抽取模型时,发现关系抽取模型对支持集中的噪声数据(即支持集中真实所属的关系类别与被标注的关系类别不相同的支持实例)非常敏感,导致训练好的关系抽取模型的准确性较差,容易产生错误的预测结果。
技术实现思路
1、本申请实施例提供了一种数据处理方法、装置及设备、介质、产品,旨在自动修正支持集中的噪声数据,来提升训练好的关系抽取模型的准确性,进而通过训练好的关系抽取模型对目标实例进行更准确的关系类别预测。
2、一方面,本申请实施例提供了一种数据处理方法,该方法包括:
3、获取第一学习任务,第一学习任务包括支持集和询问集,支持集中包含n种第一关系类别,每种第一关系类别下具备k个支持实例,每个支持实例具备各自的真实关
...【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述关系抽取模型包括标签修正模块,所述标签修正模块包括图神经网络子层和迭代修正子层;
3.如权利要求2所述的方法,其特征在于,所述支持集中各个支持实例在所述关系表示空间中具备各自的关系特征表示;
4.如权利要求3所述的方法,其特征在于,所述支持集中包含标注关系标签n,所述支持集中共有M个支持实例具备所述标注关系标签n,所述M个支持实例中的任一个表示为支持实例m;n为小于或者等于N的正整数,m为小于或者等于M的正整数;
5.如权利要求3所述的
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述关系抽取模型包括标签修正模块,所述标签修正模块包括图神经网络子层和迭代修正子层;
3.如权利要求2所述的方法,其特征在于,所述支持集中各个支持实例在所述关系表示空间中具备各自的关系特征表示;
4.如权利要求3所述的方法,其特征在于,所述支持集中包含标注关系标签n,所述支持集中共有m个支持实例具备所述标注关系标签n,所述m个支持实例中的任一个表示为支持实例m;n为小于或者等于n的正整数,m为小于或者等于m的正整数;
5.如权利要求3所述的方法,其特征在于,所述标签传播算法包括标签传播矩阵和类别标签矩阵;所述按照标签传播算法对所述支持集中各个所述支持实例的参考关系标签进行传播处理,得到标签修正结果,包括:
6.如权利要求1所述的方法,其特征在于,所述标签修正结果包括所述支持集中各个支持实例的修正关系标签;第一关系类别n是所述n种第一关系类别中的任一个,n为小于或者等于n的正整数;所述关系抽取模型包括实例编码器和关系分类模块,所述关系分类模块包括编码子层;
7.如权利要求6所述的方法,其特征在于,所述关系分类模块还包括分类子层,所述分类子层包括每种第一关系类别的关系原型表示;
8.如权利要求2所述的方法,其特征在于,所述关系抽取模型还包括实例编码器;所述调用所述图神经...
【专利技术属性】
技术研发人员:张亮,杨振,孟凡东,苏劲松,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。