关系表示模型的训练方法、装置及电子设备制造方法及图纸

技术编号:32345573 阅读:14 留言:0更新日期:2022-02-20 02:00
本公开公开了一种关系表示模型的训练方法,该方法包括:在样本数据集中获得多个样本数据子集,并计算每个样本数据子集的原型数据;其中,同一个样本数据子集中的样本数据具有相同的实体对;在所述样本数据集中,计算任意两个样本数据之间的距离作为表示直接关联关系的第一关联特征信息;并计算任意一个样本数据与任意样本数据子集的原型数据的距离作为表示间接关联关系的第二关联特征信息;根据所述第一关联特征信息和所述第二关联特征信息,训练获得目标关系表示模型,以利用所述目标关系表示模型获得各样本数据中相同实体对的关系。该方法可以提升目标关系表示模型的稳定性和准确度。定性和准确度。定性和准确度。

【技术实现步骤摘要】
关系表示模型的训练方法、装置及电子设备


[0001]本公开涉及自然语言处理
,更具体地,涉及一种关系表示模型的训练方法、装置及电子设备,本公开还涉及一种关系抽取模型的训练方法以及一种关系抽取方法。

技术介绍

[0002]关系抽取是信息抽取中的重要任务,其可以从非结构化的自然语言文本中抽取用于描述实体关系的结构化的知识,从而构建和扩充各式各样的知识图谱以存储丰富的世界知识。
[0003]目前在进行关系抽取之前,需要利用训练数据使得关系表示模型学习实体之间的关系表示,即,需要先进行关系学习,而根据训练数据的数据类型的不同,目前的关系学习一般可以分为:1、有监督的关系学习;2、无监督的关系学习;3、远程监督的关系学习。在实际中,由于第一种方法需要人工对训练数据进行标注,存在耗时耗力的问题;而使用第二种方法学习出来的关系往往没有规律且错误率较高;因此,在构建关系表示模型时,一般是使用上述第三种方法,即远程监督的关系学习方法来构建关系表示模型。
[0004]目前,在使用远程监督的关系学习方法构建关系表示模型时,一般是将文本中的实体和已构建知识库中的实体进行对齐以获取标注,从而获得大量的样本数据集,以训练获得关系表示模型。然而,使用远程监督方法获得的训练样本数据集中,一般伴有较大的噪音,因此,使用该种方法获得的关系表示模型存在稳定性和准确度低的问题。

技术实现思路

[0005]本公开实施例的一个目的是提供一种训练关系表示模型的新技术方案。
[0006]根据本公开的第一方面,提供了一种关系表示模型的训练方法,该方法包括:在样本数据集中获得多个样本数据子集,并计算每个样本数据子集的原型数据;其中,同一个样本数据子集中的样本数据具有相同的实体对;在所述样本数据集中,计算任意两个样本数据之间的距离作为表示直接关联关系的第一关联特征信息;并计算任意一个样本数据与任意样本数据子集的原型数据的距离作为表示间接关联关系的第二关联特征信息;根据所述第一关联特征信息和所述第二关联特征信息,训练获得目标关系表示模型,以利用所述目标关系表示模型获得各样本数据中相同实体对的关系。
[0007]可选地,所述在样本数据集中获得多个样本数据子集,包括:获取所述样本数据集中的样本数据所包含的实体对;将具有相同实体对的样本数据归属为同一个样本数据子集。
[0008]可选地,所述计算每个样本数据子集的原型数据,包括:对所述样本数据子集中的样本数据进行无监督聚类处理,获得所述样本数据子集的聚类中心数据;根据所述聚类中心数据,获得所述原型数据。
[0009]可选地,所述计算任意两个样本数据之间的距离作为表示直接关联关系的第一关联特征信息,包括:从所述样本数据集中,获取第一样本数据和第二样本数据;将所述第一
样本数据输入到待训练的初始关系表示模型中,获得第一关系表示向量;以及将所述第二样本数据输入到所述初始关系表示模型中,获得第二关系表示向量;根据所述第一关系表示向量和所述第二关系表示向量,使用预设的第一距离计算方法计算所述第一样本数据和所述第二样本数据间的距离,其中,所述预设的第一距离计算方法是以所述第二关联特征信息为约束因子的距离计算方法。
[0010]可选地,所述并计算任意一个样本数据与任意样本数据子集的原型数据的距离作为表示间接关联关系的第二关联特征信息,包括:使用预设的第二距离计算方法计算所述第一样本数据与所述原型数据之间的距离,获得第一距离数据;使用所述预设的第二距离计算方法计算所述第二样本数据与所述原型数据之间的距离,获得第二距离数据;根据所述第一距离数据和所述第二距离数据,获得所述第二关联特征信息。
[0011]可选地,所述根据所述第一距离数据和所述第二距离数据,获得所述第二关联特征信息,包括:在所述第一距离数据与所述第二距离数据的差值的绝对值不大于预设的第一距离阈值的情况下,确定所述第一样本数据与所述第二样本数据互为正例。
[0012]可选地,所述方法还包括:在所述第一样本数据为所述原型数据对应的样本数据子集中的样本数据,并且所述第一距离数据不小于预设的第二距离阈值的情况下,确定所述第一样本数据为所述样本数据子集中的正例样本数据;以及在所述第一距离数据小于所述预设的第二距离阈值的情况下,确定所述第一样本数据为所述样本数据子集中的负例样本数据。
[0013]可选地,所述根据所述第一距离数据和所述第二距离数据,获得所述第二关联特征信息,还包括:获取所述原型数据对应的样本数据子集中的正例样本数据的数量,以及负例样本数据的数量;根据所述正例样本数据的数量和所述负例样本数据的数量,获得所述原型数据的置信度;在所述第一距离数据与所述第二距离数据的差值的绝对值不大于所述预设的第一距离阈值,并且所述置信度不小于预设的置信度阈值的情况下,确定所述第一样本数据与所述第二样本数据互为正例。
[0014]可选地,所述根据所述第一关联特征信息和所述第二关联特征信息,训练获得目标关系表示模型,包括:以所述第二关联特征信息为约束因子,在训练所述初始关系表示模型的过程中,通过调整所述初始关系表示模型的参数,使所述第一样本数据和所述第二样本数据之间的距离满足预设的约束条件,以获得满足预设收敛条件的所述目标关系表示模型。
[0015]可选地,所述样本数据集包括使用远程监督方法获取到的数据集。
[0016]根据本公开的第二方面,本公开还提供了一种关系抽取模型的训练方法,包括:获取训练样本数据集;将所述训练样本数据集中的样本数据输入到目标关系表示模型中,获得与所述训练样本数据集对应的关系表示向量数据集,其中,所述目标关系表示模型是使用本公开的第一方面所述的方法训练得到的模型;获取与所述关系表示向量数据集对应的标注信息;根据所述关系表示向量数据集和所述标注信息,训练获得目标关系抽取模型。
[0017]根据本公开的第三方面,本公开还提供了一种关系抽取方法,包括:获取待处理实例数据;将所述待处理实例数据输入到目标关系抽取模型中,获得所述待处理实例数据所包含的实体对间的关系,其中,所述目标关系抽取模型是使用本公开的第二方面所述的方法训练得到的模型。
[0018]根据本公开的第四方面,本公开还提供了一种关系表示模型的训练装置,包括:预处理模块,用于在样本数据集中获得多个样本数据子集,并计算每个样本数据子集的原型数据;其中,同一个样本数据子集中的样本数据具有相同的实体对;第一关联特征信息获得模块,用于在所述样本数据集中,计算任意两个样本数据之间的距离作为表示直接关联关系的第一关联特征信息;第二关联特征信息获得模块,用于计算任意一个样本数据与任意样本数据子集的原型数据的距离作为表示间接关联关系的第二关联特征信息间接关联关系的第二关联特征信息;模型训练模块,用于根据所述第一关联特征信息和所述第二关联特征信息,训练获得目标关系表示模型,以利用所述目标关系表示模型获得各样本数据中相同实体对的关系。
[0019]根据本公开的第五方面,还提供了一种电子设备,其包括根据本公开的第四方面所述的装置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关系表示模型的训练方法,包括:在样本数据集中获得多个样本数据子集,并计算每个样本数据子集的原型数据;其中,同一个样本数据子集中的样本数据具有相同的实体对;在所述样本数据集中,计算任意两个样本数据之间的距离作为表示直接关联关系的第一关联特征信息;并计算任意一个样本数据与任意样本数据子集的原型数据的距离作为表示间接关联关系的第二关联特征信息;根据所述第一关联特征信息和所述第二关联特征信息,训练获得目标关系表示模型,以利用所述目标关系表示模型获得各样本数据中相同实体对的关系。2.根据权利要求1所述的方法,所述在样本数据集中获得多个样本数据子集,包括:获取所述样本数据集中的样本数据所包含的实体对;将具有相同实体对的样本数据归属为同一个样本数据子集。3.根据权利要求1所述的方法,所述计算每个样本数据子集的原型数据,包括:对所述样本数据子集中的样本数据进行无监督聚类处理,获得所述样本数据子集的聚类中心数据;根据所述聚类中心数据,获得所述原型数据。4.根据权利要求1所述的方法,所述计算任意两个样本数据之间的距离作为表示直接关联关系的第一关联特征信息,包括:从所述样本数据集中,获取第一样本数据和第二样本数据;将所述第一样本数据输入到待训练的初始关系表示模型中,获得第一关系表示向量;以及将所述第二样本数据输入到所述初始关系表示模型中,获得第二关系表示向量;根据所述第一关系表示向量和所述第二关系表示向量,使用预设的第一距离计算方法计算所述第一样本数据和所述第二样本数据间的距离,其中,所述预设的第一距离计算方法是以所述第二关联特征信息为约束因子的距离计算方法。5.根据权利要求4所述的方法,所述并计算任意一个样本数据与任意样本数据子集的原型数据的距离作为表示间接关联关系的第二关联特征信息,包括:使用预设的第二距离计算方法计算所述第一样本数据与所述原型数据之间的距离,获得第一距离数据;使用所述预设的第二距离计算方法计算所述第二样本数据与所述原型数据之间的距离,获得第二距离数据;根据所述第一距离数据和所述第二距离数据,获得所述第二关联特征信息。6.根据权利要求5所述的方法,所述根据所述第一距离数据和所述第二距离数据,获得所述第二关联特征信息,包括:在所述第一距离数据与所述第二距离数据的差值的绝对值不大于预设的第一距离阈值的情况下,确定所述第一样本数据与所述第二样本数据互为正例。7.根据权利要求5所述的方法,所述方法还包括:在所述第一样本数据为所述原型数据对应的样本数据子集中的样本数据,并且所述第一距离数据不小于预设的第二距离阈值的情况下,确定所述第一样本数据为所述样本数据
子集中的正例样本数据;以及在所述第一距离数据小于所述预设的第二距离阈值的情况下,确定所述第一样本数据为所述样本数据子集中的负例样本数据。8.根据权利要求7所述的方法,所述根据所述第一距离...

【专利技术属性】
技术研发人员:丁宁龙定坤徐光伟王潇斌谢朋峻
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1