一种关系抽取模型的训练方法及装置制造方法及图纸

技术编号:35784701 阅读:21 留言:0更新日期:2022-12-01 14:31
本申请公开了一种关系抽取模型的训练方法及装置,方法包括:获取样本数据集合,样本数据集合中包括多个样本数据,一个样本数据中包括一个实体对,一个关系与样本验证标签,样本验证标签用于表示样本数据中实体对与关系之间的匹配度,将样本数据输入初始模型得到实体对与关系之间的待定验证标签,利用待定验证标签与样本验证标签的差异对初始模型进行参数调整得到关系抽取模型,利用关系抽取模型进行关系抽取,使用本申请公开的保险关系抽取模型的训练方法可以得到支持零样本的关系抽取模型。型。型。

【技术实现步骤摘要】
一种关系抽取模型的训练方法及装置


[0001]本申请涉及关系抽取
,特别是涉及一种关系抽取模型的训练方法及装置。

技术介绍

[0002]随着科技水平和经济水平的不断提高,人们对自身安全防患意识也在不断地提高。为此产生了很多不同全新种类的保险产品以满足人们的需求,而保险的文本往往包含大量的信息,对保险文本进行关系抽取提取当中信息之间的关系成为了一件非常重要的事情。关系抽取就是从一段文本中抽取出实体对以及实体对之间的关系,关系抽取也叫做三元组抽取。现有技术提供了一种保险关系抽取的方式,现有技术通过对已有的保险文本抽取实体对以及关系进行模型训练,使用训练出的模型对保险文本进行关系抽取,但是使用这种方法只能抽取实体之间已有的关系,面对全新的产品则无法进行关系抽取,不能适用于零样本的推理环境。

技术实现思路

[0003]基于上述问题,本申请提供了一种关系抽取模型的训练方法及装置。
[0004]本申请公开了一种关系抽取模型的训练方法,所述方法包括:
[0005]获取样本数据集合,所述样本数据集合中包括多个样本数据,一个样本数据中包括一个实体对,一个关系与样本验证标签,所述样本验证标签用于表示样本数据中实体对与关系之间的匹配度;
[0006]将所述样本数据输入初始模型得到所述实体对与关系之间的待定验证标签;
[0007]利用所述待定验证标签与所述样本验证标签的差异对所述初始模型进行参数调整得到关系抽取模型,所述关系抽取模型用于关系抽取。
[0008]可选的,关系抽取包括
[0009]将待抽取文本进行实体抽取得到实体1和实体2;
[0010]获取多个待分析关系;
[0011]利用实体1,实体2与多个待分析关系形成多个待分析数据;
[0012]将所述待分析数据输入所述关系抽取模型得到所述实体1,实体2与多个所述待分析关系的匹配度;
[0013]将匹配度最高的待分析关系作为所述实体1与实体2的关系抽取结果。
[0014]可选的,实体对包括:
[0015]保险产品名与保险片段组成的实体对。
[0016]可选的,关系包括:
[0017]保险文本中实体间的关系。
[0018]可选的,一种关系抽取模型的训练方法进一步包括:
[0019]将保险文本作为样本,将所述保险文本对应的类型作为样本标签训练分类模型,
所述分类模型的词嵌入层用于将所述保险文本转化为向量,所述分类模型基于所述向量确定文本的类型,所述类型包括标题和段落;
[0020]所述将所述样本数据输入初始模型得到所述实体对与关系之间的待定验证标签,进一步包括:
[0021]基于所述分类模型的词嵌入层将所述样本数据转化为对应的向量;
[0022]将转化后的样本数据输入初始模型得到所述实体对与关系之间的待定验证标签。
[0023]一种关系抽取模型的训练装置,所述装置包括:
[0024]样本数据获取模块,用于获取样本数据集合,所述样本数据集合中包括多个样本数据,一个样本数据中包括一个实体对,一个关系与样本验证标签,所述样本验证标签用于表示样本数据中实体对与关系之间的匹配度;
[0025]待定验证标签获取模块,用于获取待定验证标签,将所述样本数据输入初始模型得到所述实体对与关系之间的待定验证标签;
[0026]初始模型调整模块,用于调整初始模型,利用所述待定验证标签与所述样本验证标签的差异对所述初始模型进行参数调整得到关系抽取模型,所述关系抽取模型用于关系抽取。
[0027]可选的,所述关系抽取模块进一步包括:
[0028]实体抽取模块,用于进行实体抽取获得实体1和实体2;
[0029]待分析关系获取模块,用于获取待分析关系;
[0030]待分析数据生成模块,用于生成待分析数据,利用实体1,实体2与多个待分析关系形成多个待分析数据;
[0031]待分析数据分析模块,用于分析待分析数据得到所述实体1,实体2与多个所述待分析关系的匹配度;
[0032]关系抽取结果确定模块,用于确定关系抽取结果,将匹配度最高的待分析关系作为所述实体1与实体2的关系抽取结果。
[0033]可选的,所述关系抽取模型的训练装置进一步包括:
[0034]分类模型训练模块,用于训练分类模型,将保险文本作为样本,将所述保险文本对应的类型作为样本标签训练分类模型,所述分类模型的词嵌入层用于将所述保险文本转化为向量,所述分类模型基于所述向量确定文本的类型,所述类型包括标题和段落;
[0035]向量转化模块:用于向量转化,基于所述分类模型的词嵌入层将所述实体对,实体1与实体2转化为向量。
[0036]本申请还提供了一种电子设备,包括存储器和处理器,其中:
[0037]所述存储器,用于保存计算机程序;
[0038]所述处理器,用于执行所述计算机程序,以实现上述关系抽取模型的训练方法。
[0039]本申请还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述关系抽取模型的训练方法。
[0040]相较于现有技术,本申请具有以下有益效果:
[0041]本申请通过获取样本数据集合,所述样本数据集合中包括多个样本数据,一个样本数据中包括一个实体对,一个关系与样本验证标签,所述样本验证标签用于表示样本数据中实体对与关系之间的匹配度,将所述样本数据输入初始模型得到所述实体对与关系之
间的待定验证标签,利用所述待定验证标签与所述样本验证标签的差异对所述初始模型进行参数调整得到关系抽取模型,利用所述关系抽取模型进行关系抽取。本申请相比于现有技术,本申请利用样本验证标签来对数据进行验证,样本验证标签源于实体对和关系,本申请使用实体对与关系之间的样本验证标签与待定验证标签之间的差异调整初始模型,训练得到关系抽取模型,使用这种方法训练得到的关系抽取模型可以获得实体对与关系之间的匹配度,根据匹配度确定实体对之间的关系,可以适用于零样本的推理场景。
附图说明
[0042]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0043]图1为本申请提供的一种关系抽取模型的训练方法流程图;
[0044]图2为本申请提供的又一种关系抽取模型的训练方法流程图;
[0045]图3为本申请提供的一种关系抽取模型的训练装置结构示意图。
具体实施方式
[0046]正如前文描述,目前的方法通过对已有的保险文本抽取实体对以及实体对之间的关系进行模型训练,使用训练出的模型对保险文本进行关系抽取,但是使用这种方法只能抽取实体之间已有的关系,面对全新的产品则无法进行关系抽取,不能适用于零本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关系抽取模型的训练方法,其特征在于,包括:获取样本数据集合,所述样本数据集合中包括多个样本数据,一个样本数据中包括一个实体对,一个关系与样本验证标签,所述样本验证标签用于表示样本数据中实体对与关系之间的匹配度;将所述样本数据输入初始模型得到所述实体对与关系之间的待定验证标签;利用所述待定验证标签与所述样本验证标签的差异对所述初始模型进行参数调整得到关系抽取模型,所述关系抽取模型用于关系抽取。2.根据权利要求1所述的方法,其特征在于,所述关系抽取包括:将待抽取文本进行实体抽取得到实体1和实体2;获取多个待分析关系;利用实体1,实体2与多个待分析关系形成多个待分析数据;将所述待分析数据输入所述关系抽取模型得到所述实体1,实体2与多个所述待分析关系的匹配度;将匹配度最高的待分析关系作为所述实体1与实体2的关系抽取结果。3.根据权利要求1所述的方法,其特征在于,所述实体对包括:保险产品名与保险片段组成的实体对。4.根据权利要求1所述的方法,其特征在于,所述关系包括:保险文本中实体间的关系。5.根据权利要求1

4任意一项所述的方法,其特征在于,所述方法进一步包括:将保险文本作为样本,将所述保险文本对应的类型作为样本标签训练分类模型,所述分类模型的词嵌入层用于将所述保险文本转化为向量,所述分类模型基于所述向量确定文本的类型,所述类型包括标题和段落;所述将所述样本数据输入初始模型得到所述实体对与关系之间的待定验证标签,进一步包括:基于所述分类模型的词嵌入层将所述样本数据转化为对应的向量;将转化后的样本数据输入初始模型得到所述实体对与关系之间的待定验证标签。6.一种关系抽取模型的训练装置,其特征在于,包括:样本数据获取模块,用于获取样本数据集合,所述样本数据集合中包括多个样本数据,一个样本数据中包括一个实体对,一个关系与样本验证...

【专利技术属性】
技术研发人员:武悦娇
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1