三元组抽取模型的训练方法、装置、设备及介质制造方法及图纸

技术编号:40606475 阅读:19 留言:0更新日期:2024-03-12 22:12
本申请涉及智能养老技术领域,揭示了一种三元组抽取模型的训练方法、装置、设备及介质,其中方法包括:采用携带有标签的训练样本集,对初始抽取器进行训练,以及对初始生成器进行训练,得到中间抽取器和目标生成器;根据训练样本集的子集,对初始生成器进行生成假样本的训练得到模拟生成器;采用训练样本集和模拟生成器对初始判别器进行训练得到目标判别器;根据测试数据集、目标生成器和目标判别器生成合格的合成样本作为合格合成样本集,测试数据集中的关系标签是训练样本集对应的关系标签以外的关系标签;采用合格合成样本集对中间抽取器进行三元组抽取训练得到目标抽取器。提高了目标抽取器对不可见关系的抽取的准确性。

【技术实现步骤摘要】

本专利技术涉及智能语音、自然语言处理、智能养老,尤其涉及一种三元组抽取模型的训练方法、装置、设备及介质


技术介绍

1、实体和关系抽取是自然语言处理领域的一个重要任务,三元组抽取是实体和关系抽取的常见表现形式,其目的在于从文本中识别出具有特定意义的实体(比如,人物、地点、组织等)以及这些实体之间的关系(比如,工作关系、居住关系等)。比如,在智能养老领域中,对病历、护理记录进行三元组的准确抽取,对分析及提高养老服务的质量非常重要。

2、目前,越来越多的研究工作将三元组的抽取视为一个联合任务,并利用预训练语言模型来提升性能。这些预训练语言模型,比如bert(bidirectional encoderrepresentation from transformers)、gpt(generative pre-trained transformer)等,通过在大规模未标注的语料库上进行无监督学习,学习到了丰富的语义和上下文信息,然后采用少量标注的训练样本集进行实体和关系抽取的微调训练。然后,训练样本的标注成本较高,带标注的训练样本集覆盖的关系有限,导致训练本文档来自技高网...

【技术保护点】

1.一种三元组抽取模型的训练方法,所述方法包括:

2.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述根据所述训练样本集,对初始生成器进行生成训练,得到目标生成器的步骤,包括:

3.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用训练样本集,对初始抽取器进行三元组抽取训练,得到中间抽取器的步骤,包括:

4.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用所述训练样本集和所述模拟生成器,对初始判别器进行判别训练,得到目标判别器的步骤,包括:

5.根据权利要求1所述的三元组抽取模型的训练方法,其...

【技术特征摘要】

1.一种三元组抽取模型的训练方法,所述方法包括:

2.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述根据所述训练样本集,对初始生成器进行生成训练,得到目标生成器的步骤,包括:

3.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用训练样本集,对初始抽取器进行三元组抽取训练,得到中间抽取器的步骤,包括:

4.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用所述训练样本集和所述模拟生成器,对初始判别器进行判别训练,得到目标判别器的步骤,包括:

5.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述根据测试数据集、所述目标生成器和所述目标判别器生成合格的合成样本,作为合格合成样本集,所述测试数据集中的关系标签是所述训练样本集对应的关系标签以外的关系标签的步骤,包括:

6.根据...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1