【技术实现步骤摘要】
本专利技术涉及智能语音、自然语言处理、智能养老,尤其涉及一种三元组抽取模型的训练方法、装置、设备及介质。
技术介绍
1、实体和关系抽取是自然语言处理领域的一个重要任务,三元组抽取是实体和关系抽取的常见表现形式,其目的在于从文本中识别出具有特定意义的实体(比如,人物、地点、组织等)以及这些实体之间的关系(比如,工作关系、居住关系等)。比如,在智能养老领域中,对病历、护理记录进行三元组的准确抽取,对分析及提高养老服务的质量非常重要。
2、目前,越来越多的研究工作将三元组的抽取视为一个联合任务,并利用预训练语言模型来提升性能。这些预训练语言模型,比如bert(bidirectional encoderrepresentation from transformers)、gpt(generative pre-trained transformer)等,通过在大规模未标注的语料库上进行无监督学习,学习到了丰富的语义和上下文信息,然后采用少量标注的训练样本集进行实体和关系抽取的微调训练。然后,训练样本的标注成本较高,带标注的训练样本集覆盖
...【技术保护点】
1.一种三元组抽取模型的训练方法,所述方法包括:
2.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述根据所述训练样本集,对初始生成器进行生成训练,得到目标生成器的步骤,包括:
3.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用训练样本集,对初始抽取器进行三元组抽取训练,得到中间抽取器的步骤,包括:
4.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用所述训练样本集和所述模拟生成器,对初始判别器进行判别训练,得到目标判别器的步骤,包括:
5.根据权利要求1所述的三元组抽
...【技术特征摘要】
1.一种三元组抽取模型的训练方法,所述方法包括:
2.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述根据所述训练样本集,对初始生成器进行生成训练,得到目标生成器的步骤,包括:
3.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用训练样本集,对初始抽取器进行三元组抽取训练,得到中间抽取器的步骤,包括:
4.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述采用所述训练样本集和所述模拟生成器,对初始判别器进行判别训练,得到目标判别器的步骤,包括:
5.根据权利要求1所述的三元组抽取模型的训练方法,其特征在于,所述根据测试数据集、所述目标生成器和所述目标判别器生成合格的合成样本,作为合格合成样本集,所述测试数据集中的关系标签是所述训练样本集对应的关系标签以外的关系标签的步骤,包括:
6.根据...
【专利技术属性】
技术研发人员:舒畅,陈又新,
申请(专利权)人:平安科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。