基于对偶对比学习的零样本关系抽取方法和系统技术方案

技术编号：33623936 阅读：10 留言：0更新日期：2022-06-02 00:51

本发明专利技术涉及软件检测技术领域，提出一种基于对偶对比学习的零样本关系抽取方法和系统，其中方法包括：获取样本数据集，将样本数据集分为训练集、验证集和测试集；对训练集进行预处理；对预处理后的样本进行编码，结合位置编码，得到各样本的向量表示，对训练集中样本的标签进行编码，得到各标签的向量表示；结合样本层的对比学习和标签层的对比学习计算模型损失，计算模型损失后构建关系抽取模型；将验证集输入关系抽取模型，得到最优关系抽取模型；将测试集输入优化后的关系抽取模型，得到语义匹配的结果作为零样本关系抽取结果。根据本发明专利技术的方案，保证零样本关系抽取的高效和精准，解决了现有技术中对零样本关系抽取迫切需求的问题。求的问题。求的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于对偶对比学习的零样本关系抽取方法和系统

[0001]本专利技术涉及信息检测
，尤其涉及一种基于对偶对比学习的零样本关系抽取方法、系统、电子设备以及计算机可读存储介质。

技术介绍

[0002]随着互联网的发展，网上的信息爆发式的增长，人们每天不仅要接收大量新的知识和新闻，同时，互联网上每天也会出现海量新的实体和关系类型。而关系抽取技术就是一种通过给定的上下文信息和目标实体（包括头实体和尾实体），判断两个实体之间是何种关系的技术。而在以往的研究中，研究者们主要集中于标签（即头尾实体的关系名称，例如北京和中国的关系是首都，首都即为关系名称）完全确定的关系抽取。即预定义目标关系类型之后，标注大量对应的样本，然后通过训练机器学习或者深度学习模型，来判断新的样本和头尾实体的关系类型。然而，这种方法不适用于关系类型空间持续扩大的场景，也就是说，在关系类型不断增加的实际场景中，我们需要更加灵活的关系抽取方法。随之而来的研究是针对零样本的关系抽取方法，即给定一些新的关系类型，但是没有对应的已标注数据集。模型需要通过自己学习得到了一些知识，结合新的样本上下文信息，来判断关系类型。这种技术需求迫切，其下游应用场景也极为广泛，比如知识图谱动态扩充，问答系统，检索系统等等，但是其实现难度较大。

技术实现思路

[0003]本专利技术的目的在于解决
技术介绍
中的至少一个技术问题，提供一种基于对偶对比学习的零样本关系抽取方法、系统、电子设备以及计算机可读存储介质。
[0004]为实现上述专利技术目的，本专利技术提供一...

【技术保护点】

【技术特征摘要】
1.基于对偶对比学习的零样本关系抽取方法，其特征在于，包括：获取样本数据集，根据所述样本数据集中的样本的标签将所述样本数据集分为训练集、验证集和测试集；对所述训练集进行预处理，得到所述训练集中目标实体的位置编码；采用DeBERTa模型对预处理后的所述训练集中的各样本进行编码，结合所述位置编码，得到各样本的向量表示，对所述训练集中的各样本的标签进行编码，得到各标签的向量表示；结合对各样本的向量表示进行的样本层的对比学习以及对各标签的向量表示进行的标签层的对比学习计算模型损失，计算模型损失后优化所述DeBERTa模型作为关系抽取模型；将验证集进行所述预处理并得到其中各样本的向量表示以及各标签的向量表示后输入所述关系抽取模型，获取并保存验证集中样本与标签的语义相似度最高的最优关系抽取模型用于所述测试集；将测试集进行所述预处理并得到其中各样本的向量表示以及各标签的向量表示后输入所述最优关系抽取模型，得到语义匹配的结果作为零样本关系抽取结果。2.根据权利要求1所述的基于对偶对比学习的零样本关系抽取方法，其特征在于，所述位置编码具有两个向量表示，其中第一个向量表示样本中的每个单词与所述目标实体的头实体的相对位置关系，第二个向量表示样本中的每个单词与所述目标实体的尾实体的相对位置关系。3.根据权利要求2所述的基于对偶对比学习的零样本关系抽取方法，其特征在于，采用DeBERTa模型对预处理后的所述训练集中的各样本进行编码，结合所述位置编码，得到各样本的向量表示为：使用DeBERTa模型对各样本进行编码，随后拼接所述第一个向量表示和所述第二个向量表示，经过双层神经网络，得到各样本的向量表示。4.根据权利要求3所述的基于对偶对比学习的零样本关系抽取方法，其特征在于，对所述训练集中的各样本的标签进行编码，得到各标签的向量表示为：获取各所述标签的现有描述文本片段，将各所述描述文本片段进行编码，将编码后的各所述描述文本片段输入所述双层神经网络，通过所述双层神经网络的平均池化层得到各所述标签的向量表示。5.根据权利要求4所述的基于对偶对比学习的零样本关系抽取方法...

【专利技术属性】
技术研发人员：张世琨，叶蔚，李博，谢睿，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人