一种少样本关系分类方法及系统技术方案

技术编号:21629250 阅读:32 留言:0更新日期:2019-07-17 11:11
本发明专利技术公开了一种少样本关系分类方法及系统,方法包括:对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;基于得到的支撑样例和测试样例的上下文编码信息,收集支撑样例和测试样例之间的相互匹配的局部信息,得到支撑样例的表征和测试样例的表征;对每个支撑样例的表征和测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。本发明专利技术能够在多个层面对支撑数据和测试数据进行匹配,提高了少样本关系分类的准确率。

A Classification Method and System for Less Sample Relations

【技术实现步骤摘要】
一种少样本关系分类方法及系统
本专利技术涉及自然语言处理
,尤其涉及一种少样本关系分类方法及系统。
技术介绍
关系分类(Relationclassification,RC)是自然语言处理中的一项基础任务,目标是识别文本中的两个实体的语义关系。一些传统的关系分类方法采用了监督训练的方法,但是缺乏大规模的人工标注的数据。为了解决这个问题,远程监督的方法被提出,该方法能通过启发式地对齐知识库(knowledgebase,KB)和文本来标注数据。然而,知识库中的长尾问题仍然会使模型很难在少样本的关系上做分类。因此,如何有效的解决长尾问题,提高少样本关系分类的准确率,是一项亟待解决的问题。
技术实现思路
有鉴于此,本专利技术提供了一种少样本关系分类方法,基于多级别匹配聚合神经网络,能够在多个层面对支撑数据和测试数据进行匹配,提高了少样本关系分类的准确率。本专利技术提供了一种少样本关系分类方法,包括:对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;基于得到的所述支撑样例和测试样例的上下文编码信息,收集所述支撑样例和所述测试样例之间的相互匹配的局部信息,得到所述支撑样例的表征和所述测试样例的表征;对每个所述支撑样例的表征和所述测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。优选地,所述对测试样例和支撑集进行上下文编码,得到支撑样例和测试样例的上下文编码信息,包括:基于卷积神经网络对测试样例和支撑集进行上下文编码,得到支撑样例和测试样例的上下文编码信息。优选地,所述局部信息包括:所述支撑样例和所述测试样例中的字、词或短语之间的匹配信息。优选地,所述方法还包括:基于辅助损失函数度量每个支撑样例和对应类别之间的距离。一种少样本关系分类系统,包括:编码模块,用于对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;局部匹配与聚合模块,用于基于得到的所述支撑样例和测试样例的上下文编码信息,收集所述支撑样例和所述测试样例之间的相互匹配的局部信息,得到所述支撑样例的表征和所述测试样例的表征;样例匹配与聚合模块,用于对每个所述支撑样例的表征和所述测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;类别匹配模块,用于将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。优选地,所述编码模块具体用于:基于卷积神经网络对测试样例和支撑集进行上下文编码,得到支撑样例和测试样例的上下文编码信息。优选地,所述局部信息包括:所述支撑样例和所述测试样例中的字、词或短语之间的匹配信息。优选地,所述系统还包括:度量模块,用于基于辅助损失函数度量每个支撑样例和对应类别之间的距离。综上所述,本专利技术公开了一种少样本关系分类方法,包括:对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;基于得到的支撑样例和测试样例的上下文编码信息,收集支撑样例和测试样例之间的相互匹配的局部信息,得到支撑样例的表征和测试样例的表征;对每个所述支撑样例的表征和测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。本专利技术基于多级别匹配聚合神经网络,能够在多个层面对支撑数据和测试数据进行匹配,提高了少样本关系分类的准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术公开的一种少样本关系分类方法实施例1的方法流程图;图2为本专利技术公开的一种少样本关系分类方法实施例2的方法流程图;图3为本专利技术公开的一种少样本关系分类系统实施例1的结构示意图;图4为本专利技术公开的一种少样本关系分类系统实施例2的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,为本专利技术公开的一种少样本关系分类方法实施例1的方法流程图,所述方法可以包括:S101、对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;在少样本学习中,有两个数据集:元训练集和元测试集,元训练集和元测试集的类别空间没有重叠部分。其中,元测试集被分为两个部分,一部分为支撑集,另一部分为测试样例。其中支撑集又分为N类,每一类有K个支撑样例,测试样例被要求分类到支撑集中的某一类中去。具体的,在对少样本关系分类时,首先基于编码模块,其中,编码模块的输入是一个句子(测试样例)和两个实体在句子中的位置。一般先将句子中的词和位置信息用向量表征,然后使用神经网络将这些信息融合。具体的,在本专利技术中,可以通过卷积神经网络编码支撑集和测试样例的每个单词,从而获得考虑上下文信息的单词表达。S102、基于得到的支撑样例和测试样例的上下文编码信息,收集支撑样例和测试样例之间的相互匹配的局部信息,得到支撑样例的表征和测试样例的表征;然后基于局部匹配与聚合模块,其中,局部匹配与聚合模块的输入是从编码模块得到的K个支撑样例和1个测试样例的上下文编码信息,使用注意力机制来收集这两类样例之间的相互匹配的局部信息。具体的,局部信息指的是样例中的字或词或短语之间的匹配信息,由此得到的新的表征中包含了与其相匹配的另一个句子的信息。S103、对每个支撑样例的表征和测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;然后基于样例匹配与聚合模块,其中,样例匹配与聚合模块的输入是从局部匹配与聚合模块得到的支撑样例的表征和测试样例的表征。在样例匹配与聚合模块中,首先将每个支撑样例的表征和测试样例的表征进行匹配,并将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到这个类别的表征形式。S104、将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。最后基于类别匹配模块,其中,类别匹配模块的输入是样例匹配与聚合模块的输出,即类别的表征和测试样例的表征,将这两个表征输入到一个多层感知机中,得到测试样例与每一类的匹配分数。综上所述,本专利技术综合利用了少样本学习、关系分类和句子匹配三个
的特性,针对句子内部上下文信息的编码,采用了位置特征加卷积神经网络的方法;针对现有方法在编码句子表征时进行独立编码的问题,引入了句子匹配模型中的联合模型方法;针对训练数据为少量样本的情况,以原型网络为框架,充分利用训练数据;能够在多个层面对支撑数据和测试数据进行匹配,提高了少样本关系分类的准确率。如图2所示,为本专利技术公开的一种少样本关系分类方法实施例2的方法流程本文档来自技高网
...

【技术保护点】
1.一种少样本关系分类方法,其特征在于,包括:对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;基于得到的所述支撑样例和测试样例的上下文编码信息,收集所述支撑样例和所述测试样例之间的相互匹配的局部信息,得到所述支撑样例的表征和所述测试样例的表征;对每个所述支撑样例的表征和所述测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。

【技术特征摘要】
1.一种少样本关系分类方法,其特征在于,包括:对测试样例和支撑集进行上下文编码,得到K个支撑样例和1个测试样例的上下文编码信息;基于得到的所述支撑样例和测试样例的上下文编码信息,收集所述支撑样例和所述测试样例之间的相互匹配的局部信息,得到所述支撑样例的表征和所述测试样例的表征;对每个所述支撑样例的表征和所述测试样例的表征进行匹配,将匹配的得分作为权重,对所有同一类的样例表征做加权和,得到每个类别的表征;将每个类别的表征与测试样例的表征进行匹配,得到测试样例与每一类的匹配分数。2.根据权利要求1所述的方法,其特征在于,所述对测试样例和支撑集进行上下文编码,得到支撑样例和测试样例的上下文编码信息,包括:基于卷积神经网络对测试样例和支撑集进行上下文编码,得到支撑样例和测试样例的上下文编码信息。3.根据权利要求2所述的方法,其特征在于,所述局部信息包括:所述支撑样例和所述测试样例中的字、词或短语之间的匹配信息。4.根据权利要求3所述的方法,还包括:基于辅助损失函数度量每个支撑样例和对应类别之间的距离。5.一种少样本关系分类...

【专利技术属性】
技术研发人员:叶志秀凌震华戴礼荣
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1