识别模型获取及类别识别方法、装置及存储介质制造方法及图纸

技术编号:26172831 阅读:25 留言:0更新日期:2020-10-31 13:52
本申请公开了识别模型获取及类别识别方法、装置及存储介质,涉及自然语言处理与深度学习领域,所述识别模型获取方法可包括:训练识别模型,其中,任一轮次的训练过程分别包括:根据已标注类别的小样本数据集中的数据构造元学习任务,其中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,支撑集中的训练数据属于P个不同的类别;针对任一测试数据,分别获取测试数据及各训练数据的特征向量,根据所述特征向量,分别确定出各类别的类别向量,根据测试数据的特征向量及各类别的类别向量,确定出与测试数据相匹配的类别,作为预测出的测试数据所属的类别。应用本申请所述方案,可降低模型对于数据规模的要求等。

【技术实现步骤摘要】
识别模型获取及类别识别方法、装置及存储介质
本申请涉及计算机应用技术,特别涉及自然语言处理与深度学习领域的识别模型获取及类别识别方法、装置及存储介质。
技术介绍
目前,深度学习技术已经得到了广泛应用,如可应用于对话系统中。任务型的对话系统通常由对话意图识别和槽位识别任务组成,其中,可通过标注大量的对话样本数据,训练得到对话意图识别模型(即对话意图分类器),进而可利用对话意图识别模型进行对话意图识别。但真实的对话场景在冷启动阶段,标注的对话样本数据往往规模很小,即仅存在小样本数据集,而上述方法在小样本数据集下往往存在过拟合的现象,模型性能较差,识别结果的准确性较低,无法满足真实需求。
技术实现思路
本申请提供了识别模型获取及类别识别方法、装置及存储介质。一种识别模型获取方法,包括:训练识别模型,其中,任一轮次的训练过程分别包括以下处理:根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。一种类别识别方法,包括:构造元学习测试任务,所述元学习测试任务中包括由已标注类别的数据组成的支撑集以及由待处理的数据组成的样本集;针对所述元学习测试任务,利用按照上述方法获取到的识别模型,确定出所述待处理的数据所属的类别。一种识别模型获取装置,包括:获取模块及训练模块;所述获取模块,用于获取已标注类别的小样本数据集;所述训练模块,用于训练识别模型,其中,任一轮次的训练过程分别包括以下处理:根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。一种类别识别装置,包括:构造模块以及识别模块;所述构造模块,用于构造元学习测试任务,所述元学习测试任务中包括由已标注类别的数据组成的支撑集以及由待处理的数据组成的样本集;所述识别模型,用于针对所述元学习测试任务,利用按照上述装置获取到的识别模型,确定出所述待处理的数据所属的类别。一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如以上所述的方法。上述申请中的一个实施例具有如下优点或有益效果:通过构造不同的元学习任务,可利用小样本数据集训练得到识别模型,即通过利用构造的大量元学习任务进行训练,使得模型具有快速学习新任务的能力,从而降低了模型对于数据规模的要求,并确保了模型性能等,在实际识别时,识别模型能够对新任务快速适应,不需要再进行任务训练,直接将已标注类别的数据作为支撑集,将待处理的数据作为样本集,并可确保识别结果的准确性等。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1为本申请所述识别模型获取方法实施例的流程图;图2为本申请所述识别模型的结构示意图;图3为本申请所述权重计算过程示意图;图4为本申请所述类别识别方法实施例的流程图;图5为本申请所述识别模型获取装置50实施例的组成结构示意图;图6为本申请所述类别识别装置60实施例的组成结构示意图;图7为根据本申请实施例所述方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。另外,应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1为本申请所述识别模型获取方法实施例的流程图。如图1所示,包括以下具体实现方式。在101中,训练识别模型,其中,任一轮次的训练过程中分别进行102-103所示处理。在102中,根据已标注类别的小样本数据集中的数据构造元学习任务(MetaTask),元学习任务中包括由M条训练数据组成的支撑集(SupportSet)以及由N条测试数据组成的样本集(QuerySet),支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数。在103中,针对任一测试数据,分别进行以下处理:获取测试数据及各训练数据的特征向量;根据测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据测试数据的特征向量及各类别的类别向量,确定出与测试数据相匹配的类别,将相匹配的类别作为预测出的测试数据所属的类别。传统的深度学习方法需要获取大规模样本数据集,通过大规模样本数据集从头开始训练任务,模型的效果依赖于数据的质量和规模。相比之下,人类拥有一个显著的能力,即可以从少量的样本数据中进行有效学习,比如,人类看到一张鸭嘴兽的照片,能够从中获悉鸭嘴兽的长相特征,即具有了辨别鸭嘴兽的能力,这样,即便之前没有见过鸭嘴兽,当见到真实的鸭嘴兽时,也可以辨别出鸭嘴兽。显然,传统的深度学习方法与人类仅通过少量样本数据即可迅速完成学习的情况相差甚远。本实施例中提出一种基于小样本的深度学习方法(即小样本学习方法),可极大地降低模型对于数据规模的要求。元学习是目前深度学习领域的一个前沿的研究方向,解决的是学习如何学习的问题。本实施例所述基于小样本的深度学习方法以元学习作为理论支撑。本实施例中,可利用已标注类别的小样本数据集训练识别模型。其中,在进行本文档来自技高网...

【技术保护点】
1.一种识别模型获取方法,包括:/n训练识别模型,其中,任一轮次的训练过程分别包括以下处理:/n根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;/n针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。/n

【技术特征摘要】
1.一种识别模型获取方法,包括:
训练识别模型,其中,任一轮次的训练过程分别包括以下处理:
根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;
针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。


2.根据权利要求1所述的方法,其中,P小于L,L为大于一的正整数,表示所述小样本数据集中的数据所属的类别数,对于所述P个不同类别中的任一类别,所述支撑集中至少包括两条属于所述类别的训练数据。


3.根据权利要求1所述的方法,其中,所述获取所述测试数据及各训练数据的特征向量包括:
将所述测试数据及各训练数据分别输入长短期记忆网络模型,得到输出的特征向量。


4.根据权利要求1所述的方法,其中,所述根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量包括:
针对任一类别,分别根据属于所述类别的训练数据的特征向量及所述测试数据的特征向量,确定出所述类别的类别向量。


5.根据权利要求4所述的方法,其中,所述根据属于所述类别的训练数据的特征向量及所述测试数据的特征向量,确定出所述类别的类别向量包括:
根据所述测试数据的特征向量分别确定出属于所述类别的各训练数据的权重;
分别计算属于所述类别的各训练数据的特征向量与对应的权重的乘积,将各乘积相加,将相加之和作为所述类别的类别向量。


6.根据权利要求5所述的方法,其中,所述根据所述测试数据的特征向量分别确定出属于所述类别的各训练数据的权重包括:
针对任一属于所述类别的训练数据,分别计算所述测试数据的特征向量与所述训练数据的特征向量之间的余弦相似度,将所述余弦相似度进行预定处理后作为所述训练数据的权重。


7.根据权利要求1所述的方法,其中,所述根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别包括:
针对任一类别,分别将所述类别的类别向量与所述测试数据的特征向量组成向量对;
分别获取各向量对的匹配评分,将评分最高的向量对中的类别向量对应的类别作为与所述测试数据相匹配的类别。


8.一种类别识别方法,包括:
构造元学习测试任务,所述元学习测试任务中包括由已标注类别的数据组成的支撑集以及由待处理的数据组成的样本集;
针对所述元学习测试任务,利用按照权利要求1-7中任一项所述的方法获取到的识别模型,确定出所述待处理的数据所属的类别。


9.一种识别模型获取装置,包括:获取模块及训练模块;
所述获取模块,用于获取已标注类别的小样本数...

【专利技术属性】
技术研发人员:郭洪杰焦振宇孙叔琦孙珂李婷婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1