【技术实现步骤摘要】
识别模型获取及类别识别方法、装置及存储介质
本申请涉及计算机应用技术,特别涉及自然语言处理与深度学习领域的识别模型获取及类别识别方法、装置及存储介质。
技术介绍
目前,深度学习技术已经得到了广泛应用,如可应用于对话系统中。任务型的对话系统通常由对话意图识别和槽位识别任务组成,其中,可通过标注大量的对话样本数据,训练得到对话意图识别模型(即对话意图分类器),进而可利用对话意图识别模型进行对话意图识别。但真实的对话场景在冷启动阶段,标注的对话样本数据往往规模很小,即仅存在小样本数据集,而上述方法在小样本数据集下往往存在过拟合的现象,模型性能较差,识别结果的准确性较低,无法满足真实需求。
技术实现思路
本申请提供了识别模型获取及类别识别方法、装置及存储介质。一种识别模型获取方法,包括:训练识别模型,其中,任一轮次的训练过程分别包括以下处理:根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。一种类别识别方法,包括:构造元学 ...
【技术保护点】
1.一种识别模型获取方法,包括:/n训练识别模型,其中,任一轮次的训练过程分别包括以下处理:/n根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;/n针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。/n
【技术特征摘要】
1.一种识别模型获取方法,包括:
训练识别模型,其中,任一轮次的训练过程分别包括以下处理:
根据已标注类别的小样本数据集中的数据构造元学习任务,所述元学习任务中包括由M条训练数据组成的支撑集以及由N条测试数据组成的样本集,所述支撑集中的训练数据属于P个不同类别,M和P均为大于一的正整数,N为正整数;
针对任一测试数据,分别进行以下处理:获取所述测试数据及各训练数据的特征向量;根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量;根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别,将所述相匹配的类别作为预测出的所述测试数据所属的类别。
2.根据权利要求1所述的方法,其中,P小于L,L为大于一的正整数,表示所述小样本数据集中的数据所属的类别数,对于所述P个不同类别中的任一类别,所述支撑集中至少包括两条属于所述类别的训练数据。
3.根据权利要求1所述的方法,其中,所述获取所述测试数据及各训练数据的特征向量包括:
将所述测试数据及各训练数据分别输入长短期记忆网络模型,得到输出的特征向量。
4.根据权利要求1所述的方法,其中,所述根据所述测试数据及各训练数据的特征向量,分别确定出各类别的类别向量包括:
针对任一类别,分别根据属于所述类别的训练数据的特征向量及所述测试数据的特征向量,确定出所述类别的类别向量。
5.根据权利要求4所述的方法,其中,所述根据属于所述类别的训练数据的特征向量及所述测试数据的特征向量,确定出所述类别的类别向量包括:
根据所述测试数据的特征向量分别确定出属于所述类别的各训练数据的权重;
分别计算属于所述类别的各训练数据的特征向量与对应的权重的乘积,将各乘积相加,将相加之和作为所述类别的类别向量。
6.根据权利要求5所述的方法,其中,所述根据所述测试数据的特征向量分别确定出属于所述类别的各训练数据的权重包括:
针对任一属于所述类别的训练数据,分别计算所述测试数据的特征向量与所述训练数据的特征向量之间的余弦相似度,将所述余弦相似度进行预定处理后作为所述训练数据的权重。
7.根据权利要求1所述的方法,其中,所述根据所述测试数据的特征向量及各类别的类别向量,确定出与所述测试数据相匹配的类别包括:
针对任一类别,分别将所述类别的类别向量与所述测试数据的特征向量组成向量对;
分别获取各向量对的匹配评分,将评分最高的向量对中的类别向量对应的类别作为与所述测试数据相匹配的类别。
8.一种类别识别方法,包括:
构造元学习测试任务,所述元学习测试任务中包括由已标注类别的数据组成的支撑集以及由待处理的数据组成的样本集;
针对所述元学习测试任务,利用按照权利要求1-7中任一项所述的方法获取到的识别模型,确定出所述待处理的数据所属的类别。
9.一种识别模型获取装置,包括:获取模块及训练模块;
所述获取模块,用于获取已标注类别的小样本数...
【专利技术属性】
技术研发人员:郭洪杰,焦振宇,孙叔琦,孙珂,李婷婷,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。