分类模型的智能处理方法、装置、电子设备及介质制造方法及图纸

技术编号:29256072 阅读:35 留言:0更新日期:2021-07-13 17:27
本发明专利技术实施例公开了一种分类模型的智能处理方法、装置、电子设备及存储介质。所述方法包括:确定包括小样本分类识别任务所需的支持集与查询集的目标样本;在图像分类模型的第一分支网络中对目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量;依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节,用于得到新的图像分类模型。采用本申请方案,在小样本分类识别任务中,通过引入自然语言特征来指引图像特征的快速学习,实现利用类别标签本身的自然语言特征增强小样本情况下的分类识别任务的学习效果。

【技术实现步骤摘要】
分类模型的智能处理方法、装置、电子设备及介质
本专利技术实施例涉及深度学习
,尤其涉及一种分类模型的智能处理方法、装置、电子设备及介质。
技术介绍
鉴于深度学习需要大量训练样本,训练数据量在数万至数百万之多,如此庞大的训练数据在标注成本和训练效率上是不容忽视的问题,并且每次重新训练一个任务将花费数小时至数天时间,对于模型实时部署和更新极为不利,因此开始衍生出对小样本深度学习的探索。相关技术中,实现小样本深度学习的方式主要包括以下:数据增强、迁移学习以及元学习,但是上述方式在小样本深度学习中均会出现各种各样的问题,例如迁移学习后会出现对原任务灾难性遗忘问题,而元学习得到的模型的准确率上有待提高等。因此,如何提高图像分类模型的准确性变得尤为重要。
技术实现思路
本专利技术实施例中提供了一种分类模型的智能处理方法、装置、电子设备及介质,以实现利用类别本身的自然语言特征,增强小样本情况下的学习效果。第一方面,本专利技术实施例中提供了一种分类模型的智能处理方法,包括:确定包括小样本分类识别任务所需的支持集与查询集的目标样本;在图像分类模型的第一分支网络中对目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量;依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节,用于得到新的图像分类模型。第二方面,本专利技术实施例中还提供了一种分类模型的智能处理装置,包括:样本确定模块,用于确定包括小样本分类识别任务所需的支持集与查询集的目标样本;嵌入向量确定模块,用于在图像分类模型的第一分支网络中对目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量;图像分类模型优化模块,用于依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节,用于得到新的图像分类模型。第三方面,本专利技术实施例中还提供了一种电子设备,包括:一个或多个处理装置;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如本专利技术任意实施例中提供的所述分类模型的智能处理方法。第四方面,本专利技术实施例中还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理装置执行时实现如本专利技术任意实施例中提供的所述分类模型的智能处理方法。本专利技术实施例中提供了一种分类模型的智能处理方法,在图像分类模型中配置用于对目标样本进行编码的第一分支网络和用于对目标样本的类别标签单词进行自然语言处理的第二分支网络,通过第一分支网络对目标样本进行编码得到第一嵌入向量和通过第二分支网络对目标样本的类别标签单词进行自然语言处理得到第二嵌入向量,进而可依据第一嵌入向量与第二嵌入向量对图像分类模型中参与训练的可训练参数进行优化调节。采用本申请方案,在小样本图片分类识别任务中,添加结合自然语言特征的分支结构,通过引入自然语言特征来指引图像特征的快速学习以及使自然语言特征能够根据图像特征进行微调,实现利用类别标签本身的自然语言特征,增强小样本情况下的分类识别任务的学习效果。上述
技术实现思路
仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例中提供的一种分类模型的智能处理方法的流程图;图2是本专利技术实施例中提供的一种图像分类模型的网络结构设计图;图3本专利技术实施例中提供的另一种分类模型的智能处理方法的流程图;图4是本专利技术实施例中提供的图像分类模型中第二分支网络的结构图;图5是本专利技术实施例中提供的一种分类模型的智能处理装置的结构框图图6是本专利技术实施例中提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。在更加详细地讨论示例性实施例之前,应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作(或步骤)可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。下面通过以下各个实施例及其可选方案对本申请中提供的分类模型的智能处理方法、装置、电子设备及存储介质进行详细阐述。图1是本专利技术实施例中提供的一种分类模型的智能处理方法的流程图。本专利技术实施例可适用于利用小样本学习对图像分类模型进行训练的情况。该方法可由分类模型的智能处理装置来执行,该装置可以采用软件和/或硬件的方式实现,并集成在任何具有网络通信功能的电子设备上。如图1所示,本申请实施例中提供的分类模型的智能处理方法,可包括以下步骤:S110、确定包括小样本分类识别任务所需的支持集与查询集的目标样本。通常人类仅需提供极少量样本就可学习到关键信息,例如小孩仅看一张小鹿的图片就可在动物园内寻找到正确的动物,而相比之下当前深度学习技术则仍有很大的提升空间,这就给小样本学习的探索提供了条件。对于小样本学习的思路,需要确定小样本分类识别任务所需的支持集与查询集,便于利用支持集和查询集特性之间的语义相关性来突显分类对象。在本实施例的一种可选方案中,确定包括小样本分类识别任务所需的支持集与查询集的目标样本,可包括以下步骤A1-A2:步骤A1、从训练集涉及的类别中选取至少两个类别,并在至少两个类别的样本中每类选取第一数量的样本,得到小样本分类识别任务所需的支持集。步骤A2、从至少两个类别样本的剩余样本中每类选取第二数量的带标注样本,得到小样本分类识别任务所需的查询集。将所有样本按照类别划分为训练集和测试集,在对图像分类模型进行训练时从训练集涉及的类别中抽取N个类别,并在N类样本中每类抽取K个样本,抽取得到的N*K个样本就形成支持集S(即S={(x1,y1),…,(xN*K,yN*K)},其中x表示样本,y表示标签)。并且,从这N类样本的剩余样本中每类抽取T个样本,将抽取的N*T个样本组成查询集Q。这样通过得到的支持集S与查询集Q就可构成一个小样本分类识别任务,每次对图像分类模型进行训练时重复上本文档来自技高网
...

【技术保护点】
1.一种分类模型的智能处理方法,其特征在于,包括:/n确定包括小样本分类识别任务所需的支持集与查询集的目标样本;/n在图像分类模型的第一分支网络中对所述目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量;/n依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节,用于得到新的图像分类模型。/n

【技术特征摘要】
1.一种分类模型的智能处理方法,其特征在于,包括:
确定包括小样本分类识别任务所需的支持集与查询集的目标样本;
在图像分类模型的第一分支网络中对所述目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量;
依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节,用于得到新的图像分类模型。


2.根据权利要求1所述的方法,其特征在于,确定包括小样本分类识别任务所需的支持集与查询集的目标样本,包括:
从训练集涉及的类别中选取至少两个类别,并在至少两个类别的样本中每类选取第一数量的样本,得到小样本分类识别任务所需的支持集;
从至少两个类别样本的剩余样本中每类选取第二数量的带标注样本,得到小样本分类识别任务所需的查询集。


3.根据权利要求1所述的方法,其特征在于,所述图像分类模型的第一分支网络中包括用于对样本进行编码处理的编码器Encoder,且所述编码器Encoder中包括可训练参数。


4.根据权利要求1所述的方法,其特征在于,所述图像分类模型的第二分支网络中包括用于进行自然语言处理的预处理模块,所述预处理模块将单词构成的类别标签进行向量矩阵转化,并对转化结果采用K-V矩阵进行表示,所述K-V矩阵为可训练参数。


5.根据权利要求1所述的方法,其特征在于,所述图像分类模型的第一分支网络与两个全连接层FC连接,且全连接层FC中包括可训练参数。


6.根据权利要求1所述的方法,其特征在于,依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节,包括:
通过两个全连接层FC层对所述第一分支网络输出的第一嵌入向量进行处理得到第三嵌入向量,以实现从图像特征向自然语言特征的回归学习;
依据所述第一嵌入向量与所述目标样本的独热编码类别标签确定所述第一分支网络的损失值;以及,依据所述第二嵌入向量与...

【专利技术属性】
技术研发人员:周迪曹广徐爱华
申请(专利权)人:浙江宇视科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1