分类模型的智能处理方法、装置、电子设备及介质制造方法及图纸

技术编号：29256072 阅读：36 留言：0更新日期：2021-07-13 17:27

本发明专利技术实施例公开了一种分类模型的智能处理方法、装置、电子设备及存储介质。所述方法包括：确定包括小样本分类识别任务所需的支持集与查询集的目标样本；在图像分类模型的第一分支网络中对目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量；依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节，用于得到新的图像分类模型。采用本申请方案，在小样本分类识别任务中，通过引入自然语言特征来指引图像特征的快速学习，实现利用类别标签本身的自然语言特征增强小样本情况下的分类识别任务的学习效果。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型的智能处理方法、装置、电子设备及介质
本专利技术实施例涉及深度学习
，尤其涉及一种分类模型的智能处理方法、装置、电子设备及介质。
技术介绍
鉴于深度学习需要大量训练样本，训练数据量在数万至数百万之多，如此庞大的训练数据在标注成本和训练效率上是不容忽视的问题，并且每次重新训练一个任务将花费数小时至数天时间，对于模型实时部署和更新极为不利，因此开始衍生出对小样本深度学习的探索。相关技术中，实现小样本深度学习的方式主要包括以下：数据增强、迁移学习以及元学习，但是上述方式在小样本深度学习中均会出现各种各样的问题，例如迁移学习后会出现对原任务灾难性遗忘问题，而元学习得到的模型的准确率上有待提高等。因此，如何提高图像分类模型的准确性变得尤为重要。
技术实现思路
本专利技术实施例中提供了一种分类模型的智能处理方法、装置、电子设备及介质，以实现利用类别本身的自然语言特征，增强小样本情况下的学习效果。第一方面，本专利技术实施例中提供了一种分类模型的智能处理方法，包括：确定包括小样本分类识别任务所需的支持集与查询集的目标样本；在图像分类模型的第一分支网络中对目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量；依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节，用于得到新的图像分类模型。第二方面，本专利技术实施例中还提供了一种分类模型的智能处理装置，包括：...

【技术保护点】
1.一种分类模型的智能处理方法，其特征在于，包括：/n确定包括小样本分类识别任务所需的支持集与查询集的目标样本；/n在图像分类模型的第一分支网络中对所述目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量；/n依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节，用于得到新的图像分类模型。/n

【技术特征摘要】
1.一种分类模型的智能处理方法，其特征在于，包括：
确定包括小样本分类识别任务所需的支持集与查询集的目标样本；
在图像分类模型的第一分支网络中对所述目标样本进行编码得到第一嵌入向量以及在图像分类模型的第二分支网络中对所述目标样本的类别标签单词进行自然语言处理得到第二嵌入向量；
依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节，用于得到新的图像分类模型。

2.根据权利要求1所述的方法，其特征在于，确定包括小样本分类识别任务所需的支持集与查询集的目标样本，包括：
从训练集涉及的类别中选取至少两个类别，并在至少两个类别的样本中每类选取第一数量的样本，得到小样本分类识别任务所需的支持集；
从至少两个类别样本的剩余样本中每类选取第二数量的带标注样本，得到小样本分类识别任务所需的查询集。

3.根据权利要求1所述的方法，其特征在于，所述图像分类模型的第一分支网络中包括用于对样本进行编码处理的编码器Encoder，且所述编码器Encoder中包括可训练参数。

4.根据权利要求1所述的方法，其特征在于，所述图像分类模型的第二分支网络中包括用于进行自然语言处理的预处理模块，所述预处理模块将单词构成的类别标签进行向量矩阵转化，并对转化结果采用K-V矩阵进行表示，所述K-V矩阵为可训练参数。

5.根据权利要求1所述的方法，其特征在于，所述图像分类模型的第一分支网络与两个全连接层FC连接，且全连接层FC中包括可训练参数。

6.根据权利要求1所述的方法，其特征在于，依据所述第一嵌入向量与第二嵌入向量对所述图像分类模型中参与训练的可训练参数进行优化调节，包括：
通过两个全连接层FC层对所述第一分支网络输出的第一嵌入向量进行处理得到第三嵌入向量，以实现从图像特征向自然语言特征的回归学习；
依据所述第一嵌入向量与所述目标样本的独热编码类别标签确定所述第一分支网络的损失值；以及，依据所述第二嵌入向量与...

【专利技术属性】
技术研发人员：周迪，曹广，徐爱华，
申请(专利权)人：浙江宇视科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人