小样本学习方法、装置、电子设备和存储介质制造方法及图纸

技术编号：28038423 阅读：35 留言：0更新日期：2021-04-09 23:21

本发明专利技术实施例公开了一种小样本学习方法、装置、电子设备和存储介质。该小样本学习方法包括：根据图像表示模型对图像训练样本集进行编码，得到由每个图像训练样本的图像向量表示构成的图像矩阵；根据标签预处理模型对图像训练样本集的标签进行编码，得到由每个图像训练样本标签的标签向量表示构成的标签矩阵；根据图像矩阵和标签矩阵的损失值进行反向传播，以对图像表示模型和标签预处理模型进行参数优化，得到训练完成的图像表示模型和标签预处理模型。实现了将自然语言任务中的知识引入进图像的特征识别任务中，实现不同任务知识的融合，进而加速在小样本数据集情况下对图像特征的学习，提高小样本数据集下图像特征学习的效率和准确率。

全部详细技术资料下载

【技术实现步骤摘要】
小样本学习方法、装置、电子设备和存储介质
本专利技术实施例涉及机器学习
，尤其涉及一种小样本学习方法、装置、电子设备和存储介质。
技术介绍
由于常规的深度学习算法需要大量训练样本集才能实现较好的效果，限制了它在许多领域的应用。目前，针对小样本训练集的特征学习，常用的技术手段有数据增强、迁移学习、元学习等，但是这些方法仍存在跨领域任务表现差、出现灾难性遗忘等缺点，整体而言在小样本训练集下深度学习的效果并不理想。
技术实现思路
本专利技术实施例提供一种小样本学习方法、装置、电子设备和存储介质，以提高小样本情况下的学习效果。第一方面，本专利技术实施例提供了一种小样本学习方法，包括：根据图像表示模型对图像训练样本集进行编码，得到由每个图像训练样本的图像向量表示构成的图像矩阵；根据标签预处理模型对所述图像训练样本集的标签进行编码，得到由每个图像训练样本标签的标签向量表示构成的标签矩阵；根据所述图像矩阵和所述标签矩阵的损失值进行反向传播，以对所述图像表示模型和所述标签预处...

【技术保护点】
1.一种小样本学习方法，其特征在于，包括：/n根据图像表示模型对图像训练样本集进行编码，得到由每个图像训练样本的图像向量表示构成的图像矩阵；/n根据标签预处理模型对所述图像训练样本集的标签进行编码，得到由每个图像训练样本标签的标签向量表示构成的标签矩阵；/n根据所述图像矩阵和所述标签矩阵的损失值进行反向传播，以对所述图像表示模型和所述标签预处理模型进行参数优化，得到训练完成的图像表示模型和标签预处理模型。/n

【技术特征摘要】
1.一种小样本学习方法，其特征在于，包括：
根据图像表示模型对图像训练样本集进行编码，得到由每个图像训练样本的图像向量表示构成的图像矩阵；
根据标签预处理模型对所述图像训练样本集的标签进行编码，得到由每个图像训练样本标签的标签向量表示构成的标签矩阵；
根据所述图像矩阵和所述标签矩阵的损失值进行反向传播，以对所述图像表示模型和所述标签预处理模型进行参数优化，得到训练完成的图像表示模型和标签预处理模型。

2.根据权利要求1所述的方法，其特征在于，所述图像训练样本集为完整数据集的子集；
相应的，根据标签预处理模型对所述图像训练样本集的标签进行编码，得到由每个图像训练样本标签的标签向量表示构成的标签矩阵，包括：
确定所述完整数据集的完整标签信息；
根据所述完整标签信息和原始词向量模型，确定完整词向量表示；
根据所述图像训练样本集的标签和所述完整标签信息，确定训练样本标签信息；
根据所述训练样本标签信息和所述完整词向量表示，确定由每个图像训练样本标签的标签向量表示构成的标签矩阵。

3.根据权利要求2所述的方法，其特征在于，在得到训练完成的标签预处理模型之后，还包括：
根据所述训练完成的标签预处理模型中的完整词向量表示对所述原始词向量模型进行优化更新。

4.根据权利要求1所述的方法，其特征在于，在根据所述图像矩阵和所述标签矩阵的损失值进行反向传播之前，还包括：
对所述图像矩阵和所述标签矩阵进行维度一致化处理和归一化处理，得到标准图像矩阵和标准标签矩阵；
相应的，根据所述图像矩阵和所述标签矩阵的损失值进行反向传播，包括：
根据所述标准图像矩阵和所述标准标签矩阵的损失值进行反向传播。

5.根据权利要求1所述的方法，其特征在于，根据所述图像矩阵和所述标签矩阵的损失值进行反向传播，包括：
基于预先设置的损失函数，计算所述图像矩阵和所述标签矩阵的损失值；
根据所述损失值进行反向传播；
其中，预先设置的损失函数用如下公式进行表示：

；
其中，根...

【专利技术属性】
技术研发人员：周迪，曹广，徐爱华，王勋，何斌，汪鹏君，王建新，章坚武，骆建军，樊凌雁，肖海林，鲍虎军，
申请(专利权)人：浙江宇视科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人