【技术实现步骤摘要】
小样本学习方法、装置、电子设备和存储介质
本专利技术实施例涉及机器学习
,尤其涉及一种小样本学习方法、装置、电子设备和存储介质。
技术介绍
由于常规的深度学习算法需要大量训练样本集才能实现较好的效果,限制了它在许多领域的应用。目前,针对小样本训练集的特征学习,常用的技术手段有数据增强、迁移学习、元学习等,但是这些方法仍存在跨领域任务表现差、出现灾难性遗忘等缺点,整体而言在小样本训练集下深度学习的效果并不理想。
技术实现思路
本专利技术实施例提供一种小样本学习方法、装置、电子设备和存储介质,以提高小样本情况下的学习效果。第一方面,本专利技术实施例提供了一种小样本学习方法,包括:根据图像表示模型对图像训练样本集进行编码,得到由每个图像训练样本的图像向量表示构成的图像矩阵;根据标签预处理模型对所述图像训练样本集的标签进行编码,得到由每个图像训练样本标签的标签向量表示构成的标签矩阵;根据所述图像矩阵和所述标签矩阵的损失值进行反向传播,以对所述图像表示模型和所述标签预处 ...
【技术保护点】
1.一种小样本学习方法,其特征在于,包括:/n根据图像表示模型对图像训练样本集进行编码,得到由每个图像训练样本的图像向量表示构成的图像矩阵;/n根据标签预处理模型对所述图像训练样本集的标签进行编码,得到由每个图像训练样本标签的标签向量表示构成的标签矩阵;/n根据所述图像矩阵和所述标签矩阵的损失值进行反向传播,以对所述图像表示模型和所述标签预处理模型进行参数优化,得到训练完成的图像表示模型和标签预处理模型。/n
【技术特征摘要】
1.一种小样本学习方法,其特征在于,包括:
根据图像表示模型对图像训练样本集进行编码,得到由每个图像训练样本的图像向量表示构成的图像矩阵;
根据标签预处理模型对所述图像训练样本集的标签进行编码,得到由每个图像训练样本标签的标签向量表示构成的标签矩阵;
根据所述图像矩阵和所述标签矩阵的损失值进行反向传播,以对所述图像表示模型和所述标签预处理模型进行参数优化,得到训练完成的图像表示模型和标签预处理模型。
2.根据权利要求1所述的方法,其特征在于,所述图像训练样本集为完整数据集的子集;
相应的,根据标签预处理模型对所述图像训练样本集的标签进行编码,得到由每个图像训练样本标签的标签向量表示构成的标签矩阵,包括:
确定所述完整数据集的完整标签信息;
根据所述完整标签信息和原始词向量模型,确定完整词向量表示;
根据所述图像训练样本集的标签和所述完整标签信息,确定训练样本标签信息;
根据所述训练样本标签信息和所述完整词向量表示,确定由每个图像训练样本标签的标签向量表示构成的标签矩阵。
3.根据权利要求2所述的方法,其特征在于,在得到训练完成的标签预处理模型之后,还包括:
根据所述训练完成的标签预处理模型中的完整词向量表示对所述原始词向量模型进行优化更新。
4.根据权利要求1所述的方法,其特征在于,在根据所述图像矩阵和所述标签矩阵的损失值进行反向传播之前,还包括:
对所述图像矩阵和所述标签矩阵进行维度一致化处理和归一化处理,得到标准图像矩阵和标准标签矩阵;
相应的,根据所述图像矩阵和所述标签矩阵的损失值进行反向传播,包括:
根据所述标准图像矩阵和所述标准标签矩阵的损失值进行反向传播。
5.根据权利要求1所述的方法,其特征在于,根据所述图像矩阵和所述标签矩阵的损失值进行反向传播,包括:
基于预先设置的损失函数,计算所述图像矩阵和所述标签矩阵的损失值;
根据所述损失值进行反向传播;
其中,预先设置的损失函数用如下公式进行表示:
;
其中,根...
【专利技术属性】
技术研发人员:周迪,曹广,徐爱华,王勋,何斌,汪鹏君,王建新,章坚武,骆建军,樊凌雁,肖海林,鲍虎军,
申请(专利权)人:浙江宇视科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。