一种基于数据保护的图像增量学习方法技术

技术编号：26792683 阅读：23 留言：0更新日期：2020-12-22 17:08

本发明专利技术提供一种基于数据保护的图像增量学习方法，该方法以深度卷积神经网络ResNet为基础，充分利用外部海量图像的信息，对其进行采样并加入训练过程，来缓解新旧样本不均衡所带来的偏差和灾难性遗忘，外部数据即采即用，训练后直接丢弃，不占用存储空间。同时加入针对于各个任务阶段的输出，提取关于任务的特征，提高模型的性能表现。本发明专利技术所提出的增量学习方法突破了传统方法的限制，能够灵活广泛地适应多种实际场景的需求，在计算机视觉领域具有重要的研究和应用价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据保护的图像增量学习方法
本专利技术涉及计算机视觉技术和增量学习方法领域，更具体地，涉及一种基于数据保护的图像增量学习方法。
技术介绍
近年来，随着深度学习和神经网络的不断发展，深度卷积神经网络已经广泛应用于解决图像识别任务。其中包括目前非常流行的AlexNet,VGGNet,ResNet等，在各类大规模的图像识别比赛中取得了出色表现，并成为许多计算机视觉相关研究和应用的基础网络架构。训练这些包含大量参数的深度模型，通常需要大量且均衡的真实图像数据进行联合训练，从而使得复杂模型能够很好的拟合数据。在现实场景中，任务的规模通常随时间增长，而过去的训练数据由于存储有限或涉及隐私的原因，在后续的训练中不可重用。若仅使用新任务的数据训练已有的模型，将导致灾难性遗忘，即模型在过去任务上的性能会急剧下降。而增量学习正是为了解决这一问题，从而达到在一系列的学习任务中，模型能有更为均衡的表现。近年来，相关算法的研究也取得了较大的进展，典型的包括EWC(ElasticWeightConsolidation),LwF(LearningwithoutForgetting),iCaRL(IncrementalClassifierandRepresentationLearning),EEIL(End-to-EndIncrementalLearning)等。其中EWC通过统计信息来衡量模型参数的重要性，通过对较为重要的参数的改变加以限制，来缓解灾难性遗忘；LwF在微调模型的基础上，首先使用了知识蒸馏来提取过去模型中的信...

【技术保护点】
1.一种基于数据保护的图像增量学习方法，其特征在于，包括以下步骤：/nS1：构造以ResNet网络为原型的图像特征提取器，然后添加全连接的任务预测层和图像分类层作为整体的网络架构；/nS2：为每个阶段的增量数据训练单独的图像分类模型，其中图像分类损失使用交叉熵函数，任务预测损失使用均方误差函数，使用SGD优化器训练网络；/nS3：对于不存储任何先前类别数据的场景，为避免灾难性遗忘和模型对于当前类别的预测偏向，使用先前模型对大量可用的外部数据进行采样；/nS4：使用采样数据以及当前类别的训练数据，对新旧两个模型进行融合，使用知识蒸馏引入KL相对熵函数，训练可识别当前所有类别的模型；/nS5：对于每一增量阶段，重复S2至S4步骤，评估模型时采用任务预测层和图像分类层输出结合的方式预测最终分类。/n

【技术特征摘要】
1.一种基于数据保护的图像增量学习方法，其特征在于，包括以下步骤：
S1：构造以ResNet网络为原型的图像特征提取器，然后添加全连接的任务预测层和图像分类层作为整体的网络架构；
S2：为每个阶段的增量数据训练单独的图像分类模型，其中图像分类损失使用交叉熵函数，任务预测损失使用均方误差函数，使用SGD优化器训练网络；
S3：对于不存储任何先前类别数据的场景，为避免灾难性遗忘和模型对于当前类别的预测偏向，使用先前模型对大量可用的外部数据进行采样；
S4：使用采样数据以及当前类别的训练数据，对新旧两个模型进行融合，使用知识蒸馏引入KL相对熵函数，训练可识别当前所有类别的模型；
S5：对于每一增量阶段，重复S2至S4步骤，评估模型时采用任务预测层和图像分类层输出结合的方式预测最终分类。

2.根据权利要求1所述的基于数据保护的图像增量学习方法，其特征在于，所述步骤S1的具体过程是：
S11：根据数据集中图像的复杂程度，包括尺寸和种类等，选择不同深度的ResNet网络进行特征提取；
S12：图像通过深度的卷积层后进行平均池化，得到一个低维的实数特征向量，在其后分别添加全连接的任务预测层和图像分类层，用于预测任务阶段以及具体的图像类别。

3.根据权利要求2所述的基于数据保护的图像增量学习方法，其特征在于，所述步骤S2的具体过程是：
S21：将训练集中的数据D1关于图像分类层的输出通过softmax层，即根据原始的网络输出logits之间的相对大小关系，映射为关于各类别的预测概率，使用交叉熵函数作为图像分类损失，公式如下：

其中x表示当前类别的输入图像,y表示对应类别0/1标签，θ为模型参数；将训练集数据及外部数据D2关于任务预测层的输出通过sigmoid函数，映射为是否为当前任务的判断概率，使用均方误差函数作为任务预测损失，公式如下：

其中yt表示对应任务的0/1标签，即内部的训练数据标签为1，外部采样数据标签为0；
S22：在此步骤中的外部数据随机选取OOD图像；若可选的增加置信度校准损失来训练模型，即外部数据在图像分类层的输出值越平均则损失越小，可使得模型在当前任务中的表现有小幅度提升；
S23：使用SGD优化器训练关于当前任务的图像分类模型，学习率随训练epoch的增大而逐渐降低，同时加入关于模型参数的正则化项来防止过拟合，增强模型的泛化能力。

4.根据权利要求3所述的基于数据保护的图像增量学习方法，其特征在于，所述步骤S3的具体过程是：
S31：由于不存储任何过去的训练数据，为了提取已学习到的旧类别的相关知识，使用训练好的关于过去任务的模型对外部数据进行采样，在海量的外部图像中获取与每个旧类别输出相似的部分样本；
S32：在此步骤中仍随机选取一定比例的OOD图像，与S31中选取的样本共同组成...

【专利技术属性】
技术研发人员：王文宇，赖韩江，潘炎，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人