一种用于轻量级网络的知识蒸馏热启动训练方法和系统技术方案

技术编号：39009321 阅读：14 留言：0更新日期：2023-10-07 10:40

本发明专利技术提供一种用于轻量级网络的知识蒸馏热启动训练方法和系统，该方法包括获取至少一个随机初始化的轻量级网络模型；将低分辨率图像和对应高分辨率图像作为一对训练样本，基于多个训练样本获取训练样本集合；将训练样本集合中的低分辨率图像输入轻量级网络模型，训练轻量级网络模型，获得第一预训练网络模型；将第一预训练网络模型的权重加载于轻量级网络模型，并保持训练的各项参数不变，基于训练样本集合，对轻量级网络模型进行一轮或多轮训练，获得第二预训练网络模型；将第二预训练网络模型的权重加载于轻量级网络模型，基于教师网络的监督，训练轻量级网络模型，获得第三预训练网络模型。训练网络模型。训练网络模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于轻量级网络的知识蒸馏热启动训练方法和系统

[0001]本说明书涉及人工智能
，特别涉及一种用于轻量级网络的知识蒸馏热启动训练方法和系统。

技术介绍

[0002]图像超分辨率技术是从相应的低分辨率图像生成高分辨率图像的技术，而轻量化图像超分辨率模型具有较高的计算效率和较少的参数量，使得其在图像超分辨率技术上得到广泛应用，但同时存在图像超分辨率效果不足等问题。研究者们通常使用网络剪枝、网络量化和知识蒸馏等方法基于教师网络的监督，提高轻量化图像超分辨率模型的性能。但由于教师网络与学生网络之间的表示空间等差异，会阻碍学生网络的训练，使得训练效果不佳。
[0003]因此，为了解决以上问题，希望提出一种用于轻量级网络的知识蒸馏热启动训练方法和系统。

技术实现思路

[0004]本说明书一个或多个实施例提供一种用于轻量级网络的知识蒸馏热启动训练方法。所述用于轻量级网络的知识蒸馏热启动训练方法包括：获取至少一个随机初始化的轻量级网络模型；将低分辨率图像和对应高分辨率图像作为一对训练样本，基于多个训练样本获取训练样本集合；将训练样本集合中的低分辨率图像输入所述轻量级网络模型，训练所述轻量级网络模型，获得第一预训练网络模型，基于L1损失函数调整所述轻量级网络模型的参数，直到输出数据与原始高分辨率图像数据的差距小于预设阈值；将所述第一预训练网络模型的权重加载于所述轻量级网络模型，并保持训练的各项参数不变，基于所述训练样本集合，对所述轻量级网络模型进行一轮或多轮训练，获得第二预训练网络模型，基于L1损失函...

【技术保护点】

【技术特征摘要】
1.一种用于轻量级网络的知识蒸馏热启动训练方法，其特征在于，所述方法包括：获取至少一个随机初始化的轻量级网络模型；将低分辨率图像和对应高分辨率图像作为一对训练样本，基于多个训练样本获取训练样本集合；将训练样本集合中的低分辨率图像输入所述轻量级网络模型，训练所述轻量级网络模型，基于L1损失函数调整所述轻量级网络模型的参数，直到输出数据与原始高分辨率图像数据的差距小于预设阈值，获得第一预训练网络模型；将所述第一预训练网络模型的权重加载于所述轻量级网络模型，并保持训练的各项参数不变，基于所述训练样本集合，对所述轻量级网络模型进行一轮或多轮训练，基于L1损失函数调整所述轻量级网络模型的参数，直到输出数据与原始高分辨率图像数据的差距小于预设阈值，获得第二预训练网络模型；将所述第二预训练网络模型的权重加载于所述轻量级网络模型，基于教师网络的监督，训练所述轻量级网络模型，基于混合损失函数调整所述轻量级网络模型的参数，直到输出数据与原始高分辨率图像数据及教师网络模型输出的高分辨率图像数据的差距小于预设阈值，获得第三预训练网络模型。2.根据权利要求1所述的方法，其特征在于，所述基于L1损失函数调整所述轻量级网络模型的参数包括：基于L1损失函数计算第二预训练网络模型输出的高分辨率图像与原始高分辨率图像的差距；基于所述差距调整第二预训练网络模型的各项参数，再进行训练；直到所述差距低于所述预设阈值，停止训练，得到训练好的第二预训练网络模型。3.根据权利要求1所述的方法，其特征在于，所述L1损失函数为：其中，p是一个像素点，P指图像块；N是块中像素p的数量，x(p)和y(p)分别表示模型输出的图像数据和原始高分辨率图像数据。4.根据权利要求1所述的方法，其特征在于，所述混合损失函数包括训练网络的输出数据与教师网络模型输出数据之间的损失函数以及训练网络模型的输出数据与原始高分辨率图像数据之间的损失函数。5.根据权利要求4所述的方法，其特征在于，所述训练网络的输出数据与教师网络模型输出数...

【专利技术属性】
技术研发人员：邵杰，雷敏，武鑫，梁爽，陈飞宇，许辉，赵磊，
申请(专利权)人：四川省人工智能研究院宜宾，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人