一种用于移动终端图像分割模型训练方法和装置制造方法及图纸

技术编号:33502955 阅读:18 留言:0更新日期:2022-05-19 01:13
本发明专利技术实施例提供了一种用于移动终端图像分割模型训练方法和装置;包括:获取图像分割训练样本集,初始模型,助教模型以及学生模型;采用所述第一精标注数据训练所述初始模型,得到教师模型,所述教师模型用于标注所述图像分割训练样本集;采用所述教师模型标注所述粗标注数据,生成第二精标注数据和难例数据;结合所述第二精标注数据、难例数据以及所述第一精标注数据得到全量数据集合;采用所述全量数据集合训练所述助教模型;基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生模型,得到图像分割模型,所述图像分割模型用于在移动终端进行图像分割处理。利用大模型引导小模型循序渐进进行训练,从而实现速度、轻量化和精度的兼顾。轻量化和精度的兼顾。轻量化和精度的兼顾。

【技术实现步骤摘要】
一种用于移动终端图像分割模型训练方法和装置


[0001]本专利技术涉及图像处理
,特别是涉及一种用于移动终端图像分割模型训练方法、一种用于移动终端图像分割模型训练装置、一种电子设备个一种存储介质。

技术介绍

[0002]图像分割广泛应用于多种场景,其中天空分割则多用于图像美化、去雾及后期制作等方向。传统的天空分割采用高斯滤波或边缘提取算子对图像进行处理,耗时长、计算量大难以应用于实时领域。而利用深度学习训练的神经网络模型通常参数量较大,效果虽好但是无法部署在手机等移动终端,通常需要网络传输至云端服务器进行处理,在极端条件下缺少鲁棒性,成本也偏高。

技术实现思路

[0003]鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种用于移动终端图像分割模型训练方法、一种用于移动终端图像分割模型训练装置、一种电子设备和一种存储介质。
[0004]为了解决上述问题,本专利技术实施例公开了一种用于移动终端图像分割模型训练方法,包括:获取图像分割训练样本集,初始模型,助教模型以及学生模型;所述图像分割训练样本集包括粗标注数据和第一精标注数据;所述初始模型的参数量大于所述助教模型的参数量,所述助教模型的参数量大于所述学生模型的参数量;采用所述第一精标注数据训练所述初始模型,得到教师模型,所述教师模型用于标注所述图像分割训练样本集;采用所述教师模型标注所述粗标注数据,生成第二精标注数据和难例数据;结合所述第二精标注数据、所述难例数据以及所述第一精标注数据得到全量数据集合;采用所述全量数据集合训练所述助教模型;基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生模型,得到图像分割模型,所述图像分割模型用于在移动终端进行图像分割处理。
[0005]可选地,所述结合所述第二精标注数据、所述难例数据以及所述第一精标注数据得到全量数据集合的步骤包括:将所述第一精标注数据与所述第二精标注数据结合得到精标注数据集合;在所述精标注数据集合上增加所述难例数据生成全量数据集合。
[0006]可选地,所述采用所述全量数据集合训练所述助教模型的步骤包括:针对所述全量数据集合进行标注;采用标注后的全量数据集合训练所述助教模型。
[0007]可选地,所述基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生
模型,得到图像分割模型的步骤包括:采用所述助教模型在所述全量数据集合上,对所述学生模型进行蒸馏训练;采用所述精标注数据集合对蒸馏训练后的学生模型进行训练,得到预训练模型;采用预设的多种监督策略训练所述预训练模型,生成图像分割模型。
[0008]可选地,所述采用所述助教模型在所述全量数据集合上,对所述学生模型进行蒸馏训练的步骤包括:将所述助教模型作为所述蒸馏训练的监督模型,采用全量数据集合对所述学生模型进行蒸馏。
[0009]可选地,所述采用所述精标注数据集合对蒸馏训练后的学生模型进行训练,得到预训练模型的步骤包括:采用所述精标注数据集合对蒸馏训练后的学生模型进行训练;当所述蒸馏训练后的学生模型输出的平均损失恒定时,降低所述蒸馏训练后的学生模型的损失约束权重,采用所述精标注数据集合对降低损失约束权重的学生模型进行训练,得到预训练模型。
[0010]可选地,所述监督策略包括损失函数,所述采用预设的多种监督策略训练所述预训练模型,生成图像分割模型的步骤包括:采用多种损失函数逐一训练所述预训练模型,生成图像分割模型。
[0011]本专利技术实施例还公开了一种用于移动终端图像分割模型训练装置,包括:获取模块,用于获取图像分割训练样本集,初始模型,助教模型以及学生模型;所述图像分割训练样本集包括粗标注数据和第一精标注数据;所述初始模型的参数量大于所述助教模型的参数量,所述助教模型的参数量大于所述学生模型的参数量;第一训练模块,用于采用所述第一精标注数据训练所述初始模型,得到教师模型,所述教师模型用于标注所述图像分割训练样本集;标注模块,用于采用所述教师模型标注所述粗标注数据,生成第二精标注数据和难例数据;结合模块,用于结合所述第二精标注数据、所述难例数据以及所述第一精标注数据得到全量数据集合;第二训练模块,用于采用所述全量数据集合训练所述助教模型;第三训练模块,用于基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生模型,得到图像分割模型,所述图像分割模型用于在移动终端进行图像分割处理。
[0012]本专利技术实施例还公开了一种电子设备,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的用于移动终端图像分割模型训练方法的步骤。
[0013]本专利技术实施例还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的用于移动终端图像分割模型训练方法的步骤。
[0014]本专利技术实施例包括以下优点:本专利技术实施例通过获取图像分割训练样本集,初始模型,助教模型以及学生模型;所述图像分割训练样本集包括粗标注数据和第一精标注数据;所述初始模型的参数量大于
所述助教模型的参数量,所述助教模型的参数量大于所述学生模型的参数量;采用所述第一精标注数据训练所述初始模型,得到教师模型,所述教师模型用于标注所述图像分割训练样本集;采用所述教师模型标注所述粗标注数据,生成第二精标注数据和难例数据;结合所述第二精标注数据、所述难例数据以及所述第一精标注数据得到全量数据集合;采用所述全量数据集合训练所述助教模型;基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生模型,得到图像分割模型,所述图像分割模型用于在移动终端进行图像分割处理。通过全量数据训练初始模型得到教师模型,再通过教师模型训练助教模型,最后再利用助教模型蒸馏训练学生模型,通过大模型引导小模型循序渐进进行训练,在保留精度的前提下,神经网络模型不断变小,从而实现精度与速度的兼顾。
附图说明
[0015]图1是本专利技术的一种用于移动终端图像分割模型训练方法实施例的步骤流程图;图2是本专利技术的一种用于移动终端图像分割模型训练方法实施例的步骤流程图;图3是本专利技术的一种用于移动终端图像分割模型训练装置实施例的结构框图。
具体实施方式
[0016]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0017]参照图1,示出了本专利技术的一种用于移动终端图像分割模型训练方法实施例的步骤流程图,具体可以包括如下步骤:步骤101,获取图像分割训练样本集,初始模型,助教模型以及学生模型;所述图像分割训练样本集包括粗标注数据和第一精标注数据;所述初始模型的参数量大于所述助教模型的参数量,所述助教模型的参数量大于所述学生模型的参数量;在实际用于中,可以从指定地址获取图像分割训练样本集,初始模型,助教模型以及学生模型。其中,所述指定地址可以是本地存储地址,也可以是第三方存储地址,本专利技术实施例对此不作具体限定。
[0018本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于移动终端图像分割模型训练方法,其特征在于,包括:获取图像分割训练样本集,初始模型,助教模型以及学生模型;所述图像分割训练样本集包括粗标注数据和第一精标注数据;所述初始模型的参数量大于所述助教模型的参数量,所述助教模型的参数量大于所述学生模型的参数量;采用所述第一精标注数据训练所述初始模型,得到教师模型,所述教师模型用于标注所述图像分割训练样本集;采用所述教师模型标注所述粗标注数据,生成第二精标注数据和难例数据;结合所述第二精标注数据、所述难例数据以及所述第一精标注数据得到全量数据集合;采用所述全量数据集合训练所述助教模型;基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生模型,得到图像分割模型,所述图像分割模型用于在移动终端进行图像分割处理。2.根据权利要求1所述的方法,其特征在于,所述结合所述第二精标注数据、所述难例数据以及所述第一精标注数据得到全量数据集合的步骤包括:将所述第一精标注数据与所述第二精标注数据结合得到精标注数据集合;在所述精标注数据集合上增加所述难例数据生成全量数据集合。3.根据权利要求1所述的方法,其特征在于,所述采用所述全量数据集合训练所述助教模型的步骤包括:针对所述全量数据集合进行标注;采用标注后的全量数据集合训练所述助教模型。4.根据权利要求2所述的方法,其特征在于,所述基于所述全量数据集合,采用训练后的助教模型蒸馏训练所述学生模型,得到图像分割模型的步骤包括:采用所述助教模型在所述全量数据集合上,对所述学生模型进行蒸馏训练;采用所述精标注数据集合对蒸馏训练后的学生模型进行训练,得到预训练模型;采用预设的多种监督策略训练所述预训练模型,生成图像分割模型。5.根据权利要求4所述的方法,其特征在于,所述采用所述助教模型在所述全量数据集合上,对所述学生模型进行蒸馏训练的步骤包括:将所述助教模型作为所述蒸馏训练的监督模型,采用所述全量数据集合对所述学生模型进行蒸馏。6.根据权利要求4所述的方法,其特征在于,所述采用所述...

【专利技术属性】
技术研发人员:李博贤闫亚军见良王轶
申请(专利权)人:北京美摄网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1