【技术实现步骤摘要】
基于课程知识蒸馏的耐噪声木薯叶病害分类方法及系统
[0001]本专利技术涉及知识蒸馏应用
,特别是一种基于课程知识蒸馏的耐噪声木薯叶病害分类方法
。
技术介绍
[0002]深度学习模型的训练需要大规模
、
高质量标注数据集的支持,缺乏足够标记数据的模型很容易产生过拟合现象
。
在农业领域,不同病害之间的特征相似,因此病害图像的标注需要标注人员拥有深厚的农学素养和经验
。
专家标注构建数据集的成本高
、
耗时长,而且无法保证标注同质性,难以满足模型训练的需求;这种情况必然导致标签制作的成本过高,难以匹配实际农业生产现状
。
为了满足大规模样本标注的实际需求,“众包”标注成为一种主流方式,即通过借助众多人员进行样本标注来获得相应标签;然而,这种标注方式获得的样本标签往往会包含相当比例的错误标签,即标签噪声
。
另外,使用半监督学习算法或无监督学习算法进行机器标注的方法也易受低质量样本和再训练的影响,生成的伪标签仍然不准确
。
以上原因产生的标注噪音均影响模型的鲁棒性和泛化性,进而降低其性能
。
[0003]为了缓解标注噪声问题的影响,许多研究提出调整损失函数
、
添加正则项或特殊的训练策略等方法,以消除标注噪声对模型的负面作用,但这些方法依赖于准确的样本估计
。
知识蒸馏方法利用已经训练好的高性能大模型来指导轻量级模型的训练,教师模型作为辅助模型向学 ...
【技术保护点】
【技术特征摘要】
1.
一种基于课程知识蒸馏的耐噪声木薯叶病害系统方法,其特征在于,包括以下内容:步骤
S1、
基于知识蒸馏和课程学习使用数据集
D
训练得到训练好的学生模型
S
;包括以下具体处理流程:步骤
S11、
组建木薯叶病害数据作为带噪数据集
D
;步骤
S12、
构建训练调度器,使用教师模型
T
作为难度测量器,在其中输入数据集
D
,得到样本难度分数,然后,使用正则器确定每轮训练时选择的样本比例及权重,选取样本形成训练子集
D
m
;步骤
S13、
构建自适应权重模块,自适应调整教师模型
T
对学生模型
S
的知识转移比重
ω
,采用训练子集
D
m
训练得到本轮训练的学生模型
S
;步骤
S14、
反复执行步骤
S12
‑
步骤
S13
操作,直到目标迭代次数训练结束或模型趋于收敛,输出训练好的学生模型
S
;步骤
S2、
采用训练好的学生模型
S
对待分类木薯叶病害图像数据集进行分类;该图像数据集包括5个类别图像,分别为木薯细菌性枯萎病
、
木薯褐条病
、
木薯绿斑驳病和木薯花叶病的四种病害图像与健康木薯图像
。2.
根据权利要求1所述的一种基于课程知识蒸馏的耐噪声木薯叶病害分类方法,其特征在于:所述步骤
S1
中,训练调度器具体处理流程如下:
(1)
在开始阶段,将原始数据集
D
输入教师模型
T
得到样本难度分数
l
,选取难度低于分数的样本形成第一个训练子集
D1;
(2)
在第
m
个阶段,将数据集
D
输入难度测量器
T
得到样本难度分数
l
,选取难度低于分数
λ2的样本形成第
m
个训练子集
D
m
;其中,
D1∪D2∪
…
∪D
m
‑1=
D
m
;根据当前批次计算并更新学习速度
λ
;
(3)
反复进行上述步骤
(1)
及
(2)
,直到训练结束或模型趋于收敛
。3.
根据权利要求2所述的一种基于课程知识蒸馏的耐噪声木薯叶病害分类方法,其特征在于:所述步骤
S1
中,难度分数
l
通过样本交叉熵损失计算,具体计算公式如下,式中,
y
表示样本的真实标签,表示权重;通过正则器确定每轮训练时选择的样本比例及权重
v
*
,权重
v
*
具体计算公式如下,式中,
k
为控制样本权重强度的超参数
(k>0)
,
λ
表示学习速度
。4.
根据权利要求1所述的一种基于课程知识蒸馏的耐噪声木薯叶病害分类方法,其特征在于:所述步骤
S1
中,知识转移比重
ω
的取值使用每轮训练阶段的验证集精度作为模型差距的度量;在第
e
轮训练中,学生模型的验证集精度为
A
S
,教师模型的验证集精度为
A
T
,加权权重
ω
的计算公式如下:
式中,
γ
为控制知识蒸馏比重逐渐自动...
【专利技术属性】
技术研发人员:宋玲,曹勉,陈燕,陈宁江,张锦雄,韦紫君,赖宇斌,
申请(专利权)人:广西大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。