【技术实现步骤摘要】
一种基于迁移模型的小样本茶叶图像分类方法
[0001]本专利技术涉及一种基于迁移模型的小样本茶叶图像分类方法,属于计算机视觉领域。
技术介绍
[0002]茶叶的种植与加工源于中国,是一种由茶树的叶子和芽炒制的饮品。芽叶因其具有多种有益成分以及保健功效,从而逐渐深受国内外人们的广泛喜爱。然而,我国茶叶的种类繁多,每种茶叶的品饮方式不相同,不同品质的茶叶的价格与功效也不尽相同。目前,在茶叶的生产和销售过程中,茶叶的种类和品质主要依靠专业人员根据感管进行评定,这种方法具有人工因素高、人工劳动成本高、识别效率低的缺点,不利于茶叶的生成和销售。
[0003]随着人工智能技术的不断发展,深度学习技术也被引入到茶叶生产领域从而提高茶叶识别的效率。例如,杨肖委等(杨肖委,周雪,周玉锋,张莉.一种基于卷积神经网络的鲜茶叶识别分类.申请号:)公开了一种基于卷积神经网络的鲜茶叶识别分类方法,该方法使用卷积神经网络提取特征,自动从复杂数据中学习不同类别鲜茶叶之间的差异,从而对多个品种的鲜茶叶进行分类识别;黄海松等(陈星燃,胡鹏飞,范青松,韩正功.一种基于改进胶囊网络的茶叶识别分级方法。申请号:202110695923.3)公开了一种基于改进胶囊网络的茶叶识别分级方法,该方法利用胶囊网络以矢量形式提取和保存特征的特性,使模型同时具备平移不变性和平移同变性,提高了模型处理小样本数据集的能力,避免过拟合风险。然而该方法中模型仍然采用监督训练的方式对模型进行优化,优化损失函数并没有对网络中的参数进行正则化,并不能解决模型在处理小样本数据集中 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移模型的小样本茶叶图像分类方法,其特征在于,包括如下主要步骤;步骤S1:茶叶图像的采集与预处理,首先选取100种茶叶,将其放置于摄像头之下,从不同角度采集每种茶叶100幅图像,从而构建茶叶图像分类数据集I。对数据集中的每一幅图像使用对数函数非线性变换方法进行预处理;步骤S2:迁移模型的构建,迁移模型由主干神经网络、基类分类器以及Softmax层、旋转预测分类器以及Softmax层三个模块组成;步骤S3:迁移模型的输入输出,从茶叶图像分类数据集I中随机抽取50类建立基类数据集I
base
,将I
base
中的每一幅图像分别旋转0
°
,90
°
,180
°
以及270
°
4个角度,并标定旋转标签,将图像输入到迁移模型中,依次经过三个模块,分别得到该茶叶图像的基类概率输出值和旋转类别概率输出值;步骤S4:迁移模型的训练,对基类概率输出值与人工标注标签计算交叉熵损失函数,对旋转类别概率输出值与旋转标签之间计算自监督损失函数,基于交叉熵损失函数与监督损失函数的加权和利用梯度下降法对迁移模型进行训练;步骤S5:小样本茶叶图像分类测试,将迁移模型中基类分类器、旋转预测分类以及Softmax层移除,并固定主干网络中的参数,在茶叶图像分类数据集I中每类图像随机抽取K(K<5)幅图像作为支持样本图像输入到迁移模型的主干网络提取图像特征,同时在剩余数据集中随机抽取若干查询图像输入到迁移模型的主干网络中提取图像特,利用原型分类器对查询图像进行分类决策,输出茶叶图像所属的类别。2.根据权利要求1所述的一种基于迁移模型的小样本茶叶图像分类方法,其特征在于,所述步骤S1的具体步骤如下:S11:选取100种茶叶,将其放置于摄像头之下,从不同角度采集每种茶叶100幅图像,从而茶叶图像分类数据集I。S12:对于茶叶图像数据集I中的每一幅图像利用对数函数非线性变换进行预处理,第m幅图像I
m
进行校正的公式为:其中为校正后的图像,a、b、c为可调参数。3.根据权利要求1所述的一种基于迁移模型的小样本茶叶图像分类方法,其特征在于,所述步骤S2:迁移模型中的主干网络为ResNet50,该网络是由4层网络组成,每层网络分别含有3,4,6,3残差块,每个残差块由3个卷积层组成,在第1层中,每个卷积层中分别为64个1
×
1,64个3
×
3,256个1
×
1的卷积核,在第2层中,每个卷积层中分别为128个1
×
1,128个3
×
3,512个1
×
1的卷积核,在第3层中,每个卷积层中分别为256个1
×
1,256个3
×
3,1024个1
×
1的卷积核,在第4层中,每个卷积层中分别为512个1
×
1,512个3
×
3,20484个1
×
1的卷积核,主干网络表示为B
θ
(
·
),其中θ表示主干网络中的参数;迁移模型中的基类分类器表示为L
w
(
·
),对茶叶图像计算基类分类值,其中w为参数;迁移模型中的旋转分类器表示为L
r
(
·
),对茶叶图像计算旋转分类值,其中r为参数。4.根据权利要求1所述的一种基于迁移模型的小样本茶叶图像分类方法,其特征在于,所述步骤S3的具体步骤如下:
S31:从茶叶图像分类数据集I中随机抽取50类建立基类数据集I
base
;S32:在基类数据集中随机抽取一批图像,其中第m幅图像表示为I
m
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。