一种基于图像切割和残差结构的蔬菜识别方法技术

技术编号:36024299 阅读:14 留言:0更新日期:2022-12-21 10:21
本发明专利技术公开了一种基于图像切割和残差结构的蔬菜识别方法。为了克服现有技术无法兼顾速度与蔬菜图像识别精度的问题;本发明专利技术包括以下步骤:S1:获取若干种类蔬菜的图像,构建蔬菜图像数据库;S2:将蔬菜图像按照分割规则切割为若干张包含蔬菜主体的子图像;将切割获得的子图像加入到蔬菜图像数据库中,划分预测数据集和训练数据集;S3:采用基于残差结构的神经网络模型对蔬菜图像数据库中的训练数据集进行训练;S4:利用训练好的模型对蔬菜图像数据库中的预测数据集进行预测。兼顾速度的同时提高了识别精度。高了识别精度。高了识别精度。

【技术实现步骤摘要】
一种基于图像切割和残差结构的蔬菜识别方法


[0001]本专利技术涉及一种图像识别领域,尤其涉及一种通过Gibbs采样和残差结构的蔬菜识别方法。

技术介绍

[0002]近年来,我国农业的发展模式正在从传统农业向现代智能农业转变,农产品中蔬菜的产量在增加,人们生活中对蔬菜的多样性需求增大,不再局限于单一的蔬菜。就目前而言,我国的蔬菜采摘、分拣、销售、称重等任务都是依赖人工完成,这不仅工作效率很低,而且消耗大量的劳动力,对于蔬菜的商品化发展有一定影响,而蔬菜的自动识别与分类的研究为解决上述问题提供了重要的技术支持。
[0003]目前,国内外在图像识别领域已经开展了很多研究工作。传统的模式识别方法考虑到图像的颜色、纹理、形状等特征,并且采集的图像主要是背景较为单一、干扰较小的蔬果图像,在技术上并不能达到鲁棒性强、应用广泛的要求。后有学者提出以蔬菜图像的分割为主线,对分割后的蔬菜图像进行特征提取,但是样本量比较少,而且针对的主要是具有封闭外层轮廓的图像。对于其他叶子类图像,如果图像分割中背景过于相似的时候,容易导致分割误差,没有一定的容错率,这对结果的影响就比较大,从而降低了准确率。
[0004]由于深度神经网络的参数较多,使得其具有强大的表征能力,这导致计算速度过慢。所以深度神经网络,也面临着如何降低参数量,如何学习更加丰富的特征,如何加快训练速度等问题。例如,一种在中国专利文献上公开的“一种蔬菜图像的分类识别方法及系统”,其公告号CN108491765B,包括:将待识别蔬菜图像输入至训练好的目标卷积神经网络模型,获取所述待识别蔬菜图像的分类识别结果;其中,所述训练好的目标卷积神经网络模型通过以下步骤获取:在卷积神经网络模型中添加全连接层,搭建所述目标卷积神经网络模型;通过蔬菜图像训练集,对所述目标卷积神经网络模型进行训练,获取所述训练好的目标卷积神经网络模型。该方案的神经网络参数较多,计算速度过慢。

技术实现思路

[0005]本专利技术主要解决现有技术无法兼顾速度与蔬菜图像识别精度的问题;提供一种基于图像切割和残差结构的蔬菜识别方法。
[0006]本专利技术的上述技术问题主要是通过下述技术方案得以解决的:一种基于图像切割和残差结构的蔬菜识别方法,包括以下步骤:S1:获取若干种类蔬菜的图像,构建蔬菜图像数据库;S2:将蔬菜图像按照分割规则切割为若干张包含蔬菜主体的子图像;将切割获得的子图像加入到蔬菜图像数据库中,划分预测数据集和训练数据集;S3:采用基于残差结构的神经网络模型对蔬菜图像数据库中的训练数据集进行训练;S4:利用训练好的模型对蔬菜图像数据库中的预测数据集进行预测。
[0007]本方案对蔬菜图像的切割得到具有蔬菜主体特征的训练集和预测集,即能够扩充数据库,又能够体现出蔬菜的局部特征,有足够的样本集和一定的容错率。然后通过残差连接和全连接层将得到的特征直接输入Softmax分类器中,实现了兼顾速度的同时提高了识别精度。
[0008]作为优选,所述的基于残差结构的神经网络模型为改进的Alexnet卷积神经网络模型;神经网络模型采用PRelu激活函数;PRelu激活函数为:其中,a>0为可变斜率。
[0009]通过使用PRelu激活函数作为改进的Relu激活函数,将Relu函数的负轴斜率从0改为可变参数a,在模型训练上取得了较好的结果。
[0010]作为优选,所述的分割规则包括基于吉布斯采样的图像分割法、顺序切割图像法、基于grabcut算法的图像分割法和随机抽样切割法。
[0011]对蔬菜图像的切割得到具有蔬菜主体特征的训练集和预测集,即能够扩充数据库,又能够体现出蔬菜的局部特征,有足够的样本集和一定的容错率。
[0012]作为优选,所述的基于吉布斯采样的图像分割法包括:通过马尔科夫随机场构建概率模型,通过吉布斯采样分别获得各图像上的坐标点集合;在坐标点集合中随机取若干坐标点,分别作为图像的中心点进行图像切割。
[0013]作为优选,对于图像S中的各像素点s,通过马尔科夫随机场处理,将所有像素点s分类,像素点的分类标签为w,分类结果的标签集合为W;图像的概率模型P(W|S)为:其中,P(W)为分类标签w的先验概率;P(S|W)为图像S的条件概率分布;(也称似然函数);看结构为在已知像素点标记w情况下,它是真实的观察像素点s概率,所以是一个似然函数,表示观察像素点s和真实的像素点标记w的类似程度。
[0014]P(S)为图像S的先验概率。由于图像S在分割前就已经确定,故此P(S)为定值。所要求P(W|S)的最大值,即P(S|W)P(W)的最大值。
[0015]作为优选,所述的分类标签w的先验概率P(W)的求解过程为:其中,是归一化常数;参数T控制P(W)的形状;U2(W)=∑
c∈C
V
c
(W
c
)
C为所有势团集合;V
c
(W
C
)为势团势能;对V
C
(W
C
)的定义如下:其中,β为耦合系数;s,t为相邻的像素点;W
s
、W
t
为是不同子势团中相邻像素的标号。
[0016]表示图像的先验概率。
[0017]作为优选,所述的图像S的条件概率分布P(S|W)求解过程为:对于每一分类标签,分别建立高斯密度函数;将属于各分类标签的像素点,分别代入到对应的高斯密度函数中计算。
[0018]表示图像的似然概率。
[0019]作为优选,所述的吉布斯采样过程为:通过训数据集得到所需的条件概率分布的参数集合;对每一个像素点s,取最优化能量函数,遍历整个图像得到整个图像的初始分割;根据目标函数计算当前的分割结果,每次迭代更新所有的像素点的分类标签;新的分类标签作为下一次迭代的分类标签;依此反复,当达到设置的迭代次数或类中心不再变化则停止迭代。
[0020]通过吉布斯采样的方法,求最大后验概率,通过迭代每个变量来生成后验样本,取得最优解。
[0021]作为优选,通过吉布斯采样,采集到图像中落在蔬菜主体上的坐标点集合;在坐标点集合中随机获取若干个点的坐标,以点为中心坐标点,切割尺寸为L*D像素大小的图片,得到不同位置特征的蔬菜图片;扩大了数据集的同时,蔬菜的特征也更为显著。
[0022]作为优选,若图像切割时长度或宽度小于需求的切割尺寸,则丢弃对应图片,继续进行迭代循环切割,直到找到额定数量的切割的结果。保证扩展数据的正常使用。
[0023]作为优选,所述的顺序切割图像法包括:以额定的切割尺寸L*D像素,将蔬菜图像分别沿横向、纵向顺序切割。
[0024]作为优选,所述的基于grabcut算法的图像分割法包括:在蔬菜图像中定义出包含目标的矩形,矩形外的区域被自动认为是背景,利用背景中的数据来区分定义的矩形区域内的前景和背景;用高斯混合模型对前景和背景进行建模,将未定义的像素标记为可能的前景或背景;基于图像每个像素之间的边与周围像素颜色上的相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像切割和残差结构的蔬菜识别方法,其特征在于,包括以下步骤:S1:获取若干种类蔬菜的图像,构建蔬菜图像数据库;S2:将蔬菜图像按照分割规则切割为若干张包含蔬菜主体的子图像;将切割获得的子图像加入到蔬菜图像数据库中,划分预测数据集和训练数据集;S3:采用基于残差结构的神经网络模型对蔬菜图像数据库中的训练数据集进行训练;S4:利用训练好的模型对蔬菜图像数据库中的预测数据集进行预测。2.根据权利要求1所述的一种基于图像切割和残差结构的蔬菜识别方法,其特征在于,所述的基于残差结构的神经网络模型为改进的Alexnet卷积神经网络模型;神经网络模型采用PRelu激活函数;PRelu激活函数为:其中,a>0为可变斜率。3.根据权利要求1或2所述的一种基于图像切割和残差结构的蔬菜识别方法,其特征在于,所述的分割规则包括基于吉布斯采样的图像分割法、顺序切割图像法、基于grabcut算法的图像分割法和随机抽样切割法。4.根据权利要求3所述的一种基于图像切割和残差结构的蔬菜识别方法,其特征在于,所述的基于吉布斯采样的图像分割法包括:通过马尔科夫随机场构建概率模型,通过吉布斯采样分别获得各图像上的坐标点集合;在坐标点集合中随机取若干坐标点,分别作为图像的中心点进行图像切割。5.根据权利要求4所述的一种基于图像切割和残差结构的蔬菜识别方法,其特征在于,对于图像S中的各像素点s,通过马尔科夫随机场处理,将所有像素点s分类,像素点的分类标签为w,分类结果的标签集合为W;图像的概率模型P(W|S)为:其中,P(W)为分类标签w的先验概率;P(S|W)为图像S的条件概率分布;P(S)为图像S的先验概率。6.根据权利要求4或5所述的一种基于图像切割和残差结构的蔬菜识别方法,其特征在于,所述的吉布斯采样过程为...

【专利技术属性】
技术研发人员:代琦刘嫚嫚郭湘婷刘晓庆
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1