一种基于视觉识别的垃圾分类方法及系统技术方案

技术编号:39825281 阅读:6 留言:0更新日期:2023-12-29 16:00
本发明专利技术公开了一种基于视觉识别的垃圾分类方法及系统,涉及垃圾分类回收技术领域,包括:采集垃圾图像并进行预处理,形成生活垃圾图像数据集;构建垃圾分类模型,将生活垃圾图像数据集输入垃圾分类模型进行训练,在训练的过程中对原始垃圾分类模型进行修剪,对剪枝后的垃圾分类模型进行重训练,当再训练模型准确率不再上升时,停止重训练,输出训练好的垃圾分类模型;将待分类的垃圾图像输入训练好的垃圾分类模型,输出对待分类垃圾图像的分类结果

【技术实现步骤摘要】
一种基于视觉识别的垃圾分类方法及系统


[0001]本专利技术涉及垃圾分类回收
,更具体的说是涉及一种基于视觉识别的垃圾分类方法及系统


技术介绍

[0002]目前,随着社会的进步,人们的生活水平和质量逐渐提高,能够消费的东西也日益增多,因此产生的垃圾也越来越多,垃圾主要采用填埋和焚烧等办法进行处理

为了有效地减少垃圾的处理量,减缓对地球资源的消耗,可以对垃圾中可回收的垃圾进行分类回收再利用

分类的目的是提高垃圾的资源价值和经济价值,力争物尽其用

随着对垃圾回收分类的要求变得越来越严格,需要对日常生活垃圾进行准确分类,可回收垃圾的分类回收方法主要包括人工拣选

风选等,其人工成本高

处理速度慢

效率低

[0003]因此,如何提供一种精度高

速度快

分类过程快捷高效的垃圾分类方法是本领域技术人员亟需解决的问题


技术实现思路

[0004]有鉴于此,本专利技术提供了一种基于视觉识别的垃圾分类方法及系统,以解决
技术介绍
中存在的问题

[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]一种基于视觉识别的垃圾分类方法,包括:
[0007]采集垃圾图像并进行预处理,形成生活垃圾图像数据集;
[0008]构建垃圾分类模型,将生活垃圾图像数据集输入垃圾分类模型进行训练,在训练的过程中对原始垃圾分类模型进行修剪,对剪枝后的垃圾分类模型进行重训练,当再训练模型准确率不再上升时,停止重训练,输出训练好的垃圾分类模型;
[0009]将待分类的垃圾图像输入训练好的垃圾分类模型,输出对待分类垃圾图像的分类结果

[0010]可选的,所述对垃圾图像进行预处理,获得预处理后的垃圾图像;其具体过程为:通过对加载的垃圾图像进行数据增强和归一化处理,来获得预处理后的垃圾图像;所述数据增强的方式包括对垃圾图像进行随机缩放

翻转

平移和旋转

[0011]可选的,所述垃圾分类模型包括输入层

卷积层

池化层

整形层

全连接层和输出层,网络的超参数由
Scikit

Learn
框架的
Grid Search
方法确定

[0012]可选的,所述生活垃圾图像数据集被划分为训练集

验证集和测试集;训练集用于垃圾分类模型的自主学习,验证集用于验证垃圾分类模型是否存在过拟合现象;测试集用于测试垃圾分类模型的最终精度

[0013]可选的,
Sigmoid
激活函数的表达式如下:
[0014][0015]其中
y
iFC

y
分别为激活前后的最后全连接层的第
i
个神经元的输出,
C
表示类别总数

[0016]可选的,交叉熵损失函数为:
[0017][0018]其中,
J
是样本类别个数,
y
n,j
∈[0,1]是第
n
个样本
P
n
的第
j
类实际标签值,是对第
n
个样本
P
n
的第
j
类预测概率值

[0019]可选的,所述垃圾图像分类模型训练过程还包括,利用余弦退火学习率对模型进行优化;所述余弦退火学习率的规则为:
[0020][0021]式中:
x
是训练次数的索引值,和分别表示学习率的最大值和最小值,定义了学习率的范围,
A
cur
表示当前执行的
epoch
数,
A
x
是设定训练的
epoch
总数

[0022]可选的,剪枝包含以下步骤:
[0023]S1、
对于模型的各个卷积层,对四维权值张量
WN*C*H*W
进行建模,其中
N
表示卷积核的个数,
C
表示卷积核的通道数,
H、W
分别表示卷积核的高和卷积核的宽;
[0024]S2、
根据
H

W
的空间维度划分卷积核的权重组,将某一卷积层内所有卷积核的所有通道中相同空间位置的权重作为一个独立的权重组
g

[0025]S3、
根据用户对模型设定的压缩或加速比例,确定网络模型各层所需设定的目标稀疏率,并对所有权重组设置统一的正则化上限
target_reg
,为每个独立的权重组分配正则化因子
λ
g
并将所有的
λ
g
初始化为0;
[0026]S4、
为网络权重矩阵中的每个权重组设定稀疏的重要性标准,并根据该标准对各个权重组进行升序排序,得到各权重组的重要性排名;
[0027]S5、
根据各个权重组
g
的相对重要性不同,逐步将不同的正则化增量
Δλ
g
分配给不同的权重组,并不断迭代更新各个权重组的正则化因子
λ
g
,直到某个权重组的正则化因子
λ
g
达到预先设定的正则化上限
target_reg
时,该权重组的权重将被永久删除;
[0028]S6、
通过空间正则化的方法对空间剪枝所得到的不规则形状的稀疏卷积核进行重塑,使其变为规则的稀疏卷积核;
[0029]S7、
对输入特征图中与规则稀疏卷积核中已删除权重相同方向上的像素进行裁剪,保证输出特征图的大小不变;
[0030]S8、
当某一层的稀疏度达到预先指定的稀疏率时,该层自动停止正则化剪枝,直到所有层达到其预先设定的稀疏率时,结束剪枝

[0031]另一方面,提供一种基于视觉识别的垃圾分类系统,包括以下模块:
[0032]采集模块,采集垃圾图像并进行预处理,形成生活垃圾图像数据集;
[0033]垃圾分类模型构建模块,构建垃圾分类模型,将生活垃圾图像数据集输入垃圾分类模型进行训练,在训练的过程中对原始垃圾分类模型进行修剪,对剪枝后的垃圾分类模型进行重训练,当再训练模型准确率不再上升时,停止重训练,输出训练好的垃圾分类模型;
[0034]分类结果输出模块,将待分类的垃圾图像输入训练好的垃圾分类模型,输出对待分类垃圾图像的分类结果

[0035]经由上述的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于视觉识别的垃圾分类方法,其特征在于,包括:采集垃圾图像并进行预处理,形成生活垃圾图像数据集;构建垃圾分类模型,将生活垃圾图像数据集输入垃圾分类模型进行训练,在训练的过程中对原始垃圾分类模型进行修剪,对剪枝后的垃圾分类模型进行重训练,当再训练模型准确率不再上升时,停止重训练,输出训练好的垃圾分类模型;将待分类的垃圾图像输入训练好的垃圾分类模型,输出对待分类垃圾图像的分类结果
。2.
根据权利要求1所述的一种基于视觉识别的垃圾分类方法,其特征在于,所述对垃圾图像进行预处理,获得预处理后的垃圾图像;其具体过程为:通过对加载的垃圾图像进行数据增强和归一化处理,来获得预处理后的垃圾图像;所述数据增强的方式包括对垃圾图像进行随机缩放

翻转

平移和旋转
。3.
根据权利要求1所述的一种基于视觉识别的垃圾分类方法,其特征在于,所述原始垃圾分类模型包括输入层

卷积层

池化层

整形层

全连接层和输出层,网络的超参数由
Scikit

Learn
框架的
Grid Search
方法确定
。4.
根据权利要求1所述的一种基于视觉识别的垃圾分类方法,其特征在于,所述生活垃圾图像数据集被划分为训练集

验证集和测试集;训练集用于垃圾分类模型的自主学习,验证集用于验证垃圾分类模型是否存在过拟合现象;测试集用于测试垃圾分类模型的最终精度
。5.
根据权利要求1所述的一种基于视觉识别的垃圾分类方法,其特征在于,
Sigmoid
激活函数的表达式如下:其中及
y
分别为激活前后的最后全连接层的第
i
个神经元的输出,
C
表示类别总数
。6.
根据权利要求1所述的一种基于视觉识别的垃圾分类方法,其特征在于,交叉熵损失函数为:其中,
J
是样本类别个数,
y
n,j
∈[0,1]
是第
n
个样本
P
n
的第
j
类实际标签值,是对第
n
个样本
P
n
的第
j
类预测概率值
。7.
根据权利要求1所述的一种基于视觉识别的垃圾分类方法,其特征在于,所述垃圾图像分类模型训练过程还包括,利用余弦退火学习率对模型进行优化;所述余弦退火学习率的规则为:式中:
x
是训练次数的索引值,和分别表示学习率的最大值和最小值,定义了学习率的范围,
A
cur...

【专利技术属性】
技术研发人员:吕凡范晨
申请(专利权)人:浙江净禾智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1