一种基于改进Cswin Transformer模型的垃圾分类方法技术

技术编号：43554151 阅读：46 留言：0更新日期：2024-12-06 17:29

本发明专利技术公开了一种垃圾的自动识别方法，所述方法为：通过摄像头和互联网搜索获取垃圾的图像，对图片进行数据增强预处理；在Cswin Transformer模型中引入Agent注意力模块，增强模型对特征的提取能力；采用LionBatch优化策略，提高模型训练速度和资源利用效率；采用标签平滑交叉熵损失函数对困难样本进行动态加权；将预处理后的图像数据输入到改进模型中进行训练与测试，获得最优模型；最后将待分类图像输入到最优模型中获取分类结果。本发明专利技术提出的一种基于改进Transformer的垃圾的自动识别方法，可确保对垃圾自动识别并获得正确类型，具有良好的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于自然图像分类领域，涉及一种用于对垃圾图像进行分类的高效多模态融合方法。

技术介绍

1、随着城市化进程的加速和人口的迅速增长，居民生活水平的提高带来了消费结构的多样化，生活垃圾量也随之急剧增加。在这种背景下，有效控制日益增长的垃圾量成为一大挑战。虽然垃圾分类和回收是处理城市垃圾和保护环境的有效方法，但由于垃圾种类繁多、形态各异，需要大量的人力投入才能对垃圾进行正确分类。此外，居民分类意识不足以及相关政策落实不彻底也导致垃圾分类实施效果并不理想。精确的垃圾分类技术不仅能有效区分不同类型的垃圾，还能显著提升无害化处理的可行性，确保有害垃圾得到专门处理，减少对环境和公共健康的威胁。自动化处理垃圾技术通过人工智能和机器学习进一步提升分拣效率，降低操作成本。因此，开发有效的自动垃圾分类方法具有重要的现实意义。

2、图像识别在垃圾分类领域的应用越来越广泛，主要依赖于深度学习技术的发展。传统的垃圾分类算法主要依赖于手工特征提取和经典机器学习分类器，例如支持向量机(svm)和决策树等。这些方法通常通过提取颜色直方图、纹理特征和形...

【技术保护点】

1.一种基于改进Cswin Transformer模型的垃圾分类方法，其特征在于，包括如下步骤：

2.如权利要求1所述步骤a中的图像预处理方法，其特征在于，对输入网络的图像I进行尺寸大小归一化处理，将图像尺寸缩放至224*224像素大小；通过对数据集进行镜像、翻转、平移、剪切、仿射变换、旋转操作扩增数据；按照8:2的比例将数据集随机划分为训练集与测试集；通过Mixup数据增强算法对输入网络的每两张垃圾图像进行线性插值操作，将两张图像按比例混合，同时混合其对应的标签，形成一张新的图像数据，Mixup数据增强的计算公式如下所示：

3.如权利要求1所述步骤b中的Agen...

【技术特征摘要】

1.一种基于改进cswin transformer模型的垃圾分类方法，其特征在于，包括如下步骤：

2.如权利要求1所述步骤a中的图像预处理方法，其特征在于，对输入网络的图像i进行尺寸大小归一化处理，将图像尺寸缩放至224*224像素大小；通过对数据集进行镜像、翻转、平移、剪切、仿射变换、旋转操作扩增数据；按照8:2的比例将数据集随机划分为训练集与测试集；通过mixup数据增强算法对输入网络的每两张垃圾图像进行线性插值操作，将两张图像按比例混合，同时混合其对应的标签，形成一张新的图像数据，mixup数据增强的计算公式如下所示：

3.如权利要求1所述步骤b中的agent注意力方法，其特征在于，由两个软性注意力机制softmax组成，分别负责agent聚合和agent广播,以此来优化特征图的注意力校准过程；具体方法为，对权利要求1所述步骤a中的图片数据i进行线性变换简化注意力权重矩阵w，得到查询向量q、键向量k和值向量v，计算过程如下所示：

4.如权利要求1所述步骤b中的lionbatch优化策略，其特征在于，在模型训练时仅追踪动量，并通过符号操作计算更新，从而降低内存开销并确保更新幅度在所有维度上的一致性；在训练过程中根据数据的实时表现调整剪枝决策，减少对...

【专利技术属性】
技术研发人员：周厚奎，丁奇沣，
申请(专利权)人：浙江农林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人