基于ResNet50的垃圾识别与分类方法技术

技术编号:34853824 阅读:228 留言:0更新日期:2022-09-08 07:54
本发明专利技术属于图像识别技术领域,具体地说,是一种基于ResNet50的垃圾识别与分类方法,包括:选取涵盖有实际生活中常见的多种垃圾图片的公开数据集,创建成适合垃圾分类研究所需要的数据集,然后将数据集分为训练集与测试集,对训练集中的图像进行预处理操作;搭建网络模型,选取ResNet50卷积神经网络模型作为基准模型,引入深度可分离卷积,添加CBMA和SE两种注意力机制,从而创建出新型卷积神经网络模型;设置网络模型的超参数,选择损失函数和优化方法对创建出的网络模型进行训练,可得到训练好的模型;利用训练好的卷积神经网络模型去识别测试集中的图片,最后得到识别的精度。最后得到识别的精度。

【技术实现步骤摘要】
基于ResNet50的垃圾识别与分类方法


[0001]本专利技术属于图像识别
,具体地说,是一种基于ResNet50的垃圾识别与分类方法。

技术介绍

[0002]近年来,随着社会生活水平的逐渐提高,相应的垃圾产量也在迅速增长,因此对垃圾进行合理的分类以及实行相应的回收利用操作,是具有非常重大意义的,同时对于目前提倡的绿色发展以及可持续发展也起到至关重要的作用。然而事实证明,针对实际我们生活中的垃圾的分类来说,仍然具有很多的困难,尽管目前我国很多的省份已经颁布了垃圾分类的强制性政策,但是由于人们长期以来对于垃圾分类的认识是不够充分的,甚至对垃圾能够正确分类的知识也是不足的,以至于垃圾分类在目前的生活中实现的不是很理想的。因为对不同种类的垃圾应该采取属于它们的分类方法,如果分类不当,不仅会使得回收利用收到阻碍,还可能会导致各种环境污染问题,所以对垃圾进行合理的分类是刻不容缓的。
[0003]同时,随着深度学习的快速发展,深度学习方法已经在图像分类领域以及图像检测领域达到了十分广泛的应用,多类别的图像分类问题被有效地解决,其最基础的研究本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于ResNet50的垃圾识别与分类方法,其特征在于,包括以下步骤:步骤1:选取涵盖有实际生活中常见的多种垃圾图片的公开数据集,创建成适合垃圾分类研究所需要的数据集,然后将数据集分为训练集与测试集,并对训练集中的图像进行预处理操作;步骤2:选取ResNet50网络作为基准模型,在残差结构中添加深度可分离卷积,在网络中添加注意力机制,从而搭建出新型网络模型;步骤3:设置网络模型超参数,选择损失函数和优化方法对训练集中图像进行训练,经过不断验证以及训练的过程,然后获得训练好的网络模型;步骤4:使用训练好的网络模型去检测没有训练过的测试集中的垃圾图片,最终得到垃圾识别以及分类的结果。2.根据权利要求1所述的基于ResNet50的垃圾识别与分类方法,其特征在于,所述步骤1对于图像进行预处理操作的方法具体包括:步骤1.1,首先将输入图片的尺寸转化成512
×
512的输入特征图;步骤1.2,将步骤1.1转化后的图像进行随机旋转;步骤1.3,将步骤1.2随机旋转后获得的图像,进行随机的水平翻转;步骤1.4,将步骤1.3随机水平翻转后获得的图像,进行中心裁剪的操作;步骤1.5,将步骤1.4中心裁剪后获得的图像,转换为张量;步骤1.6,将步骤1.5获得的张量,进行归一化处理。3.根据权利要求2所述的基于ResNet50的垃圾识别与分类方法,其特征在于,所述步骤1中对图像预处理操作使用的是工具集torchvision中的转换函数transforms,具体方法如下:步骤1.1的图片尺寸转化的方法:transforms.Resize([h,w]),其中的h和w分别代表图片的高度和宽度;步骤1.2的图片随机旋转的方法:transforms.RandomRotation(degrees),其中degrees表示角度,即按degrees随机旋转一定的角度;步骤1.3的图片随机水平翻转的方法:transforms.RandomHorizontalFlip();步骤1.4的图片进行中心裁剪的方法:transforms.CenterCrop(crop_size),其中crop_size表示将图片裁剪成的大小,即以输入图片的中心点为中心做指定crop_size的裁剪操作;步骤1.5的图片转换为张量的方法:transforms.ToTensor(),将数据从[0,255]范围转换到[0,1],具体做法就是将原始数据除以255;同时将尺寸为(h,w,c)的图片转为尺寸为(c,h,w),其中的h、w和c分别代表图片的高度、宽度和深度;步骤1.6进行归一化处理的方法:transforms.Normalize(mean,std),使用公式对数据按通道进行标准化,即先减均值mean,再除以标准差std,将每个元素分布到(

1,1)。4.根据权利要求1所述的基于ResNet50的垃圾识别与分类方法,其特征在于,步骤2中所述的ResNet50结构分为5个阶段:第一阶段:输入x先后经过卷积层、BN层、ReLU激活函数、MaxPooling层得到输出:

卷积层的计算方法:输出其中x表示输入x=h
×
w
×
c的像素值数组,h、w和c分别表示图像的各个属性,即高度,宽度和深度,padding表示输入的每一条边补充0的层数,高、宽都增加2
×
paddi...

【专利技术属性】
技术研发人员:倪晓军刘玲
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1