当前位置: 首页 > 专利查询>西北大学专利>正文

基于深度学习的厨余垃圾识别分类方法技术

技术编号:37677272 阅读:10 留言:0更新日期:2023-05-26 04:42
本申请涉及一种基于深度学习的厨余垃圾识别分类方法,包括:将包含至少一个厨余垃圾目标的待识别图片输入到厨余垃圾识别分类模型中,输出所述待识别图片中每个厨余垃圾目标的类别;在模型训练过程中,将图片识别转变为集合预测问题,通过使用可学习的目标查询替代参照框,使得识别过程更加灵活,在识别过程中学习全局信息,消除部分冗余框;最后使用二分图匹配算法去进行匹配,得到最优解,后续不需要NMS操作,简化了调参步骤。简化了调参步骤。简化了调参步骤。

【技术实现步骤摘要】
基于深度学习的厨余垃圾识别分类方法


[0001]本申请涉及计算机图像识别与分类
,具体地,涉及一种基于深度学习的厨余垃圾识别分类方法。

技术介绍

[0002]目前,厨余垃圾分类工作大多采用人工分拣,但是投入大量的时间与精力,却没有很好的效果。随着图像识别算法的兴起,厨余垃圾分类开始摒弃传统分类理念,步入自动化分类进程。而当前大多的图像识别算法,不仅需要较强的先验知识,而且会生成很多的冗余框,需要使用非极大值抑制方法对其结果进行后续处理,使得算法的参数较为复杂。

技术实现思路

[0003]为了克服现有技术中的至少一个不足,本申请提供一种基于深度学习的厨余垃圾识别分类方法。
[0004]第一方面,提供一种基于深度学习的厨余垃圾识别分类模型构建方法,包括:
[0005]获取模型构建数据集;模型构建数据集中的元素为包含至少一个厨余垃圾目标的图片;
[0006]基于模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型;
[0007]训练后的识别分类模型包括卷积神经网络、transformer模块、FFN网络;卷积神经网络用于提取待识别图片的图像特征;transformer模块用于基于图像特征,得到待识别图片的最终特征;FFN网络用于根据最终特征,确定待识别图片中每个厨余垃圾的类别。
[0008]在一个实施例中,基于模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型,包括:
[0009]将模型构建数据集输入到卷积神经网络,提取图片的图像特征;
[0010]对图像特征添加位置信息,得到具有位置信息的图像特征;
[0011]将具有位置信息的图像特征输入到transformer模块,得到图片的最终特征;
[0012]将最终特征输入到FFN网络,输出多个预测框,每个预测框对应一个厨余垃圾目标的类别;
[0013]根据多个预测框和多个真实框,确定损失函数,并将损失函数进行梯度回传以更新模型的参数,得到训练后的厨余垃圾识别分类模型。
[0014]在一个实施例中,卷积神经网络包括多个卷积层、激励层和全连接层,多个卷积层中的第一个卷积层用于提取图像的浅层特征,其他卷积层用于根据浅层特征提取深层特征,激励层用于对深层特征进行非线性映射,得到映射后的特征图,全连接层用于提取分类特征图。
[0015]在一个实施例中,方法还包括:
[0016]对映射后的特征图采用平均池化法进行降维处理。
[0017]在一个实施例中,对图像特征添加位置信息,得到具有位置信息的图像特征,包
括;
[0018]对图像特征进行使用一维卷积核进行一次维度压缩操作,得到一次维度压缩后的特征图;
[0019]确定一次维度压缩后的特征图中每个像素点的位置信息;
[0020]将位置信息添加到像素点中,得到处理后的特征图;
[0021]对处理后的特征图进行张量扁平化处理,得到二次维度压缩后的特征图,即具有位置信息的图像特征。
[0022]在一个实施例中,将图像特征输入到transformer模块,得到图片的最终特征,包括:
[0023]transformer模块包括编码器和解码器;解码器根据编码器的输出和多个目标查询,得到图片的最终特征。
[0024]在一个实施例中,确定损失函数,包括:
[0025]针对每个预测框,采用二分图匹配方法确定与预测框匹配的真实框,得到预测框和真实框的一一匹配关系;
[0026]根据一一匹配关系计算分类损失与预测框位置损失,分类损失与预测框位置损失组成损失函数。
[0027]第二方面,提供一种基于深度学习的厨余垃圾识别分类方法,包括:
[0028]将包含至少一个厨余垃圾目标的待识别图片输入到厨余垃圾识别分类模型中,输出待识别图片中每个厨余垃圾目标的类别;
[0029]厨余垃圾识别分类模型为根据上述的基于深度学习的厨余垃圾识别分类模型构建方法得到的。
[0030]第三方面,提供一种基于深度学习的厨余垃圾识别分类模型构建装置,包括:
[0031]模型构建数据集获取模块,用于获取模型构建数据集;模型构建数据集中的元素为包含至少一个厨余垃圾目标的图片;
[0032]模型训练模块,用于基于模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型;
[0033]训练后的识别分类模型包括卷积神经网络、transformer模块、FFN网络;卷积神经网络用于提取待识别图片的图像特征;transformer模块用于基于图像特征,得到待识别图片的最终特征;FFN网络用于根据最终特征,确定待识别图片中每个厨余垃圾的类别。
[0034]在一个实施例中,训练模块,还用于:
[0035]将模型构建数据集输入到卷积神经网络,提取图片的图像特征;
[0036]对图像特征添加位置信息,得到具有位置信息的图像特征;
[0037]将具有位置信息的图像特征输入到transformer模块,得到图片的最终特征;
[0038]将最终特征输入到FFN网络,输出多个预测框,每个预测框对应一个厨余垃圾目标的类别;
[0039]根据多个预测框和多个真实框,确定损失,并将损失进行梯度回传以更新模型的参数,得到训练后的厨余垃圾识别分类模型。
[0040]相对于现有技术而言,本申请具有以下有益效果:本申请在模型训练过程中,将图片识别转变为集合预测问题,通过使用可学习的目标查询object query替代参照框
anchor,使得识别过程更加灵活,在识别过程中会学习全局信息,消除部分冗余框;最后使用二分图匹配算法去进行匹配,得到最优解,后续不需要非极大值抑制方法(NMS)操作,简化了调参步骤。
附图说明
[0041]本申请可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
[0042]图1示出了根据本申请实施例的基于深度学习的厨余垃圾识别分类模型构建方法的流程框图;
[0043]图2示出了根据本申请实施例的基于深度学习的厨余垃圾识别分类模型构建装置的结构框图。
具体实施方式
[0044]在下文中将结合附图对本申请的示例性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施例的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中可以做出很多特定于实施例的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施例的不同而有所改变。
[0045]在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本申请,在附图中仅仅示出了与根据本申请的方案密切相关的装置结构,而省略了与本申请关系不大的其他细节。
[0046]应理解的是,本申请并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中,在可行的情况下,实施例可以相互组合、不同实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的厨余垃圾识别分类模型构建方法,其特征在于,包括:获取模型构建数据集;所述模型构建数据集中的元素为包含至少一个厨余垃圾目标的图片;基于所述模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型;所述训练后的识别分类模型包括卷积神经网络、transformer模块、FFN网络;所述卷积神经网络用于提取待识别图片的图像特征;所述transformer模块用于基于所述图像特征,得到所述待识别图片的最终特征;所述FFN网络用于根据所述最终特征,确定所述待识别图片中每个厨余垃圾的类别。2.如权利要求1所述的方法,其特征在于,其中,基于所述模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型,包括:将所述模型构建数据集输入到卷积神经网络,提取图片的图像特征;对所述图像特征添加位置信息,得到具有位置信息的图像特征;将所述具有位置信息的图像特征输入到transformer模块,得到图片的最终特征;将所述最终特征输入到FFN网络,输出多个预测框,每个所述预测框对应一个厨余垃圾目标的类别;根据所述多个预测框和多个真实框,确定损失函数,并将所述损失函数进行梯度回传以更新模型的参数,得到训练后的厨余垃圾识别分类模型。3.如权利要求2所述的方法,其特征在于,所述卷积神经网络包括多个卷积层、激励层和全连接层,所述多个卷积层中的第一个卷积层用于提取图像的浅层特征,其他卷积层用于根据所述浅层特征提取深层特征,所述激励层用于对深层特征进行非线性映射,得到映射后的特征图,所述全连接层用于提取分类特征图。4.如权利要求3所述的方法,其特征在于,方法还包括:对所述映射后的特征图采用平均池化法进行降维处理。5.如权利要求2所述的方法,其特征在于,对所述图像特征添加位置信息,得到具有位置信息的图像特征,包括;对所述图像特征进行使用一维卷积核进行一次维度压缩操作,得到一次维度压缩后的特征图;确定所述一次维度压缩后的特征图中每个像素点的位置信息;将所述位置信息添加到像素点中,得到处理后的特征图;对所述处理后的特征图进行张量扁平化处理,得到二次维度压缩后的特征图,即具有位置信息的图像特征。6.如权利要求2所述的...

【专利技术属性】
技术研发人员:杨建锋张晨愉滨铨颜辰航闫弘
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1