基于人工智能的林地生活垃圾样本数据扩增方法和系统技术方案

技术编号:32435076 阅读:15 留言:0更新日期:2022-02-24 19:07
一种基于人工智能的林地生活垃圾样本数据扩增方法,利用搭载相机的无人机采集的林地生活垃圾图像样本,对所述林地生活垃圾图像样本进行标注后,利用DCGAN网络模型生成扩增的林地生活垃圾图像,并将该扩增的林地生活垃圾图像加入林地生活垃圾样本集。所述的DCGAN网络模型包括,判别器,对于输入的虚假图像和真实图像,判别其真伪;生成器,生成接近真实图像的虚假图像。在生成器的输出层使用Tach激活函数以控制输出范围,而在所述的DCGAN网络模型的其它层中均使用ReLU激活函数。的其它层中均使用ReLU激活函数。的其它层中均使用ReLU激活函数。

【技术实现步骤摘要】
基于人工智能的林地生活垃圾样本数据扩增方法和系统


[0001]本专利技术属于城市管理
,特别涉及一种基于人工智能的林地生活垃圾样本数据扩增方法和系统。

技术介绍

[0002]在大数据图像处理中,以卷积神经网络为代表的深层结构具有更高的性能,但同时需要相对更多的标签训练样本。目前,在对林地中生活垃圾的管理中,已经运用到了高空图像识别深度学习模型,但是遇到的难题是,虽然林地内生活垃圾图像获取渠道较多,但数据标注的过程往往耗资巨大,林地生活垃圾识别面临标签样本缺乏的困难。

技术实现思路

[0003]本专利技术实施例之一,一种基于GCGAN算法的林地内生活垃圾样本数据扩增方法,利用搭载相机的无人机采集的林地生活垃圾图像样本,对所述林地生活垃圾图像样本进行标注后,利用DCGAN网络模型生成林地生活垃圾图像,并将该扩增的林地生活垃圾图像加入林地生活垃圾样本集。所述的DCGAN网络模型包括,
[0004]判别器,对于输入的虚假图像和真实图像,判别其真伪;
[0005]生成器,生成接近真实图像的虚假图像。
[0006]本专利技术实施例的数据扩增可以增加训练集的样本,有效缓解模型过拟合的情况,使得训练数据尽可能的接近测试数据,从而提高预测精度。另外样本扩增可以迫使网络学习到更鲁棒性的特征,从而使模型拥有更强的泛化能力,比如对图像进行一定程度的遮挡。
附图说明
[0007]通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:
[0008]图1生成对抗网络模型结构示意图。
[0009]图2根据本专利技术实施例之一的基于GCGAN算法的林地内生活垃圾样本数据扩增方法流程图。
具体实施方式
[0010]林地样本数据规模是林业智能识别算法性能的关键,利用少量已有数据扩增得到大量林业样本数据成为林业场景识别需要解决的问题。而林地垃圾的种类非常多样,例如,林地内生活垃圾主要有:
[0011]1)废纸张:报纸、纸箱、书本、纸塑铝复合包装和纸袋等。
[0012]2)废塑料:塑料瓶、玩具、油桶、乳液罐、食品保鲜盒、泡沫塑料和衣架等。
[0013]3)废玻璃制品:酒瓶、玻璃放大镜和玻璃杯等。
[0014]4)废金属:易拉罐、锅和电线等。
[0015]5)废织物:皮鞋、衣服、床单、枕头、包和毛绒玩具等。
[0016]6)废杀虫剂和消毒剂的包装物等。
[0017]7)废胶片及废相纸:x光片等感光胶片、相片底片等。
[0018]8)食材废料:谷物及其加工食品、肉蛋及其加工食品、水产及其加工食品、蔬菜、调料和酱料等。
[0019]9)干垃圾:餐巾纸、卫生间用纸、尿不湿、狗尿垫、猫砂、烟蒂、污损纸张、干燥剂、污损塑料、尼龙制品、编制袋、防碎气泡膜、大骨头、硬贝壳、毛发、灰土、炉渣、橡皮泥、太空沙、陶瓷花盆、带胶制品、旧毛巾、一次性餐具、镜子、陶瓷制品、竹制品、成分复杂的制品等。
[0020]10)大件垃圾:沙发、床垫、床和桌子等。
[0021]11)电子废弃物:电冰箱、洗衣机、空调、电视机、手机、微电脑、电饭煲等。样本数据量不足可能会导致训练

验证过程遇到的问题:
[0022]1)模型可能对某些种类垃圾识别效果好,对某些种类垃圾识别效果差;
[0023]2)模型对预测图片明暗色彩过度依赖,导致不同场景的图片有些识别效果,有些识别效果差;
[0024]3)模型出现对某些复杂背景的垃圾图片识别效果差,增加模型训练次数不能很好地提升识别率;
[0025]4)模型出现对某些复杂背景垃圾图片的背景误识别为垃圾实例,增加模型训练次数不能很好地减低背景误识别率;
[0026]5)模型出现对垃圾图片中的局部堆叠垃圾不能有效地识别,往往出现局部堆叠垃圾的漏识别现象,且增加模型训练次数不能很好地提升局部堆叠垃圾的识别率;
[0027]6)模型训练时出现训练次数与训练效果不成正比例的现象,训练次数少的可能比训练次数多的效果更好,只采用训练次数评判模型的好坏不合适;
[0028]7)模型训练速度比较缓慢,训练

验证过程耗时较长。
[0029]深度学习作为一种数据驱动技术,在样本充足的情况下能够取得很好的训练效果。而实际研究中,更多的是小样本数据,若直接将小样本数据代入深度学习训练,将会出现过拟合问题。为了改善小样本数据在深度学习中的训练效果,需要对小样本数据进行处理,使其能够在深度学习中取得好的训练结果。
[0030]数据扩增的目的是使得训练数据尽可能的接近测试数据,从而提高预测精度。另外数据扩增可以迫使网络学习到更鲁棒性的特征,从而使模型拥有更强的泛化能力,比如对图像进行一定程度的遮挡。通常进行数据扩增操作的时候应该保持图像原本的标签不变,数据扩增应该在不改变标签的前提下进行。从大量无标签数据集中学习可重复使用的特征表示已经是一个热门研究区域。在林地内生活垃圾目标识别中,由于样本数量较小,导致识别的效果比较差,这时就需要进行数据扩增。
[0031]数据扩增是对数据进行扩充的方法的总称。数据扩增可以增加训练集的样本,可以有效缓解模型过拟合的情况,也可以给模型带来更强的泛化能力。数据扩增是针对有限训练数据问题的一个重要的空间解决办法,旨在扩增训练数据的规模,缓解深度神经网络模型的过拟合问题,提高模型的性能和泛化能力。
[0032]数据扩增的思想,是通过对样本图像进行不同的变换,从而得到更多的样本,以此
来提高样本的多样性。数据扩增方法很多,如主成分分析(PCA)抖动、随机裁剪、翻转等。利用旋转、颜色抖动、模糊处理和缩放等基本图像处理方式进行数据扩增,实现过程没有新的特征信息生成,扩增后的数据信息多样性差,对林业场景智能算法识别率提升较低。数据扩增发展至今衍生出许多方法,但由于始终都是在原始图像上进行变换,对于分类性能的提升依然十分有限,即使后来出现了自动化搜索数据扩增策略,也只是简化了策略选择流程,本质上并未对数据集的分类性能带来很大的提升。这些方法虽然能实现数据增强,但是其效果有限,因为这些方法局限于在原图的基础上进行变换,具有重复性,且数据分布单一。
[0033]目前,数据扩增主要分为数据扩增数据集和基于对抗生成网络(GAN)的图像生成算法扩增数据集。生成对抗网络(GAN)是一种全新的深度学习框架,它可以从图像中学习鉴别特征并生成真实样本,GAN生成的图像主要取决于模型结构和样本集质量。DCGAN是继GAN之后比较好的改进,提升了GAN训练的稳定性以及生成结果质量。DCGAN为GAN的训练提供了一个很好的网络拓扑结构,表明生成的特征具有向量的计算特性。深度卷积对抗网络(DCGAN)是生成对抗网络的一种模型改进,将卷积运算的思想引入到生成式模型当中来做无监督的训练,利用卷积网络强大的特征提取能力来提高生成本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的林地生活垃圾样本数据扩增方法,包括,利用搭载相机的无人机采集的林地生活垃圾图像样本,对所述林地生活垃圾图像样本进行标注后,利用DCGAN网络模型生成扩增的林地生活垃圾图像,并将该扩增的林地生活垃圾图像加入林地生活垃圾样本集。2.根据权利要求1所述的样本数据扩增方法,其特征在于,所述的DCGAN网络模型包括判别器,对于输入的虚假图像和真实图像,判别其真伪;生成器,生成接近真实图像的虚假图像。3.根据权利要求2所述的样本数据扩增方法,其特征在于,在生成器的输出层使用Tach激活函数以控制输出范围,而在所述的DCGAN网络模型的其它层中均使用ReLU激活函数。4.根据权利要求3所述的样本数据扩增方法,其特征在于,在判别器上使用leaky ReLU激活函数。5.根据权利要求4所述的样本数据扩增方法,其特征在于,在所述的DCGAN网络模型,使用卷积层连接生成器和判别器的输入层以及输出层。6.一种基于人工智能的林地生活垃圾样本数...

【专利技术属性】
技术研发人员:周俊峰张显峰李冬来蒋含笑杨清宇
申请(专利权)人:上海岩易科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1