一种基于堆叠稠密网络的挖掘机目标检测方法及装置制造方法及图纸

技术编号:27879746 阅读:80 留言:0更新日期:2021-03-31 01:12
本发明专利技术提供了一种基于堆叠稠密网络的挖掘机目标检测方法及装置,所述方法包括:将多个预设的深度可分离卷积网络进行堆叠以构建得到基础网络;采用多个预设的CCB模块构建多尺度特征提取网络;根据所述基础网络、所述多尺度特征提取网络以及预设的损失函数进行构建得到目标检测网络模型,并利用获取到的训练数据对所述目标检测网络模型进行训练;将待检测挖掘机图像输入至训练好的目标检测网络模型,输出挖掘机目标区域。本发明专利技术有效减少了模型大小和运算量以提高检测运行效率,同时有效提高了检测能力。

【技术实现步骤摘要】
一种基于堆叠稠密网络的挖掘机目标检测方法及装置
本专利技术涉及目标检测
,尤其是涉及一种基于堆叠稠密网络的挖掘机目标检测方法及装置。
技术介绍
为实现现场实时监测违法用地现象,国土执法部门已对重点违法用地易发区域通过视频进行了监控。由于传统的视频监控智能化程度低,人力成本高,另外会由于监控人员容易疲劳懈怠导致未及时发现违法用地情况。因此,利用计算机视觉和深度学习的方法,对土地间作业挖掘机目标进行监测是及时发现违法用地现象的重要手段,并能够为工程项目管理人员及时提供施工现场的重要管理信息。已公开成果[基于颜色及投影特征的挖掘机图像分割算法]中只利用颜色特征对挖掘机进行分割,无法对背景复杂的挖掘机进行有效分割;公开成果[基于机器视觉的铲斗目标检测]中利用帧差法和高斯混合建模法,实现铲斗目标检测,但该方法只适应单一场景下的运动目标检测,无法对复杂场景且静止的挖掘机目标进行检测。近年来,基于深度学习的目标检测方法,相比传统的目标检测方法,基于卷积网络的目标检测方法由于不需要手动设计特征,直接通过深层卷积网络结构自动学习图像的高阶特征,极大地提升了对象检测任务的精度。这类方法一般分为基于候选区域的方法和基于回归的方法。其中基于候选区域的方法主要包括FastR-CNN、FasterR-CNN和R-FCN,这类方法虽然准确,但计算成本很高,检测速度慢;而基于回归的方法主要包括YOLO和SSD,这类方法具有较好的检测速度和精度,因而得到了广泛的应用。现有技术方案SSD算法由基础网络和多尺度特征提取网络组成,如图2所示:基础网络为VGG16,在图像分类领域具有很高分类精度且去除其分类层的网络;多尺度特征提取网络为在基础网络基础上增加的用于目标检测的卷积网络结构,这些层的尺寸逐渐减小从而可以进行多尺度预测。其中,VGG16由六种不同级别的网络,深度从11层到19层不等。VGG16卷积核的感受野块为3×3,这是捕获左/右,上/下和中心特征的最小尺寸。在其中一个结构中使用了1×1的卷积核,这可以看作对输入通道的线性变换。卷积核的步长固定为1,对3×3的卷积层进行1像素的填充使得卷积层输入的空间分辨率保持不变。空间池化通过5个最大池化层在一些卷积层后操作,像素窗大小为2×2,步长为2。不同的结构中卷积层的深度不同,其后接着3个全连接层。前两个全连接层每层有4096个通道,第三层执行1000路ILSVRC分类并因此包含1000个通道,即每类对应一个通道,最后一层是Softmax层。所有隐藏层都包含ReLU层。在实际应用中,由于VGG16网络模型存在参数众多,运行内存占用量过大,且在特征提取过程中占用了大部分运行时间,在内存容量和计算资源有限的嵌入式设备上运行效率较低,甚至出现无法运行的情况。多尺度特征提取网络采用了6组不同尺度的特征图。如图2所示,SSD利用了38×38、19×19、10×10、5×5、3×3和1×1的特征图进行预测,对这六层特征图取不同尺寸的候选框,以提高检测精度。尽管SSD采用多尺度特征提取网络在特征图上实现类似图像金字塔的效果,有利于多尺度目标检测,但存在小目标检测能力弱的问题。
技术实现思路
本专利技术旨在提供一种基于堆叠稠密网络的挖掘机目标检测方法及装置,以解决上述技术问题,从而减少模型大小和运算量以提高检测运行效率,同时有效提高检测能力。为了解决上述技术问题,本专利技术提供了一种基于堆叠稠密网络的挖掘机目标检测方法,包括:将多个预设的深度可分离卷积网络进行堆叠以构建得到基础网络;采用多个预设的CCB模块构建多尺度特征提取网络;根据所述基础网络、所述多尺度特征提取网络以及预设的损失函数进行构建得到目标检测网络模型,并利用获取到的训练数据对所述目标检测网络模型进行训练;将待检测挖掘机图像输入至训练好的目标检测网络模型,输出挖掘机目标区域。进一步地,所述基础网络由四个密集阶段的网络结构构成,其中,第一个密集阶段由4个深度可分离卷积网络堆叠而成,第二个密集阶段、第三个密集阶段、第四个密集阶段分别由6个深度可分离卷积网络堆叠而成。进一步地,每一所述深度可分离卷积网络包括三个通道,其中,每一通道依次由卷积层、BN层、深度可分离卷积层、BN层、激活函数层构成,同一深度可分离卷积网络中三个通道的深度可分离卷积层的分辨率分别为1×1、3×3、5×5。进一步地,每一所述CCB模块由卷积层、BN层、反卷积层、EltwiseSum层、激活函数层、卷积层、BN层、激活函数层构成。进一步地,所述利用获取到的训练数据对所述目标检测网络模型进行训练,具体为:对获取到的训练数据进行预处理,利用预处理后的训练数据对所述目标检测网络模型进行训练;其中,所述预处理包括裁剪、翻转、缩放中的一种或多种。为了解决相同的技术问题,本专利技术还提供了一种基于堆叠稠密网络的挖掘机目标检测装置,包括:第一构建模块,用于将多个预设的深度可分离卷积网络进行堆叠以构建得到基础网络;第二构建模块,用于采用多个预设的CCB模块构建多尺度特征提取网络;模型训练模块,用于根据所述基础网络、所述多尺度特征提取网络以及预设的损失函数进行构建得到目标检测网络模型,并利用获取到的训练数据对所述目标检测网络模型进行训练;目标检测模块,用于将待检测挖掘机图像输入至训练好的目标检测网络模型,输出挖掘机目标区域。进一步地,所述基础网络由四个密集阶段的网络结构构成,其中,第一个密集阶段由4个深度可分离卷积网络堆叠而成,第二个密集阶段、第三个密集阶段、第四个密集阶段分别由6个深度可分离卷积网络堆叠而成。进一步地,每一所述深度可分离卷积网络包括三个通道,其中,每一通道依次由卷积层、BN层、深度可分离卷积层、BN层、激活函数层构成,同一深度可分离卷积网络中三个通道的深度可分离卷积层的分辨率分别为1×1、3×3、5×5。进一步地,每一所述CCB模块由卷积层、BN层、反卷积层、EltwiseSum层、激活函数层、卷积层、BN层、激活函数层构成。进一步地,所述利用获取到的训练数据对所述目标检测网络模型进行训练,具体为:对获取到的训练数据进行预处理,利用预处理后的训练数据对所述目标检测网络模型进行训练;其中,所述预处理包括裁剪、翻转、缩放中的一种或多种。与现有技术相比,本专利技术具有如下有益效果:本专利技术提供了一种基于堆叠稠密网络的挖掘机目标检测方法及装置,所述方法包括:将多个预设的深度可分离卷积网络进行堆叠以构建得到基础网络;采用多个预设的CCB模块构建多尺度特征提取网络;根据所述基础网络、所述多尺度特征提取网络以及预设的损失函数进行构建得到目标检测网络模型,并利用获取到的训练数据对所述目标检测网络模型进行训练;将待检测挖掘机图像输入至训练好的目标检测网络模型,输出挖掘机目标区域。本专利技术有效减少了模型大小和运算量以提高检测运行效率,同时有效提高了检测能力。附图说明图1是本专利技术一实施例提供的基于堆叠稠密网络的挖掘机本文档来自技高网
...

【技术保护点】
1.一种基于堆叠稠密网络的挖掘机目标检测方法,其特征在于,包括:/n将多个预设的深度可分离卷积网络进行堆叠以构建得到基础网络;/n采用多个预设的CCB模块构建多尺度特征提取网络;/n根据所述基础网络、所述多尺度特征提取网络以及预设的损失函数进行构建得到目标检测网络模型,并利用获取到的训练数据对所述目标检测网络模型进行训练;/n将待检测挖掘机图像输入至训练好的目标检测网络模型,输出挖掘机目标区域。/n

【技术特征摘要】
1.一种基于堆叠稠密网络的挖掘机目标检测方法,其特征在于,包括:
将多个预设的深度可分离卷积网络进行堆叠以构建得到基础网络;
采用多个预设的CCB模块构建多尺度特征提取网络;
根据所述基础网络、所述多尺度特征提取网络以及预设的损失函数进行构建得到目标检测网络模型,并利用获取到的训练数据对所述目标检测网络模型进行训练;
将待检测挖掘机图像输入至训练好的目标检测网络模型,输出挖掘机目标区域。


2.根据权利要求1所述的基于堆叠稠密网络的挖掘机目标检测方法,其特征在于,所述基础网络由四个密集阶段的网络结构构成,其中,第一个密集阶段由4个深度可分离卷积网络堆叠而成,第二个密集阶段、第三个密集阶段、第四个密集阶段分别由6个深度可分离卷积网络堆叠而成。


3.根据权利要求1所述的基于堆叠稠密网络的挖掘机目标检测方法,其特征在于,每一所述深度可分离卷积网络包括三个通道,其中,每一通道依次由卷积层、BN层、深度可分离卷积层、BN层、激活函数层构成,同一深度可分离卷积网络中三个通道的深度可分离卷积层的分辨率分别为1×1、3×3、5×5。


4.根据权利要求1所述的基于堆叠稠密网络的挖掘机目标检测方法,其特征在于,每一所述CCB模块由卷积层、BN层、反卷积层、EltwiseSum层、激活函数层、卷积层、BN层、激活函数层构成。


5.根据权利要求1所述的基于堆叠稠密网络的挖掘机目标检测方法,其特征在于,所述利用获取到的训练数据对所述目标检测网络模型进行训练,具体为:
对获取到的训练数据进行预处理,利用预处理后的训练数据对所述目标检测网络模型进行训练;其中,所述预处理包括裁剪、翻转、缩放中的一种或多种。


6.一种基于堆叠稠密网络...

【专利技术属性】
技术研发人员:毛亮郭子豪
申请(专利权)人:深圳职业技术学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1