基于改进EfficientDet模型的车库行人检测方法技术

技术编号：27657286 阅读：13 留言：0更新日期：2021-03-12 14:20

本发明专利技术公开了基于改进EfficientDet模型的车库行人检测方法，属于图像处理中的目标检测技术领域，本发明专利技术利用mosaic数据增强方法丰富行人检测的背景信息，且在批标准化Batch Normalization计算时一次性计算四张图像的数据；在主干网络EfficientNet中引入特征分流网络CSPNet，增强CNN的学习能力，能够在轻量化模型的同时保持检测的准确性，降低计算瓶颈和内存成本；在特征提取网络的顶部引入空间金字塔池化模块SPP，增加网络的感受野，在复杂多变的车库环境中能准确快速地完成行人检测。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进EfficientDet模型的车库行人检测方法
本专利技术属于图像处理中的目标检测
，具体涉及基于改进EfficientDet模型的车库行人检测方法。
技术介绍
智慧立体车库是智能化城市建设进程中的重要组成部分，它集车库停车位预定，车牌识别，自动停车，行人检测等于一体。其中，车库内的行人检测是为了保障车库内行人的安全。车库内的环境复杂多变，车位起降时必须考虑到车库内的行人走动，确保在没有行人的情况下才能升降。因此，车库行人检测的实时性和准确性对于智慧立体车库的部署十分重要。车库行人检测本质上属于目标检测问题，检测对象是车库内的行人。目标检测是图像理解和计算机视觉中的一个重要领域，它是解决分割、场景的理解、目标的追踪、图像描述、事件检测和活动识别等更具有复杂性和更高层次的视觉任务的基础。当前，优秀的目标检测模型层出不穷，都在向着更快更准确的方向前进。基于深度学习的目标检测模型通常由两部分组成，一部分是在ImageNet上预先训练好的主干网络，另一部分是用来预测类和对象边界框的预测器。对于运行在GPU平台上的目标检测模型，它们的主干网络可以是VGG，ResNet，ResNeXt或DenseNet。对于在CUP平台上运行的目标检测模型，它们的主干网络可以是Queezenet，MobileNet或ShuffleNet。预测器通常分为两类，分别是单阶段(one-stage)预测器和两阶段(two-stage)预测器。最具代表性的两阶段目标检测模型是R-CNN系列，包括fastR-CNN，faste...

【技术保护点】
1.基于改进EfficientDet模型的车库行人检测方法，其特征在于：包括以下步骤：/nS1：收集不同时段和光照环境下的车库行人图像；/nS2：针对车库行人图像，首先进行预处理，然后随机抽取4张图像利用mosaic数据增强方法合成一张复合图像，得到训练样本；/nS3：在主干网络EfficientNet中引入特征分流网络CSPNet，实现特征分流，得到轻量化的模型CSPEfficientNet；/nS4：在CSPEfficientNet分类层的前面引入空间金字塔池化模块SPP，得到新的主干网络CSPEfficientNet-SPP，以增加特征提取网络的感受野；/nS5：将CSPEfficientNet-SPP和特征融合网络BiFPN、分类网络class-prediction-net以及定位网络box-prediction-net相结合，得到改进的EfficientDet模型；/nS6：对改进的EfficientDet模型采用迁移学习，得到车库行人检测模型。/n

【技术特征摘要】
1.基于改进EfficientDet模型的车库行人检测方法，其特征在于：包括以下步骤：
S1：收集不同时段和光照环境下的车库行人图像；
S2：针对车库行人图像，首先进行预处理，然后随机抽取4张图像利用mosaic数据增强方法合成一张复合图像，得到训练样本；
S3：在主干网络EfficientNet中引入特征分流网络CSPNet，实现特征分流，得到轻量化的模型CSPEfficientNet；
S4：在CSPEfficientNet分类层的前面引入空间金字塔池化模块SPP，得到新的主干网络CSPEfficientNet-SPP，以增加特征提取网络的感受野；
S5：将CSPEfficientNet-SPP和特征融合网络BiFPN、分类网络class-prediction-net以及定位网络box-prediction-net相结合，得到改进的EfficientDet模型；
S6：对改进的EfficientDet模型采用迁移学习，得到车库行人检测模型。

2.根据权利要求1所述的基于改进EfficientDet模型的车库行人检测方法，其特征在于：步骤S2中，所述的预处理方式包括图像尺寸裁剪、水平翻转和标准化处理。

3.根据权利要求1所述的基于改进EfficientDet模型的车库行人检测方法，其特征在于：步骤S2中，所述的mosaic数据增强方法为：
S21：获取统一尺寸后的图像长宽，利用逐像素点填充的方式生成一张长宽翻倍的新图像；
S22：利用索引获取当前图像，再利用随机抽样的方式从样本集中抽取3张图像，随机截取4张图像的部分区域分别填充至新图像的左上、右上、左下、右下4个区域，组成复合图像，最后将图像长宽缩小一倍；
S23：根据截取图像在新图像中的位置，转换每张图像中相应的boxes坐标至新图像，得到相应的annotations标签数据；
S24：将新图像和annotations标签数据打包作为一个新的训练样本，输入网络中训练。

4.根据权利要求1所述的基于改进Effic...

【专利技术属性】
技术研发人员：牛丹，李永胜，陈夕松，许翠红，陈善龙，刘子璇，
申请(专利权)人：南京云牛智能科技有限公司，东南大学，江阴市智行工控科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人