一种基于改进的YOLO模型的车位状态识别方法技术

技术编号:37291247 阅读:23 留言:0更新日期:2023-04-21 03:21
本发明专利技术公开一种基于改进的YOLO模型的车位状态识别方法,包括:构建停车位检测数据集,并划分训练集和测试集;构建改进的YOLOV4

【技术实现步骤摘要】
一种基于改进的YOLO模型的车位状态识别方法


[0001]本专利技术涉及图像处理、目标检测和深度学习等领域,具体涉及一种基于改进的YOLO模型的车位状态识别方法。

技术介绍

[0002]近年来,随着汽车产业迅速壮大,在人工智能和大数据的帮助下,无人驾驶技术得到了显著的发展。作为无人驾驶技术的重要一环,研究和推广自动泊车能够有效地解决路面交通安全的问题和停车难的问题。而作为自动泊车最为重要的一环,环境感知是执行整个自动泊车流程的首要前提。识别汽车周围停车位的状态则是环境感知过程的重要一部分,也是能否准确识别车位和精准将车停入车位的前提条件。车位状态识别在人们日常泊车入空车位的过程中能够起到重要的辅助作用,因此较好地快速地识别车位状态具有十分重要的意义。
[0003]近年来,目标检测技术的算法也取得了重大的突破,如今,基于卷积神经网络的目标检测方法已经超越传统目标检测方法,成为当前目标检测的主流方法。目前主流的基于卷积神经网络的目标检测算法主要分为两大种类,第一类是两阶段(two stage)目标检测算法,以早期的R

CNN、Fast R

CNN等为代表,该算法首先产生候选区域(region proposals),然后利用卷积神经网络对候选区域进行分类(也会修正位置)。因为需要进行多次检测和分类过程,所以该方法的准确度高,但是速度相对较慢;另一类是单阶段(one stage)目标检测算法,以YOLO系列(You Only Look Once)、SSD(Single Shot multibox Detector)、OverFeat、RetinaNet等为代表。此类算法是一种端到端的检测算法,其不需要产生候选区域这一阶段,直接产生物体的类别概率和位置坐标值,经过单次检测即可直接得到最终的检测结果,因此相比较之下有着更快的检测速度。
[0004]随着YOLO系列算法的不断发展,为解决卷积神经网络模型的参数量及计算量过大的问题,2020年提出了一种轻量化模型YOLOV4

tiny网络。整体网络结构共有38层,使用了三个残差单元,激活函数使用LeakyReLU,目标的分类与回归改为使用两个特征层,合并有效特征层时使用了特征金字塔(FPN)网络,其相较于其他版本的轻量化模型性能优势显著,但是普通的YOLOV4

tiny目标检测算法的识别精度会受到自然天气、光照强度等因素的影响,无法保证在不同场景下检测的实时性和准确性。

技术实现思路

[0005]为了能够实时且准确地识别车位状态,本专利技术提供一种基于改进YOLO模型的车位状态识别方法,能够保证较高的车位状态识别的速度与精度,并且稳定性好,鲁棒性强,能够应用到自动泊车的系统中。
[0006]为了实现本专利技术目的,本专利技术提供的一种基于改进YOLO模型的车位状态识别方法,包括以下步骤:
[0007]构建停车位检测数据集,并划分训练集和测试集;
[0008]构建改进的YOLOV4

tiny网络模型,其中,将YOLOV4

tiny网络模型原来的主干网络CSPDarknet53

tiny替换为轻量化网络mobilenetv3,在特征金字塔FPN前加入SE注意力机制,将Mish激活函数替换原来的Leaky ReLU激活函数,将EiOU损失函数替换原来的CiOU损失函数,所述SE注意力机制包括挤压模块、激励模块和融合模块,挤压模块用于对特征图u
c
进行全局平均池化并压缩得到数值z
c
,激励模块用于对数值z
c
进行处理,得到每个通道的通道权重值s,融合模块用于将每个通道的通道权重值s对特征图u
c
进行权重赋值,得到特征图X;
[0009]采用训练集对改进的YOLOV4

tiny网络模型进行训练;
[0010]将待测图像输入训练得到的改进的YOLOV4

tiny网络模型中,得到车位状态识别结果。
[0011]进一步地,所述构建停车位检测数据集,并划分训练集和测试集,包括:
[0012]先实车采集一部分停车位图像,构建数据集,所述数据集中的图像尽可能多地覆盖多种泊车场景,并将所构建的数据集与开源的数据集整合到一起;
[0013]对整合后的数据集进行标注,包括空闲车位和占用空位,并划分训练集和测试集;
[0014]对数据进行增强。
[0015]进一步地,所述挤压模块中,数值z
c
的计算公式如下:
[0016][0017]式中,W表示特征图的宽度,H表示特征图的高度,C表示特征图的通道数,
c
代表卷积后的特征图。
[0018]进一步地,所述激励模块包括两层全连接层。
[0019]进一步地,每个通道权重值s生成向量S,所述融合模块将特征图u
c
中的每个通道的H*W个数值都乘上S中对应通道的权值,最终得到特征图X,特征图X的尺寸大小与特征图u
c
完全一样。
[0020]进一步地,所述Mish激活函数的计算公式如下:
[0021]Mish=x*tanh(ln(1+
x
))
[0022]式中,x表示激活函数的输入。
[0023]进一步地,EiOU损失函数包括重叠损失,中心距离损失和宽高损失。
[0024]进一步地,EiOU损失函数的惩罚项L
EIOU
公式为
[0025][0026]式中,IOU表示交并比,b表示预测框的中心点,b
gt
表示真实框的中心点,ρ表示两个中心点间的欧氏距离,n表示同时包含预测框和真实框的最小包闭区域的对角线距离,C
w
和C
h
表示覆盖两个Box的最小外接框的宽度和高度。L
EIOU
表示总损失,L
IOU
表示重叠损失,L
dis
表示中心距离损失,L
asp
表示宽高损失,w代表预测框的宽,w
gt
代表真实框的宽,h表示预测框的高,h
gt
表示真实框的高。
[0027]进一步地,对YOLOV4

tiny网络模型的改进还包括:将原来Yolo Head中的3*3的卷积替换为深度可分离卷积。
[0028]进一步地,所述深度可分离卷积包括逐通道卷积和逐点卷积。
[0029]与现有技术相比,本专利技术具有的有益效果至少如下:
[0030]本专利技术基于改进的YOLO4

tiny进行车位状态检测,将车位状态的识别和深度学习相结合,能够为车位状态识别的实时检测提供有效的方法,能够很好的检测到图像中的空闲车位和占用车位。
[0031]本专利技术采用注意力机制SENet与YOLOV4
‑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的YOLO模型的车位状态识别方法,其特征在于,包括以下步骤:构建停车位检测数据集,并划分训练集和测试集;构建改进的YOLOV4

tiny网络模型,其中,将YOLOV4

tiny网络模型原来的主干网络CSPDarknet53

tiny替换为轻量化网络mobilenetv3,在特征金字塔FPN前加入SE注意力机制,将Mish激活函数替换原来的Leaky ReLU激活函数,将EiOU损失函数替换原来的CiOU损失函数,所述SE注意力机制包括挤压模块、激励模块和融合模块,挤压模块用于对特征图u
c
进行全局平均池化并压缩得到数值z
c
,激励模块用于对数值z
c
进行处理,得到每个通道的通道权重值s,融合模块用于将每个通道的通道权重值s对特征图u
c
进行权重赋值,得到特征图X;采用训练集对改进的YOLOV4

tiny网络模型进行训练;将待测图像输入训练得到的改进的YOLOV4

tiny网络模型中,得到车位状态识别结果。2.根据权利要求1所述的一种基于改进的YOLO模型的车位状态识别方法,其特征在于,所述构建停车位检测数据集,并划分训练集和测试集,包括:先实车采集一部分停车位图像,构建数据集,所述数据集中的图像尽可能多地覆盖多种泊车场景,并将所构建的数据集与开源的数据集整合到一起;对整合后的数据集进行标注,包括空闲车位和占用空位,并划分训练集和测试集;对数据进行增强。3.根据权利要求1所述的一种基于改进的YOLO模型的车位状态识别方法,其特征在于,所述挤压模块中,数值z
c
的计算公式如下:式中,W表示特征图的宽度,H表示特征图的高度,C表示特征图的通道数,u
c
代表卷积后的特征图,i表示高度的第i个单位,j表示宽度的第j个单位。4.根据权利要求1所述的一种基于改进的YOLO模型的车位状态识别方法,其特征在于,所述激励模块包括两层全连...

【专利技术属性】
技术研发人员:陈朗姜立标崔博非符茂达
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1