【技术实现步骤摘要】
一种基于改进YOLOv8n的违规行为检测方法
[0001]本专利技术属于深度学习计算机视觉领域,具体涉及一种基于改进
YOLOv8n
的违规行为检测方法
。
技术介绍
[0002]园区的生产设备
、
重要生产仪器等逐步増多,安全生产成了当下最需要强调的问题
。
[0003]深度学习目标检测算法分为两个阶段目标检测和单阶段目标检测,两个阶段目标检测速度较慢,训练较为困难
。
单阶段目标检测算法分为
YOLO
系列和
SSD
系列,
YOLO
系列使用回归算法对最后的特征图回归先验框位置和所属类别,
SSD
系列使用不同尺度特征图对不同尺度目标进行检测
。YOLO
系列因其检测速度快,训练简单,能够实现实时检测,应用广泛,成为了当前最流行的检测框架,本文以
YOLO
系列最新版本
YOLOv8n
为基础网络并且加以改进
。
专利技术 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于改进
YOLOv8n
的违规行为检测方法,其特征在于包括以下步骤:步骤1:使用摄像头获取违规行为视频,使用视频处理工具
FFMPEG
将视频解码成图片,采用
Labelimg
软件对数据集进行标注,标注后标签的文件格式为
txt
格式;步骤2:将步骤1获取的数据集划分成训练集,验证集和测试集;步骤3:原始的
YOLOv8n
网络分为
Backbone
和
Head
两部分,包含卷积模块
、C2f
模块
、SPPF
模块
、
上采样模块和拼接模块,其中构建
C2f
模块使用了
BottleNeck
模块,
BottleNeck
模块分为
BottleNeck1
模块和
BottleNeck2
模块;
YOLOv8n
网络
Backbone
部分使用
BottleNeck1
模块构建
C2f
模块,
Head
使用
BottleNeck2
模块构建
C2f
模块;使用通道重排机制对
C2f
模块进行改进,将改进的
C2f
模块称为
C2fg
模块;
(1)BottleNeck1
模块和
BottleNeck2
模块,包括以下结构:首先使用卷积核为3的二维卷积层,归一化层和
SiLU
激活函数对输入特征值进行特征值提取;然后使用卷积核为3的二维卷积层,归一化层和
SiLU
激活函数对特征值进行提取形成中间特征值;
BottleNeck1
模块最后使用残差连接将输入特征值与中间特征值相加形成输出特征值;
BottleNeck1
模块公式为:
X
bout1
=
X
bin1
+SiLU(Bn2d(Conv2d
k
=3(SiLU(Bn2d(Conv2d
k
=3(X
bin1
))))))
其中
X
bin1
、X
bout1
表示
BottleNeck1
模块输入与输出特征值,
Conv2d
k
=3表示卷积核为3的二维卷积层,
Bn2d(
·
)
表示二维归一化层,
SiLU(
·
)
表示
SiLU
激活函数;
(2)BottleNeck2
模块最后不使用残连接,直接输出,
BottleNeck2
模块公式为:
X
bout2
=
SiLU(Bn2d(Conv2d
k
=3(SiLU(Bn2d(Conv2d
k
=3(X
bin2
))))))
其中
X
bin2
、X
bout2
表示
BottleNeck2
模块输入与输出特征值;上述通道重排机制公式:
X
cout
=
CS(X
cin
)
=
Concat(S1,S2,....S
n
)S
n
=
Concat(L
1n
,L
2n
,...L
nn
)
其中
X
cin
,
X
cout
表示通道重排输入与输出特征值,将
X
out
分为
n
组
n
=2,
X
out
的第
n
组特征值为
S
n
,将
S
n
同样分为
n
组,
S
n
的第
n
组特征值为
L
nn
;
S
n
为
b
×
c
个
h
×
w
矩阵,
b
为
Batchsize
大小,
b∈(1,16)
;
c
为特征值的通道数量,为特征值的通道数量,为特征值的通道数量,表示向下取整;
h
,
w
为特征值的宽度和高度,
h,w∈(20,640)
,
L
nn
为
b
×
c
个
h
×
w
矩阵,
b
为
Batchsize
大小,
b∈(1,16)
;
c
为特征值的通道数量,
h
,
w
为特征值的宽度和高度,
h
,
w∈(20,640)
;
CS(
·
)
表示通道重排操作,
Concat(
·
)
代表在通道维度上进行拼接操作,
Concat
的操作公式如下:式中,
X、Y
均为该通道输入的特征值图,
X
,
Y
均为
b
×
c
个
h
×
w
矩阵,
b
为
Batchsize
大小,
b∈(1,16)
;
c
为特征值的通道数量,
c∈(32,1536)
;
h
,
w
为特征值的宽度和高度,
h
,
w∈(20,640)
;
k
表示输入特征值图
X
的通道数,
k∈(32,1536)
,
d
为输入特征值图
Y
的通道数,
d∈(32,1536)
,
i∈[1,k]
,
j∈[1,d]
技术研发人员:罗仁泽,刘恒,林泓宇,王磊,吴涛,雷璨如,武娟,易玺,廖波,曹瑞,赵丹,
申请(专利权)人:西南石油大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。