基于轻量化改进YOLOv8模型的驾驶员人脸检测方法及介质技术

技术编号：41135597 阅读：6 留言：0更新日期：2024-04-30 18:06

本发明专利技术公开了基于轻量化改进YOLOv8模型的驾驶员人脸检测方法及介质。事实上方法包括：对YOLOv8模型进行轻量化改进；使用改进后的网络对构建好的驾驶员人脸数据集进行训练；使用训练好后的网络权重文件对用于测试的图像进行检测。本发明专利技术改进了YOLOv8s网络，能在准确检测出驾驶员人脸的前提下降低了网络的参数量，从而在车载的场景下，降低所占用的存储空间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理、目标检测和深度学习等领域，具体涉及一种基于轻量化改进yolov8模型的驾驶员人脸检测方法及介质。

技术介绍

1、随着我国汽车保有量的不断上升，交通事故已经成为我国道路交通安全领域需要重视的问题。据相关研究，在这些交通事故中，很大一部分由驾驶员的不良状态造成。当驾驶员处于正常良好的状态时，驾驶车辆的失误少，工作效率也高，交通事故的发生概率低；相反，当驾驶员处于消极状态时，会对行车安全产生很大的阻碍，一些失误也会增多，发生交通事故的概率大大增加。

2、目前，由于图像识别、深度学习的迅速发展，主要是通过车内座舱摄像头监测驾驶员人脸来监测驾驶员状态。因此，能够迅速实时检测出驾驶员人脸就显得尤为重要。

3、近年来，目标检测技术的算法也取得了重大的突破，如今，基于卷积神经网络的目标检测方法已经超越传统目标检测方法，成为当前目标检测的主流方法。目前主流的基于卷积神经网络的目标检测算法主要分为两大种类，第一类是两阶段(two stage)目标检测算法，以早期的r-cnn、fast r-cnn等为代表，该算法首先产生候选区域(regionproposals)，然后利用卷积神经网络对候选区域进行分类(也会修正位置)。因为需要进行多次检测和分类过程，所以该方法的准确度高，但是速度相对较慢；另一类是单阶段(onestage)目标检测算法，以yolo系列(you only look once)、ssd(single shot multiboxdetector)、overfeat、retinanet等为代表。

4、随着yolo系列算法的不断发展，2023年提出了新的yolo网络模型yolov8网络。yolov8网络的整体网络结构共有23层，包括backbone、neck、head三大部分。在backbone特征提取部分和neck特征融合部分相比于yolov5，yolov8将yolov5中的c3结构替换为梯度流更为丰富的c2f结构，并且对不同尺度的模型调整了不同的通道数。head部分相较于yolov5进行了较大的改进：(1)使用了目前主流的解耦头结构(decoupled-head)，将分类和检测头分离。(2)从anchor-based换成anchor-free。其相较于其他版本的yolo网络模型性能优势显著，但是普通的yolov8目标检测网络的参数量较大。

5、因此本专利技术将yolov8s网络作为基础网络进行改进，在尽量不降低准确性的前提下，对网络进行轻量化改进，减少网络的参数量。

技术实现思路

1、为了能够降低网络的参数量，提高驾驶员人脸检测的实时性，本专利技术提出一种基于轻量化改进的yolo模型驾驶员人脸检测方法，该方法降低了网络的参数量，从而在车载的情况下，降低了所需占用的存储空间。

2、为了实现本专利技术的目的，本专利技术提供的一种基于轻量化改进yolov8模型的驾驶员人脸检测方法，包括以下步骤：

3、构建轻量化改进的yolov8s模型，所述改进的yolov8s模型中做出的改进包括：backbone部分中，在cbs模块中使用gsconv模块替换原先的conv模块，将mish激活函数替换原来的silu激活函数，并在c2f模块中加入cbam注意力机制；neck部分中，在cbs模块中使用gsconv模块替换原先的conv模块，将mish激活函数替换原来的silu激活函数，使用vovgscsp模块替换原先的c2f模块，使用轻量化的carafe算子，使用bifpn特征金字塔融合结构；输出端使用eiou损失函数；

4、对轻量化改进后的yolov8s模型进行训练；

5、将待测图像输入训练得到的轻量化改进后的yolov8s模型中，得到驾驶员人脸检测的检测结果。

6、优选地，在训练好网络轻量化改进后的yolov8s模型后，将测试集图像输入进训练好的网络模型及权重文件中进行检测，以验证其检测精度。

7、优选地，在训练前，先构建驾驶员人脸检测数据集并进行预处理。

8、本专利技术还提供一种基于轻量化改进yolov8模型的驾驶员人脸检测系统，包括以下模块：

9、训练模块，用于训练轻量化改进的yolov8s模型，所述改进的yolov8s模型中做出的改进包括：backbone部分中，在cbs模块中使用gsconv模块替换原先的conv模块，将mish激活函数替换原来的silu激活函数，并在c2f模块中加入cbam注意力机制；neck部分中，在cbs模块中使用gsconv模块替换原先的conv模块，将mish激活函数替换原来的silu激活函数，使用vovgscsp模块替换原先的c2f模块，使用轻量化的carafe算子，使用bifpn特征金字塔融合结构；输出端使用eiou损失函数；

10、检测模块，用于将待测图像输入训练得到的轻量化改进后的yolov8s模型中，得到驾驶员人脸检测的检测结果。

11、本专利技术还提供一种装置，包括至少一个处理器和至少一个存储器，所述存储器存储有至少一个程序；当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现前述方法。

12、本专利技术还提供一种存储介质，所述存储介质存储有处理器可执行的程序，所述程序被处理器执行时，实现前述方法。

13、与现有技术相比，本专利技术具有的有益效果至少如下：

14、(1)本专利技术基于轻量化改进的yolov8s网络进行驾驶员人脸检测，将驾驶员人脸检测和深度学习相结合在一起，能够为驾驶员人脸实时检测提供有效的方法。在仍然能够精确地检测出驾驶员人脸的情况下，降低了网络的参数量，降低了车载所需使用的存储空间。

15、(2)在backbone部分，本专利技术使用gsconv模块替换主干网络中原先的conv模块。同时在c2f模块中加入cbam注意力机制。在减少参数量的同时，可以提高网络的特征提取能力。

16、(3)在neck部分，本专利技术使用gsconv模块替换网络中原先的conv模块。使用vovgscsp模块替换原先的c2f模块。使用轻量化的carafe算子。改进后的neck网络相比于原先的网络，特征融合结构并没有发生大的变化，但是参数量有了很大的下降。

17、(4)本专利技术使用eiou损失函数，能够提高检测的精确度。

本文档来自技高网...

【技术保护点】

1.一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，基于构建的数据集对轻量化改进的YOLOv8s模型进行训练，其中，构建的数据集中的数据包括已有数据和实车检测数据，所述已有数据为现有的模拟实车场景下的驾驶员视频数据。

3.根据权利要求1所述的一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，GSConv模块中，先进行普通卷积的下采样，然后使用DWConv深度卷积，并将两种卷积的的结果拼接起来，最后对拼接结果进行shuffle操作以增强通道间信息的联系。

4.根据权利要求1所述的一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，CBAM注意力模块包括串接的通道注意力子模块和空间注意力子模块，通道注意力子模块中，分别采用基于宽度的全局最大池化和基于高度的全局平均池化，然后经过MLP共享神经网络得到两个特征图，最后叠加并通过激活函数输出特征图；空间注意力子模块中，先将输入经过全局最大池化和

5.根据权利要求1所述的一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，VoVGSCSP模块中，首先对输入特征图进行标准卷积，之后进行split操作以将原特征图分成两个通道数为输入特征图通道数一半的新特征图，然后其中一个新的特征图进行两次GSConv卷积模块操作后，与另一半特征图进行通道维度连接操作。

6.根据权利要求1所述的一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，所述EiOU损失函数包括重叠损失、中心距离损失、宽高损失，表达式为

7.根据权利要求1-6任一所述的一种基于轻量化改进YOLOv8模型的驾驶员人脸检测方法，其特征在于，BiFPN特征金字塔融合结构中，在原PAN结构上增加额外的跳跃性连接边与Concat模块，增加了P3到P3、P4到P4与P5到P5的链接，以及在不同层级间增加额外的信息传输，且在上采样中加入CARAFE算子。

8.一种基于轻量化改进YOLOv8模型的驾驶员人脸检测系统，其特征在于，用于实现权利要求1-7任一所述的方法，包括以下模块：

9.一种装置，其特征在于，包括至少一个处理器和至少一个存储器，所述存储器存储有至少一个程序；当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现权利要求1-7任一项所述方法。

10.一种存储介质，其特征在于，所述存储介质存储有处理器可执行的程序，所述程序被处理器执行时，实现权利要求1-7任一所述的方法。

...

【技术特征摘要】

1.一种基于轻量化改进yolov8模型的驾驶员人脸检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于轻量化改进yolov8模型的驾驶员人脸检测方法，其特征在于，基于构建的数据集对轻量化改进的yolov8s模型进行训练，其中，构建的数据集中的数据包括已有数据和实车检测数据，所述已有数据为现有的模拟实车场景下的驾驶员视频数据。

3.根据权利要求1所述的一种基于轻量化改进yolov8模型的驾驶员人脸检测方法，其特征在于，gsconv模块中，先进行普通卷积的下采样，然后使用dwconv深度卷积，并将两种卷积的的结果拼接起来，最后对拼接结果进行shuffle操作以增强通道间信息的联系。

4.根据权利要求1所述的一种基于轻量化改进yolov8模型的驾驶员人脸检测方法，其特征在于，cbam注意力模块包括串接的通道注意力子模块和空间注意力子模块，通道注意力子模块中，分别采用基于宽度的全局最大池化和基于高度的全局平均池化，然后经过mlp共享神经网络得到两个特征图，最后叠加并通过激活函数输出特征图；空间注意力子模块中，先将输入经过全局最大池化和基于高度的全局平均池化，然后经过卷积和激活函数后，输出特征图。

5.根据权利要求1所述的一种基于轻量化改进yolov8模型的驾驶员人脸检测方法，其特征在于，vovgscsp模块中，...

【专利技术属性】
技术研发人员：姜立标，刘鸿，张志德，马乐，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人