一种基于改进YOLOv8的轻量级红外目标检测算法制造技术

技术编号：40558031 阅读：7 留言：0更新日期：2024-03-05 19:19

一种基于改进YOLOv8的轻量级红外目标检测算法，包括步骤：S1：选用Flir红外数据集，划分训练集、验证集、测试集；S2：改进YOLOv8网络的主干网络：基于YOLOv8网络基础，将StemBlock和Shuffle_Block相结合形成YOLOv8的主干网，并在SPPF层后添加MSCA注意力机制；S3：改进YOLOv8网络的颈部：将DWConvBlock连接ADD模块；S4：创建新损失函数：将IoU损失函数与SlideLoss损失函数相融合得到新损失函数SlideIoULoss；S5：采用五头预测头替换原有的检测头，将头预测头的五个接头分别与YOLOv8网络中颈部的DWConvBlock层连接；步骤S6：利用划分好的Flir红外数据集对S2‑S5中所构建的目标检测模型进行训练；S7：利用训练好的目标检测模型对训练集进行目标检测，并对该模型的性能进行评估。本发明专利技术能降低检测时模型的大小与参数量，实现了模型算法的轻量化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习和计算机视觉，具体涉及一种基于改进yolov8的轻量级红外目标检测算法。

技术介绍

1、yolo(you only look once)作为经典的目标检测算法，旨在找出图像中特定目标的类别和位置，现已广泛应用于各个领域，如自动驾驶、遥感图像、视频监控以及医疗检测等。

2、自2016年以yolov1为代表的单阶段（one-stage）目标检测方法出现以来，不断版本更新，至今已到v8系列。纵观单阶段目标检测方法的发展历程可以发现，从首个单阶段目标检测方法 yolov1 提出至2023年的yolov8，yolo系列的目标检测方法伴随着单阶段目标检测的发展而发展，已经成为 one-stage 方法的典型代表。

3、使用yolov8s权重，进行yolov8纯网络训练，它的优势在于实时性高、简洁高效、多尺度检测、全局上下文信息利用和多任务学习。这些特点使得它在快速目标检测和实时应用场景中表现出色。但是它的模型大小（best.pt）、参数量、gflops较大，会形成计算成本过高的问题和训练模型时间过长的问题。

技术实现思路

1、针对上述yolov8s权重的模型、参数量、gflops较大引起的计算成本过高和训练模型时间过长的技术问题，本技术方案提供了一种基于改进yolov8的轻量级红外目标检测算法，对yolov8的主干网络和颈部特征融合网络进行轻量化，并升级损失函数；能有效的解决上述问题。

2、本专利技术通过以下技术方案实现：

4、s1：选用flir红外数据集，并按照比例随机划分为训练集、验证集、测试集；

5、s2：改进yolov8网络的主干网络：基于yolov8网络基础，将stemblock和shuffle_block相结合作为yolov8的主干网，并在主干网的sppf层后添加msca注意力机制；

6、s3：改进yolov8网络的颈部：将dwconvblock连接操作add模块；

7、s4：创建新损失函数：将iou损失函数与slideloss损失函数相融合得到新损失函数slideiouloss；

8、s5：采用五头预测头替换原有的检测头，将头预测头的五个接头分别与yolov8网络中颈部的dwconvblock层连接；五头预测头包括：

9、（1）动态网格重建部分：使得预测头支持动态网格重建，即在推理过程中根据输入特征图的形状自动计算先验框的位置和尺寸；使得模型能够适应不同形状的输入，无需事先定义固定的先验框；

10、（2）导出模式部分：使得预测头有导出模式的功能，在导出模式下，可产生适用于特定导出格式的输出，可以方便地将模型导出到不同的推理平台或部署环境中；

11、（3）多层检测：通过多个检测层进行检测，每个检测层都会产生一组边界框和类别概率的预测，多层检测的机制可以提高模型对不同尺度目标的检测能力；

12、（4）边界框回归：使用了dfl技术进行边界框回归，dfl通过对预测的边界框进行分布融合和定位来提升检测的准确性；

13、（5）偏置初始化：通过对检测层的偏置进行初始化，用于调整边界框和类别概率的预测结果，可以帮助模型更好地适应具体的检测任务；

14、s6：利用划分好的flir红外数据集对s2-s5中所构建的目标检测模型进行训练；

15、s7：利用训练好的目标检测模型对训练集进行目标检测，并对该模型的性能进行评估。

16、进一步的，步骤s1所述的flir红外数据集包括步行人员perso、骑车人员bicycle和汽车car三种类别，共包含8862张训练集，1366张测试集数据；作为红外检测数据集或自动驾驶场景的基础数据，用于yolo目标检测系列的训练。

17、进一步的，步骤s2所述的将stemblock和shuffle_block相结合，操作方式为：将stemblock作为主干网络的起始部分，将shuffle_block作为主干网络的中间部分，对特征图的通道进行混洗，将通道按照指定的分组数进行重新排列。

18、进一步的，步骤s2所述的由stemblock和shuffle_block相结合得到yolov8的主干网，包括设置在起始部分的卷积层1、卷积层2、卷积层3、最大池化层和卷积层4，具体的为：

19、卷积层1：负责将输入特征从 c1 维度映射到 c2 维度，可以指定卷积核大小 k，步长 s，填充 p，分组卷积 g，膨胀 d 等参数；

20、卷积层2：将卷积层1输出的特征维度减半；

21、卷积层3：对卷积层2的输出进行3*3卷积，步长为2，进行下采样；

22、最大池化层：对卷积层1的输出进行2*2的最大池化，步长为2，进行下采样；

23、concat连接操作：将卷积层3和最大池化层的输出在通道维度上拼接起来；

24、卷积层4：将拼接后的特征进行进一步的卷积操作，输出最终的特征；

25、由stemblock和shuffle_block相结合得到yolov8的主干网，还包括设置在中间部分的两个分支，具体的为：

26、两个分支为分支1和分支2；根据给定的步长stride进行不同的处理：

27、①如果步长为1，分支1对输入特征进行深度卷积：3*3卷积，stride步长也为1，然后进行通道混洗操作；

28、②分支2对输入特征进行1*1卷积，通道混洗，然后根据步长不同进行3*3深度卷积。

29、进一步的，当输入的图像为640*640*3图像时，经过stemblock与shuffle_block后，通道数增加。

30、进一步的，步骤s2所述的在主干网的sppf层后添加msca注意力机制，msca注意力机制部分包括：

31、卷积层0 conv0是一个5*5分组卷积层，用于计算输入特征的通道间相关性；

32、conv0-1和conv0-2分别是1*7和7*1的分组卷积层，用于捕捉更长范围的横向特征关系；

33、conv1-1和conv1-2分别是1*11和11*1的分组卷积层，用于捕捉中等范围的横向特征关系；

34、conv2-1和conv2-2分别是1*21和21*1的分组卷积层，用于捕捉更长范围的横向特征关系；

35、最终卷积conv3是一个1*1卷积层，用于整合不同尺度的特征信息。

36、进一步的，在所述的msca注意力机制中，输入特征 x 首先通过 conv0 层进行通道间相关性计算，计算得到的相关特征分别通过conv0_1和conv0_2、conv1_1和conv1_2、conv2_1和conv2_2进行横向特征关系的捕捉；将特征按元素相加，并通过conv3进行整合；最终的输出通过乘以输入特征 u，用于产生具有权重的本文档来自技高网...

【技术保护点】

1.一种基于改进YOLOv8的轻量级红外目标检测算法，期特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S1所述的Flir红外数据集包括步行人员perso、骑车人员bicycle和汽车car三种类别，共包含8862张训练集，1366张测试集数据；作为红外检测数据集或自动驾驶场景的基础数据，用于yolo目标检测系列的训练。

3.根据权利要求1所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S2所述的将StemBlock和Shuffle_Block相结合，操作方式为：将StemBlock作为主干网络的起始部分，将Shuffle_Block作为主干网络的中间部分，对特征图的通道进行混洗，将通道按照指定的分组数进行重新排列。

4.根据权利要求1或3所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S2所述的由StemBlock和Shuffle_Block相结合得到YOLOv8的主干网，包括设置在起始部分的卷积层1、卷积层2、卷积层3、最大池化层和卷积层4，具体的为：

5.根据权利要求4所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：当输入的图像为640*640*3图像时，经过StemBlock与Shuffle_Block后，通道数增加。

6.根据权利要求4所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S2所述的在主干网的SPPF层后添加MSCA注意力机制，MSCA注意力机制部分包括：

7.根据权利要求6所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：在所述的MSCA注意力机制中，输入特征 x 首先通过 Conv0 层进行通道间相关性计算，计算得到的相关特征分别通过Conv0_1和Conv0_2、Conv1_1和Conv1_2、Conv2_1和Conv2_2进行横向特征关系的捕捉；将特征按元素相加，并通过Conv3进行整合；最终的输出通过乘以输入特征 u，用于产生具有权重的特征表示。

8.根据权利要求1所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S3所述的将DWConvBlock连接操作ADD模块得到的YOLOv8网络的颈部包括：

9.根据权利要求1所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S4所述的新损失函数SlideIoULoss的主要功能是根据自动计算得到的IoU值，调整每个样本的损失，以适应不同样本的特性；SlideIoULoss的具体操作方式为：

10.根据权利要求1所述的一种基于改进YOLOv8的轻量级红外目标检测算法，其特征在于：步骤S5所述的导出格式包括aved_model、pb、tflite、edgetpu、tfjs。

...

【技术特征摘要】

1.一种基于改进yolov8的轻量级红外目标检测算法，期特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于改进yolov8的轻量级红外目标检测算法，其特征在于：步骤s1所述的flir红外数据集包括步行人员perso、骑车人员bicycle和汽车car三种类别，共包含8862张训练集，1366张测试集数据；作为红外检测数据集或自动驾驶场景的基础数据，用于yolo目标检测系列的训练。

3.根据权利要求1所述的一种基于改进yolov8的轻量级红外目标检测算法，其特征在于：步骤s2所述的将stemblock和shuffle_block相结合，操作方式为：将stemblock作为主干网络的起始部分，将shuffle_block作为主干网络的中间部分，对特征图的通道进行混洗，将通道按照指定的分组数进行重新排列。

4.根据权利要求1或3所述的一种基于改进yolov8的轻量级红外目标检测算法，其特征在于：步骤s2所述的由stemblock和shuffle_block相结合得到yolov8的主干网，包括设置在起始部分的卷积层1、卷积层2、卷积层3、最大池化层和卷积层4，具体的为：

5.根据权利要求4所述的一种基于改进yolov8的轻量级红外目标检测算法，其特征在于：当输入的图像为640*640*3图像时，经过stemblock与shuffle_block后，通道数增加。

6.根据权利要求...

【专利技术属性】
技术研发人员：洪远，姜明新，杜强，黄俊闻，项靖，王杰，
申请(专利权)人：淮阴工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人