一种基于自适应特征层融合的船舶目标检测方法技术

技术编号:38104931 阅读:5 留言:0更新日期:2023-07-06 09:26
本发明专利技术公开了一种基于自适应特征层融合的船舶目标检测方法,采用YOLOv4检测模型进行目标检测,模型包括特征提取主干网络、特征融合增强网络以及输出检测网络;特征融合增强网络采用ASFF网络结构进行不同尺寸的特征图的融合;包括:将待检测图像输入检测模型,并通过特征提取主干网络进行特征提取,得到三个不同尺度的特征;将三个不同尺度的特征图输入特征融合网络的ASFF网络结构进行自适应融合,ASFF网络结构自适应调整各尺度特征在融合时的空间权重;将三个不同尺度的经过融合后的特征图分别送入对应的输出检测网络。本发明专利技术使不同特征图之间有效信息的充分利用,增强算法模型有效特征提取能力,提升检测模型检测精度。提升检测模型检测精度。提升检测模型检测精度。

【技术实现步骤摘要】
一种基于自适应特征层融合的船舶目标检测方法


[0001]本专利技术属于计算机视觉的图像检测领域,涉及到一种基于自适应特征层融合的船舶目标检测方法。

技术介绍

[0002]图像的目标检测是计算机视觉的基础问题。给定一个输入图像,目标检测需要确定图像中所有待检测目标的位置以及对应的类别信息。例如,对于船舶图像输入需要对其中的所有待检测的船舶目标进行检测标记,用刚好符合船舶目标大小的矩形检测框包围待检测船舶目标,并在检测框上注明对应船舶类别信息。
[0003]图像目标检测算法主要分为两阶段算法和单阶段算法,其中二阶段算法大部分采用先筛选区域再进行检测回归的方式,达到较高检测精度的同时却因为需要二次回归导致速度较慢,并不利于实时目标检测任务。而单阶段算法省去了区域回归这一步骤,因此大幅度提升了检测速度,并且单阶段检测算法的精度也在不断提升,这些有利因素使得目前单阶段算法是实时应用任务的首选。YOLOv4作为单阶段检测算法的佼佼者,在检测速度以及检测精度上都有着显著优势。但是,在将YOLOv4利用在船舶数据集上时,会出现小目标漏检、误检等现象,分析原因得出,YOLOv4的特征层融合时采用的是线性相加,导致不同层的特征图之间的有效信息并未充分得到利用,因此导致了YOLOv4检测模型的精度不高。

技术实现思路

[0004]针对上述现有技术,本专利技术要解决的技术问题是提供一种基于自适应特征层融合的船舶目标检测方法,提升不同特征图之间有效信息的充分利用,增强算法模型对于有效特征的提取能力,进而提升检测模型的检测精度。
[0005]为解决上述技术问题,本专利技术的一种基于自适应特征层融合的船舶目标检测方法,包括:采用YOLOv4检测模型进行目标检测,所述模型包括特征提取主干网络、特征融合增强网络以及输出检测网络;所述特征融合增强网络采用ASFF网络结构进行不同尺寸的特征图的融合;检测方法包括:
[0006]步骤一、将待检测图像输入YOLOv4检测模型,并通过特征提取主干网络进行特征提取,得到三个不同尺度的特征;
[0007]步骤二、将三个不同尺度的特征图输入特征融合网络的ASFF网络结构进行自适应融合,所述ASFF网络结构自适应调整各尺度特征在融合时的空间权重;
[0008]步骤三、将三个不同尺度的经过融合后的特征图分别送入对应的输出检测网络。
[0009]进一步的,所述特征提取主干网络采用CSPDarknet53结构。
[0010]进一步的,步骤二中所述自适应融合的公式为:
[0011][0012]其中,l=1,2,3,X1、X2和X3分别为来自三个不同尺度的特征,α
l
、β
l
和γ
l
分别为第l尺度特征与不同尺度特征对应的权重参数,且在训练过程中会动态地调节数值,α
l
、β
l
和γ
l
之和为1。
[0013]进一步的,权重参数具体为:
[0014][0015]其中,A=α,β,γ,和是和分别经过ASFF网络的1x1卷积对应得到的结果,表示特征图像中第i行和第j列的权重,则A
l
就是由图像中所有的像素点对应的概率值构成的权重矩阵。
[0016]本专利技术的有益效果:
[0017]针对现有的YOLOv4检测模型,本专利技术主要针对YOLOv4用于船舶目标检测任务时出现的小目标漏检以及误检问题。为此本专利技术提出一种不同特征图之间自适应融合的方法,可以有效提升不同特征图之间有效信息的充分利用,增强算法模型对于有效特征的提取能力,进而提升检测模型的检测精度。
[0018]与现有技术相比,本专利技术的改进效果表现为:
[0019]1.本专利技术通过添加自适应加权参数动态融合不同尺度的特征图解决了YOLOv4算法对于船舶目标检测出现的小目标漏检或者误检问题。
[0020]2.不同尺度特征图之间包含的有效信息可以得到更充分、合理的融合,使得每个特征图都含有更多的有效信息。
附图说明
[0021]图1是本专利技术中未改进的原版本的YOLOv4网络框架;
[0022]图2是本专利技术一种由CSPDarknet53构成的特征提取网络;
[0023]图3是本专利技术一种PANet网络结构;
[0024]图4是本专利技术一种基于自适应特征融合的特征金字塔网络;
[0025]图5是本专利技术一种基于自适应特征融合的改进YOLOv4网络结构。
具体实施方式
[0026]下面结合说明书附图和实施例对本专利技术做进一步说明。
[0027]目标检测需要对图像中待检测而所有目标进行分类表明目标所属类别并且用矩形框紧密包围住被检测到的目标。作为一阶段目标检测算法代表的YOLOv4模型主要分为三个组成部分:特征提取主干网络、特征融合增强网络以及输出检测网络。一张任意大小的图像首先输入到由CSPDarknet53构成的特征提取主干网络,分别得到输入图像尺寸的1/8、1/16以及1/32的三个尺度不同的特征图。然后将得到的三个不同尺度的特征图通过特征融合网络进行特征融合,最后将三个不同尺度的经过融合后的特征图分别送入对应的检测网络,进行预测输出。YOLOv4的三个组成部分各自保持独立且互不影响,其中在特征融合网络的设计上采用的是简单直接的元素相加的方式,经实验分析证明这种特征图融合方式并没有充分地考虑到不同尺度的特征图含有的不同有效信息,导致融合后的特征图非但没有获得额外的有效信息还引入不必要的噪声干扰。本专利技术针对这一问题提出使用自适应融合网
络进行特征图之间的融合,即通过引入动态系数,自动调整每个特征图相加时的权重系数。通过引入动态系数使得每次特征融合时都会根据之前的反馈结果自动调节数值大小,使得每次的相加结果不断趋近于最理想的状态,不同特征图在保留自身有效信息的同时引入了来自其他特征图的有效信息,因此经过改进特征融合网络输出的特征图的有效特征更明显,利于后续预测网络的判断,进而提升检测模型的整体检测精度。
[0028]本专利技术是按照以下流程实现的:
[0029]步骤一、输入图像的特征提取过程,具体为:
[0030]首先将任意大小的二维图像输入到YOLOv4的特征提取模块中并得到三个不同尺度的特征。YOLOv4使用CSPDarknet53作为特征提取网络,通过残差网络的堆叠增强了对于输入图像的特征提取能力,最后输出了三个具有不同尺度的特征图,用于后续特征图之间的融合。
[0031]步骤二、不同尺度特征图之间的融合,具体为:
[0032]经过步骤一得到的三个具有不同尺度的特征图,其中我们将经过较少层特征提取模块得到的特征图称之为浅层特征图,而经过较多层特征提取模块的特征图称为深层特征图。经研究,浅层特征图含有更丰富的细节信息,深层特征图则有着更丰富的语义信息。特征融合网络的目的是使得不同特征图之间充分利用对应有效信息,使得每个特征图都包含一定的细节信息以及语义信息。改进后的特征融合网络采本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自适应特征层融合的船舶目标检测方法,其特征在于,包括:采用YOLOv4检测模型进行目标检测,所述模型包括特征提取主干网络、特征融合增强网络以及输出检测网络;所述特征融合增强网络采用ASFF网络结构进行不同尺寸的特征图的融合;检测方法包括:步骤一、将待检测图像输入YOLOv4检测模型,并通过特征提取主干网络进行特征提取,得到三个不同尺度的特征;步骤二、将三个不同尺度的特征图输入特征融合网络的ASFF网络结构进行自适应融合,所述ASFF网络结构自适应调整各尺度特征在融合时的空间权重;步骤三、将三个不同尺度的经过融合后的特征图分别送入对应的输出检测网络。2.根据权利要求1所述的一种基于自适应特征层融合的船舶目标检测方法,其特征在于:所述特征提取主干网络采用CSPDarknet53结构。3.根据权利要求1所述的一种基于自适应...

【专利技术属性】
技术研发人员:苏丽尹航
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1