当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于改进CenterNet的图像小目标检测方法技术

技术编号:33470406 阅读:35 留言:0更新日期:2022-05-19 00:48
本发明专利技术公开了一种基于改进CenterNet的图像小目标检测方法,包括获取原始图像,对原始图像进行mosaic数据增强,增加原始图像中小目标的样本量;使用注意力机制增强后的骨干网络提取图像的特征;对骨干网络提取的图像的特征进行多感受野融合,使用可变形卷积上采样;对进行多感受野融合,使用可变形卷积上采样处理后的特征图进行预测,得到热力图,目标的宽、高和中心点坐标;从热力图提取出检测框,得到检测结果。本发明专利技术通过对训练数据的增强,增加小目标的样本量;通道注意力增强和空间注意力增强能够有效地区分小目标和背景信息;以及多重感受野融合和高分辨率特征图的结合,能够有效提升小目标检测精度。提升小目标检测精度。提升小目标检测精度。

【技术实现步骤摘要】
一种基于改进CenterNet的图像小目标检测方法


[0001]本专利技术属于图像处理领域,具体涉及一种基于改进CenterNet的图像小目标检测方法。

技术介绍

[0002]目标检测结合了目标定位与目标分类两大任务,被广泛应用于人脸识别,行人检测,自动驾驶,智能监控等计算机领域。近年来基于卷积网络的目标检测算法不断发展,按是否利用锚框产生候选框,分为基于锚框检测算法,如Faster R

CNN、Mask R

CNN等的two stage框架和YOLO、SSD、RetinaNet等的one stage框架;无锚框检测算法,如CornerNet、ExtremeNet、CenterNet、FCOS等。小目标是指图像中尺寸小于32
×
32像素的目标,由于其像素少的特点,主流目标检测算法对小目标的检测效果都比较差。
[0003]基于锚框的算法需要一组非常大的锚框,这是因为检测器被训练用以分类每个锚框是否与真实框尽可能的重叠,所以需要大量的框以确保与大多数的真实框最大程度的重叠.最终只有一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于改进CenterNet的图像小目标检测方法,其特征在于包括如下步骤:S1.获取原始图像,对原始图像进行mosaic数据增强,增加原始图像中小目标的样本量;S2.使用注意力机制增强后的骨干网络提取图像的特征;S3.对骨干网络提取的图像的特征进行多感受野融合,使用可变形卷积上采样;S4.对进行多感受野融合,使用可变形卷积上采样处理后的特征图进行预测,得到热力图,目标的宽、高和中心点坐标;S5.从热力图提取出检测框,得到检测结果。2.根据权利要求1所述的基于改进CenterNet的图像小目标检测方法,其特征在于所述的步骤S1,包括加载数据集,遍历数据集序列,若命中随机数,则进行mosaic扩充,否则直接加载图片和标签信息;从数据集中随机选取3张图像和当前图像增强为新的训练图像,初始化拼接图像的中心点坐标xc和yc,对四张图片进行翻转、缩放或色域变化操作,将四张图片分别填充到拼接图像的四个方向;更新原始图像的标注信息的在拼接图像中的坐标,返回拼接图像,类别信息,标注信息作为训练数据。3.根据权利要求2所述的基于改进CenterNet的图像小目标检测方法,其特征在于所述的步骤S2,包括对原始图像进行卷积得到特征图;将中间特征图依次通过通道和空间两个维度依次推断注意力图,然后将注意力图与输入特征图相乘进行自适应特征优化;通道注意力机制包括利用平均池化和最大池化来聚合特征映射的空间信息,生成被平均池化的特征和被最大池化的特征将被平均池化的特征和被最大池化的特征前向送入一个共享网络,压缩输入特征图的空间维数,逐元素求和合并,产生通道注意力图M
c
∈R
C
×1×1;共享网络包括MLP,MLP包括一个隐藏层;隐藏层的激活大小设置为R
C/r
×1×1,其中,R表示张量空间;C表示图像的通道数;c表示通道的含义;r表示缩减率;通道注意力机制表示为:其中,σ(
·
)表示sigmoid函数,MLP的权重尺寸为W0∈R
C
×1×1和W1∈R
C
×1×1,R表示张量空间;C表示图像的通道数;W0表示隐藏层的权重;W1表示输出层的权重;AvgPool(
·
)表示平均池化,MaxPool(
·
)表示最大池化;首先沿着通道轴进行平均池化操作和最大池化操作,生成两个2D图,两个2D图包括沿着通道被平均池化的特征和沿着通道被最大池化的特征和沿着通道被最大池化的特征R表示张量空间,H表示图像的高,W表示图像的宽,将两个2D图进行拼接,生成高效特征描述符,使用一个卷积层生成一个空间注意力图空间M
s
(F)∈R
H
×
W
;获取2通道的空间注意力图空间M
s
(F):
其中,σ(
·
)表示sigmoid函数;f7×7表示一个卷积核尺寸为7
×
7的卷积操作;AvgPool(
·
)表示平均池化,MaxPool(
·
)表示最大池化;特征图通过四层残差模块下采样,降低分辨率。4.根据权利要求3所述的基于改进CenterNet的图像小目标检测方法,其特征在于所述的步骤S3,包括如下步骤:A1.通过三个核为5
×
5,9
×
9,13
×
13的最大池化,拼接得到新的特征图,在特征图大小不变的情况下,进行多重感受野融合;A2.通过三层可变形卷积对特征图进行上采样,普通卷积包括,以对于每个普通卷积的输出y(p0),p0表示普通卷积采样中心点;都要从x上采样,向四周扩散,(

1,

1)表示x(p0)的左上角,(1,1)表示x(p0)的右下角;x(p0)表示中心点的值;R={(

1,

1),(

1,0),...,(0,1),(1,1)},普通卷积的输出y(p0)如下:其中,p
n
表示对R中所列位置的枚举;...

【专利技术属性】
技术研发人员:杨科华谷依罗嘉明张曼
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1