基于制造技术

技术编号:39773336 阅读:24 留言:0更新日期:2023-12-22 02:22
本发明专利技术公开了基于

【技术实现步骤摘要】
基于ODC

YOLO网络的遥感图像目标检测方法及系统


[0001]本专利技术属于计算机视觉
,涉及目标检测

遥感与航空影像分析和图像分类等技术,具体涉及一种基于
ODC

YOLO
网络的遥感图像目标检测方法及系统


技术介绍

[0002]随着航空航天遥感技术的蓬勃发展,遥感图像的分辨率可以达到分米级

厘米级

在早期的低分辨率图像上往往只能分类出粗糙的地物类别,而如今在高分辨率的遥感图像上可以利用图像处理

深度学习等方法自动识别出精细的地物目标

遥感图像的信息特征可以分为低层特征

中层特征和高层特征

低层特征包括图像的光谱

纹理和结构等信息;中层特征是对低层特征的编码;高层特征是抽象的语义信息

遥感图像目标检测是一种利用遥感数据进行自动化目标检测技术,其在智能监控等领域都有着广阔的应用前景
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于
ODC

YOLO
网络的遥感图像目标检测方法,其特征在于,具体步骤如下:
S1、
获取遥感数据集;
S2、
对数据集中的图像进行切割处理,将图像划分为训练集

验证集和测试集;
S3、
设置输入图像的尺寸

训练次数和检测对象的类别参数;
S4
具体如下:
S4.1、
在动态卷积中融入了三个维度的注意机制,包括卷积的尺寸

卷积的输入通道数和输出通道数,构成一个多维度的动态卷积,同时利用残差网络
Res2Net

C3
模块融合构成新的
C3

Res2Net
模块,将该模块与多维动态卷积网络结合,得到
OD

Res2Net
主干网络;
S4.2、
构建一个具有多尺度的感受野增强模块,在不同大小的卷积层中,分别使用三种尺度的空洞卷积层分支,通过普通卷积与空洞卷积的结合,每个分支的感受野都得到了的提升,再将各个分支叠加在一起,以表达多尺度的感受野融合效果;
S4.3、
设计一个轻量级的上采样算子进行采样操作,主要分为上采样预测模块和特征重组模块;给定一个输入特征图,首先利用上采样预测模块预测上采样核,后利用特征重组模块完成上采样;
S5、
将步骤
S2
所得图像添加至步骤
S4
所得的
ODC

YOLO
网络模型中,运用训练集和验证集标记好的图片进行训练,训练过程中,将测试集内划分好的图片进行测试,获得每一个阶段训练的效果
。2.
如权利要求1所述基于
ODC

YOLO
网络的遥感图像目标检测方法,其特征在于,步骤
S1
中,采用
DOTA
数据集,图像来源于不同地区

不同时相阶段
。3.
如权利要求1所述基于
ODC

YOLO
网络的遥感图像目标检测方法,其特征在于,步骤
S2
中,切割通过滑动窗口实现,将每个图像中小影像的大小设置固定像素大小,切割从图像左上角开始;将切割后的数据集和对应的标签按照8:1:1分为训练集

验证集和测试集
。4.
如权利要求1所述基于
ODC

YOLO
网络的遥感图像目标检测方法,其特征在于,步骤
S4.1
中,将多维动态卷积引入主干网络,多维动态卷积根据注意力机制动态聚合多个并行卷积核,这些卷积核对每个单独输入数据
x
通过输入相同注意力来聚合偏差;多维动态卷积的公式如下所示:
y

(
α
w1

α
f1

α
c1

α
s1

W1+...+
α
wn

α
fn

α
cn

α
sn

W
n
)*xx
表示输入,
y
则是输出;
α
wi
∈R
为卷积维度
W
i
的注意力系数矩阵,
α
si
∈R
k*k


α
fi
∈R
out
分别表示沿着卷积核
W
i
中的空间维度

输入通道维度

输出通道维度上的动态卷积注意力系数矩阵,

表示沿着核空间的不同维度的乘法运算,
i
的取值范围在1‑
n
;注意力乘以卷积核
W
i
的过程具体如下:先通过全局平均池化
GAP
将输入
x
压缩为长度为
C
in
的特征向量;后通过一个全连接层
FC
和四个分支,全连接层之后经过
ReLU
激活函数修正线性单元;全连接层
FC
将压缩后的特征向量映射到低维空间,对于四个分支,都有输出尺寸为
k*k、C
in
*1、C
out
*1

n*1
的全连接层
FC
,并使用
Sigmoid

SoftMax
函数来生成归一化的注意力
a
si
、a
ci
、a
fi
、a
wi
;其中,
C
in
表示输入通道数,
C
out
表示输出通道数;在多维动态卷积中,对于卷积核
W
i

(1)a
si
将不同的注意力标量分配给
k*k
空间位置处的卷积参数;
(2)a
ci
为每个卷积滤波器
W
im

C
in
通道分配不同的注意力标量;
(3)a
fi

C
out
卷积滤波器分配不同的注意力标量;
(4)a
wi
为整个卷积分配注意力标量;
在多维动态卷积的基础上,将
Res2Net
网络与
C3
模块融合构成新的
C3

Res2Net
模块,
Res2Net<...

【专利技术属性】
技术研发人员:刘晴汪旭升吴伟姚英彪
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1