【技术实现步骤摘要】
一种轻量化的目标检测与基于语义分割的自动跟踪方法
[0001]本专利技术涉及目标检测和目标跟踪等计算机视觉
,尤其涉及一种轻量化的目标检测与基于语义分割的自动跟踪方法。
技术介绍
[0002]随着AI智能的发展,无人机因其具备轻捷灵敏、自主智能、范围覆盖广、环境依赖低等特点,常被选作空中观测搭载平台,以协助在不同场景需求、不同作业环境下,高质高效、省时省力地完成目标任务。“无人机+”也常结合目标检测和目标跟踪等计算机视觉技术,向公共安全、边防巡检、农业植保、救灾救火等垂直应用领域发展。因此无人机与计算机视觉技术的结合,具有深远而重大地社会意义、经济效益与应用价值。
[0003]目标检测与目标跟踪作为计算机视觉的两大基础研究任务。其中,目标检测旨在利用算法来提取目标的表观特征和轮廓区域等信息,以从视频或图像序列中辨别出感兴趣目标和非感兴趣背景,是将目标定位与目标分类两个子任务二合一的技术。而目标跟踪则是通过对摄像头捕获的图像序列分析,计算并找到下一帧图像中目标的确切位置,进而为跟踪平台随动控制、视频序列分析和理解提供轨迹等信息。相较于目标检测关注目标的类别和位置,目标跟踪则更聚焦于目标的运动轨迹。但目标检测与跟踪两者技术并非分割且独立的。目标跟踪根据是否结合使用目标检测算法,划分为Detection
‑
Free Tracking和Detection
‑
Based Tracking两类:前者根据第一帧图像中给出的初始框作为目标假设展开后续跟踪;后者依赖于目标检测模型得到的 ...
【技术保护点】
【技术特征摘要】
1.一种轻量化的目标检测与基于语义分割的自动跟踪方法,其特征在于,包括下列步骤:步骤1:构建并训练轻量化的目标检测网络:步骤1.1:以416
×
416
×
3的图像作为目标检测网络的输入,输入图像首先经过一次卷积核为3
×
3的普通卷积操作,得到208
×
208
×
32的特征层;其中,完成一次普通卷积操作依次包括卷积运算,批归一化和ReLu函数激活;步骤1.2:对步骤1.1获得的208
×
208
×
32的特征层进行多次深度可分离卷积操作,并将最后三次的深度可分离卷积操作输出的特征层经让通道数扩增的下采样操作后,输出尺度分别为52
×
52
×
256、26
×
26
×
512、13
×
13
×
1024的三个特征层分别标记为P3、P4、P5;其中,完成一次深度可分离卷积操作包括:首先经过3
×
3的深度卷积,然后进行批归一化和ReLU函数激活,接着采用1
×
1的卷积核实现逐点卷积,再进行批归一化和ReLU函数激活操作,得到一次深度可分离卷积操作输出的特征层;其中,深度卷积的步长设置为1;步骤1.3:将特征层P3、P4、P5输入至特征增强模块进行增强处理,具体如下:步骤1.3
‑
1:将特征层P5依次利用四个不同尺度的池化核执行最大池化处理,其中四个池化核大小分别为13
×
13、9
×
9、5
×
5、1
×
1,并将最大池化后得到的4个特征层拼接堆叠,再通过卷积核为1
×
1的普通卷积,调整为13
×
13
×
512的特征层,并记为特征层P6;步骤1.3
‑
2:将特征层P3、P4、P5和P6依次执行卷积核为3
×
3的普通卷积,使得4个特征层的通道数保持一致,继而以“P6
‑
P5
‑
P4
‑
P3”的方向完成多次上采样操作和与相邻层特征层逐点信息相加的操作,接着再以“P3
‑
P4
‑
【专利技术属性】
技术研发人员:邓建华,秦琪怡,杨杰,李龙,何佳霓,代铮,赵建恒,陶泊昊,郑凯文,苟晓攀,陈昱辰,魏卓,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。