【技术实现步骤摘要】
一种应用于航拍视频中的地面目标跟踪方法
[0001]本专利技术涉及人工智能技术驱动的计算机视觉
,尤其涉及一种应用于航拍视频中的地面目标跟踪方法。
技术介绍
[0002]视觉目标跟踪是计算机视觉领域的基本任务之一,根据需要跟踪目标数量的不同,通常被分为多目标跟踪和单目标跟踪。多目标跟踪通常只针对特定的若干类物体,如车辆、行人等,即待跟踪的目标类别是固定的;而在通用单目标跟踪任务中,待跟踪的目标类别可以是任意的。
[0003]通用单目标跟踪任务的输入是持续性在线实时输入的帧序列或者一段离线缓存的视频。只需要在配备摄像头的端设备启动时或者离线视频的第一帧选定待跟踪的目标(常用的表示形式是矩形边界框),通用单目标跟踪算法将以边界框的形式,持续稳定高效地给出后续帧中待跟踪目标的精确位置。
[0004]tracking
‑
by
‑
detection机制使用目标检测的机制实施目标跟踪任务,通常被用于多目标跟踪领域。具体来说,首先使用一个目标检测方法检测出当前帧中所有目标,然后使用 ...
【技术保护点】
【技术特征摘要】
1.一种应用于航拍视频中的地面目标跟踪方法,其特征在于,包括如下步骤:S1:将SiamFC++的特征空间嵌入网络由GoogLeNet更改为ResNet;S2:将搜索区域图像x输入特征空间嵌入网络ResNet,将ResNet的第2个block输出的深度特征输入到第一特征金字塔网络的最低层,将ResNet的第3个block输出的深度特征输入到第一特征金字塔网络的中层,将ResNet的第4个block输出的深度特征输入到第一特征金字塔网络的最高层;第一特征金字塔网络对输入到各层的深度特征进行处理后,在第一特征金字塔网络的最低层输出搜索区域图像x的深度特征在第一特征金字塔网络的中层输出搜索区域图像x的深度特征在第一特征金字塔网络的最高层输出搜索区域图像x的深度特征S3:将模板图像z输入和步骤S2中结构相同且参数共享的特征空间嵌入网络ResNet,将ResNet的第2个block输出的深度特征输入到和步骤S2中结构相同但参数不共享的第二特征金字塔网络的最低层,将ResNet的第3个block输出的深度特征输入到第二特征金字塔网络的中层,将ResNet的block4输出的深度特征输入到第二特征金字塔网络的最高层;第二特征金字塔网络对输入到各层的深度特征进行处理后,在第二特征金字塔网络的最低层输出模板图像z的深度特征在第二特征金字塔网络的中层输出模板图像z的深度特征在第二特征金字塔网络的最高层输出模板图像z的深度特征S4:将深度特征与组合后输入到第一跟踪头部网络中,将深度特征与组合后输入到第二跟踪头部网络中,将深度特征与组合后输入到第三跟踪头部网络中;其中,所述第一跟踪头部网络、所述第二跟踪头部网络和所述第三跟踪头部网络结构相同但参数不共享,三个跟踪头部网络均与SiamFC++的跟踪头部网络的结构相同;S5:每个跟踪头部网络接收对应的深度特征和作为输入,输出第一分类置信分数图和目标边界框回归响应图;其中,k∈{2,3,4};S6:选择三个跟踪头部网络输出的第一分类置信分数图中分类置信分数最大值所在位置,目标边界框回归响应图在该位置的向量为待跟踪目标的边界框预测结果。2.如权利要求1所述的应用于航拍视频中的地面目标跟踪方法,其特征在于,步骤S5,每个跟踪头部网络接收对应的深度特征和作为输入,输出第一分类置信分数图和目标边界框回归响应图,具体包括:每个跟踪头部网络包括用于空间位置分类的分类分支和用于目标边界框回归的回归分支,将组合后的深度特征和分别输入对应的跟踪头部网络的分类分支和回
归分支;对于分类分支,使用一个结构相同但参数不共享的多层卷积层分别处理深度特征和后做互相关操作,将互相关操作的结果分别输送到分类分支的分类子分支和...
【专利技术属性】
技术研发人员:刘庆杰,扶智宏,温奇,王兵,王薇,李苓苓,董喆,罗伟儿,
申请(专利权)人:应急管理部国家减灾中心北京空间机电研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。