【技术实现步骤摘要】
一种基于改进Transformer的小目标检测方法
[0001]本专利技术涉及计算机视觉算法领域,尤其是一种基于Transformer的小目标检测性能优化方法。
技术介绍
[0002]近年来,随着计算机视觉相关技术的迅猛发展与各种硬件设备性能的大提高,目标检测技术现已广泛应用在生产生活中,尤其是用于道路上行人和车辆检测、监控。然而,目前目标检测技术主要应用于尺寸较大的目标,一方面是由于大目标尺寸大,包含的信息较多,因此在经过卷积神经网络可以提取到更多有价值的信息,另一方面是大目标的数据集较为常见,检测也更加便利。因此在复杂场景下,目标检测技术更容易检测到大目标物体,对于小目标物体会经常漏检或者误检,这主要是由于虽然日常生活中小目标物体很常见,但是由于小目标物体图像包含的信息较小,卷积神经网络提取信息有限;同时,开源的小目标数据集较少,相比于大目标,针对小目标检测的技术也很难突破。如附图3所示,行车道上车辆众多,但是不乏有横穿马路的行人,而且还存在整个场景环境复杂,行人和车辆呈现出目标尺寸小的特点,单纯依靠人力对监控视频进行辨 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进Transformer的小目标检测方法,其特征在于,包括以下步骤:步骤1:准备预训练图像数据集;数据集可采用开源数据集或者特殊场合下制作的特定数据集;步骤2:构建SR
‑
DETR目标检测网络模型;SR
‑
DETR模型的总体架构和原理如附图2所示,该模型主要包含特征提取模块,Transformer模型,分类预测模块,超分辨率模块以及图像融合模块;步骤3:开始训练,初始化权值矩阵;使用正态分布初始化权值矩阵,采用从方差为0 .01的截断正态分布中采样,得到权重初始化值;步骤4:前向传播;输入信号在权重矩阵的帮助下,得到每一层的输出,最终到达输出层的预测值;步骤5:计算损失函数;步骤6:反向传播;利用损失函数相对于每个参数的梯度对参数进行修正更新;步骤7:更新权重矩阵;根据反向传播得到的参数的梯度来对权重矩阵进行更新,达到减小损失函数的效果;步骤8:如果没有到达最大训练次数,则返回步骤4,继续前向传播,否则就保存最后一次训练的模型;步骤9:目标检测及结果输出;将待目标检测的图像载入已经训练好的模型中,得到最终的目标检测结果图像,后续可根据该结果做出其余操作。2.根据权利要求1所述的SR
‑
DETR模型,其特征在于,SR
‑
D...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。