轻量化Transformer架构遥感目标检测方法技术

技术编号:42670606 阅读:15 留言:0更新日期:2024-09-10 12:24
本发明专利技术公开一种轻量化Transformer架构遥感目标检测方法、存储介质、设备,涉及深度强化学习技术领域,方法包括:以Transformer的目标检测模型DINO为基础,构建遥感目标检测模型;遥感目标检测模型由主干网络、Transformer编码器、Transformer解码器、检测头四个部分组成,采用Resnet50作为遥感目标检测模型的主干网络;将遥感目标检测模型作为深度强化学习的环境、剪枝率作为深度强化学习的动作,构建深度强化学习问题;基于深度强化学习训练智能体,在资源受限与精度优先场景下,搜索遥感目标检测模型各层的剪枝策略;根据遥感目标检测模型神经元的权值判别神经元的重要性,去除重要性低于设定阈值的神经元,得到轻量化模型。本发明专利技术方法的参数量与计算量较小,可以部署于资源受限的边缘设备。

【技术实现步骤摘要】

本专利技术涉及深度强化学习,尤其涉及轻量化transformer架构遥感目标检测方法。


技术介绍

1、目标检测是计算机视觉领域中的一项基础任务,是在图像中检测出感兴趣目标的位置及其类别。遥感图像目标检测是指从遥感图像中检测出感兴趣的目标,已经广泛应用于交通检测、农业环境监测、勘探资源、城市规划、检测海洋非法捕捞等领域。遥感图像空间分辨率不断提升,遥感图像中物体数量、大小、姿态等各不相同,密集或稀疏分布于图像各个区域,使得遥感图像目标检测任务极具挑战性,长期以来都是遥感图像解译的重要研究方向。

2、目前,基于transformer架构的遥感目标检测模型具备长距离依赖的上下文信息建模能力和动态响应特性,特征学习能力更强,能够实现高精度端到端的遥感图像目标检测。然而,基于注意力的交互机制也带来了更高的时间和空间代价,对计算、存储、能耗等资源提出了较高的要求,模型训练与推理通常采用具有较强计算能力的服务器甚至是云计算中心完成。

3、卫星、无人机等边缘侧设备的计算、存储等资源受限,需要降低当前基于深度学习的遥感目标检测模型的参数量、计算量和推本文档来自技高网...

【技术保护点】

1.一种轻量化Transformer架构遥感目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种轻量化Transformer架构遥感目标检测方法,其特征在于,遥感目标检测模型的主干网络的第三、四、五层包括13个Bottleneck层,Transformer编码器包括6个编码器层,Transformer解码器包括6个解码器层;将主干网络的第三、四、五层的13个Bottleneck层作为主干网络的可剪枝层、6个编码器层作为Transformer编码器的可剪枝层、6个解码器层作为Transformer解码器的可剪枝层,构建环境的25个可剪枝层;

3.根...

【技术特征摘要】

1.一种轻量化transformer架构遥感目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种轻量化transformer架构遥感目标检测方法,其特征在于,遥感目标检测模型的主干网络的第三、四、五层包括13个bottleneck层,transformer编码器包括6个编码器层,transformer解码器包括6个解码器层;将主干网络的第三、四、五层的13个bottleneck层作为主干网络的可剪枝层、6个编码器层作为transformer编码器的可剪枝层、6个解码器层作为transformer解码器的可剪枝层,构建环境的25个可剪枝层;

3.根据权利要求2所述的一种轻量化transformer架构遥感目标检测方法,其特征在于,25个可剪枝层的每层的状态信息构成的状态空间表示如下:

4.根据权利要求3所述的一种轻量化transformer架构遥感目标检测方法,其特征在于,资源受限场景要求模型的参数量、计算量在设定阈值之下,精度优先场景要求模型精度在设定阈值以上。

5.根据权利要求4所述...

【专利技术属性】
技术研发人员:刘佳陈都熊奇方仕恒岳银雷
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1