一种基于注意力机制的场景分类方法及装置制造方法及图纸

技术编号:31378251 阅读:27 留言:0更新日期:2021-12-15 11:19
本发明专利技术公开了一种基于通道和空间注意机制的场景分类方法及装置,属于遥感信息提取领域。本发明专利技术主要包括以下步骤:1.数据预处理。将公开的数据集进行数据增强和数据归一化等预处理,增强网络的泛化性能;2.建立基于注意机制的神经网络,该网络包括两部分:通道注意机制和密集连接网络;3.训练后进行精度评价。将预处理后的数据输入搭建的模型中进行训练,然后利用训练完成的网络进行数据分类。后利用训练完成的网络进行数据分类。后利用训练完成的网络进行数据分类。

【技术实现步骤摘要】
一种基于注意力机制的场景分类方法及装置


[0001]本专利技术属于遥感信息提取领域,更具体地,一种基于注意力机制的遥感场景分类方法

技术介绍

[0002]随着多媒体技术和网络技术的普及和成长,人们日常所能接触到的数字图像数量与日俱增,在数字图像领域同样也存在巨量的数字图像,然而完全依靠手工对这些数字图像进行标注和管理的传统方法变得越来越不可行,在这种情况下场景分类方法被提出;早期,场景分类依靠人工设计特征,这些人工设计特征主要分为3类:光谱特征、纹理特征和结构特征;2006年SLazebnik等人利用SIFT提取图像结构特征作为分类依据;2014年Cheriyadat将纹理特征作为分类依据。
[0003]在2012年Alex在ILSVRC(Large Scale Visual Recognition Challenge)比赛中提出AlexNet后,各种经典深度神经网络被提出,例如CaffeNet、VGGNet、GoogleNet和ResNet等;这些网络都具有很强的特征提取能力,相比传统的特征提取方法表现优异;2016年Othman.E本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的场景分类方法,包括以下步骤:S1、数据集预处理:将公开数据集进行数据增强和归一化处理,提高训练的鲁棒性以及模型的准确率;S2、建立基于注意力机制的神经网络,包括密集连接网络和注意力机制,利用密集连接网络提取图像特征,通过密集连接使得图像特征得到重复利用,并且确保了网络各层之间的最大信息流,通过密集连接网络与注意机制的结合进一步提高模型的提取特征能力,通过两种注意机制在两个不同的方面提高模型的性能。S3、将预处理的数据集输入已搭建的神经网络模型中进行训练,完成网络模型的训练,将模型训练完成后,将测试集数据做同样的预处理,再输入到模型中测试,完成对模型的测试。2.根据权力要求1所述的基于注意力机制的场景分类方法,数据预处理的步骤S1具体包括:S11、对数据集进行数据增强,数据增强包括对图片的亮度调整,对比度调整,颜色调整,水平翻转,左右翻转,旋转;S12、将经过数据增强后的图像进行归一化处理,以便后续模型训练,提高模型的训练准确率和训练速度。3.根据权利要求2所述的基于注意力机制的场景分类方法,其中数据预处理S11的具体方法是:将亮度调整,对比度调整,颜色调整,水平翻转,左右翻转,旋转组合到一起,其中亮度调整,对比度调整和颜色调整所需的参数都在一定范围内随机生成,而旋转的角度则在90
°
、180
°
和270
°
三个中随机选择一个,因此,生成的图像会有很好的随机性。4.根据权力要求1所述的基于注意力机制的场景分类方法,搭建注意机制的步骤S2具体包括:S21、密集连接网络通过密集连接层提取深度特征,通过前跳连接加强层与层之间的信息流传递,通过重复利用特征,在提高模型性能的同时减少模型参数。通过瓶颈结构简化模型,减少参数并且减少计算量,并且通过池化操作来减少特征图的大小,进一步减少计算量,密集连接层的运算公式如下:x
l
=H
l
([x0,x1,x2,

,x
l
])其中,x0,...

【专利技术属性】
技术研发人员:姜艳姝孙炳靖
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1