基于CNN与Transformer的低分辨率图像分类方法及系统技术方案

技术编号：36089678 阅读：18 留言：0更新日期：2022-12-24 11:06

本发明专利技术涉及一种基于CNN与Transformer的低分辨率图像分类方法，包括以下步骤：步骤S1:构建图像数据集并对其中图像进行类别标注，划分为训练集和验证集；步骤S2:对训练集和验证集图像进行预处理；步骤S3:基于CNN和transformer，构建双分支并行网络，通过CNN网络分支和transformer网络分支来对低分辨率图像进行特征提取，通过注意力特征融合网络将两个分支每一层的特征进行有效融合，并采用多通道注意力网络对融合后的特征进行语义信息挖掘；步骤S4：根据训练集和验证集对双分支并行网络进行训练，并利用交叉熵损失对其进行约束，得到图像分类网络；步骤S5:将预处理后的待测图像输入图像分类网络，得到分类结果。本发明专利技术能有效提高对低分辨图像的分类性能。明能有效提高对低分辨图像的分类性能。明能有效提高对低分辨图像的分类性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于CNN与Transformer的低分辨率图像分类方法及系统

[0001]本专利技术涉及计算机视觉中的图像分类领域，具体涉及一种基于CNN与Transformer的低分辨率图像分类方法及系统。

技术介绍

[0002]图像分类的任务是学习和判断图像中是否包含某种特定的目标内容，并依据其内容信息进行分类的过程。图像分类是最基础的计算机视觉任务,其已经在人机交互、生物医学、航空航天和公安司法等领域取得了广泛应用。虽然图像分类研究取得的很大的进步，然而这些研究大部分是在高分辨率的图像中进行研究的。但在真实场景中，大部分情况下只能获得低分辨率的图像，因此，对低分辨率图像分类的研究至关重要。

技术实现思路

[0003]有鉴于此，本专利技术的目的在于提供一种基于CNN与Transformer的低分辨率图像分类方法，能有效提高对低分辨图像的分类性能。
[0004]为实现上述目的，本专利技术采用如下技术方案：
[0005]一种基于CNN与Transformer的低分辨率图像分类方法，包括以下步骤：
[0006]步骤S1:构建图像数据集并对其中图像进行类别标注，同时将图像数据集按照一定比例划分为训练集和验证集；
[0007]步骤S2:对训练集和验证集图像进行预处理；
[0008]步骤S3:基于CNN和transformer，构建双分支并行网络，通过CNN网络分支和transformer网络分支来对低分辨率图像进行特征提取，通过注意力特征融合网络将两个分支每一层的特征进行有效融合，...

【技术保护点】

【技术特征摘要】
1.一种基于CNN与Transformer的低分辨率图像分类方法，其特征在于，包括以下步骤：步骤S1:构建图像数据集并对其中图像进行类别标注，同时将图像数据集按照一定比例划分为训练集和验证集；步骤S2:对训练集和验证集图像进行预处理；步骤S3:基于CNN和transformer，构建双分支并行网络，通过CNN网络分支和transformer网络分支来对低分辨率图像进行特征提取，通过注意力特征融合网络将两个分支每一层的特征进行有效融合，并采用多通道注意力网络对融合后的特征进行语义信息挖掘；步骤S4：根据训练集和验证集对双分支并行网络进行训练，并利用交叉熵损失对其进行约束，得到图像分类网络；步骤S5:将预处理后的待测图像输入图像分类网络，得到分类结果。2.根据权利要求1所述的基于CNN与Transformer的低分辨率图像分类方法，其特征在于，所述预处理包括尺寸调整和数据增强，所述尺寸调整是将输入的图像样本转化为预设大小，所述数据增强方式采用随机水平翻转、随机垂直翻转以及随机旋转。3.根据权利要求1所述的基于CNN与Transformer的低分辨率图像分类方法，其特征在于，所述transformer网络分支由四个阶段组成，每个阶段由两个transformer编码器堆叠而成，transformer网络分支会输出四种不同尺寸的一维特征图。4.根据权利要求3所述的基于CNN与Transformer的低分辨率图像分类方法，其特征在于，所述transformer网络分支产生的一维特征输入到转换网络中进行转换，使其与CNN网络分支产生的特征尺寸相同，转换网络中的转换公式如下：X
i
＝1
×
1Conv(Reshape(x
i
))i∈(1，2，3，4)其中x为transformer网络分支四个阶段输出的一维特征，X为一维特征经过转换网络后产生的四个不同尺度的二维特征。5.根据权利要求1所述的基于CNN与Transformer的低分辨率图像分类方法，其特征在于，所述CNN网络分支由5层组成，每一层均产生不同尺寸的二维特征，将第一次层网络提取的特征输入到transformer分支中进行提取。6.根据权利要求1所述的基于CNN与Transformer的低分辨率图像分类方法，其特征在于，所述注意力特征融合网络将CNN分支和transformer分支所提取的两种不同语义信息的特征进行融合，具体如下：将CNN网络分支和transformer网络分支产生的特征进行相加得到一个融合特征；将融合...

【专利技术属性】
技术研发人员：罗鸣，胡义，童同，谢军伟，杨宗晓，
申请(专利权)人：福建帝视信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人