一种基于深度学习与支持向量机融合的图像分类方法技术

技术编号：34527404 阅读：17 留言：0更新日期：2022-08-13 21:18

本发明专利技术提供一种基于深度学习与支持向量机融合的图像分类方法，包括在深度学习卷积神经网络中嵌入坐标注意力模块作为特征提取网络，卷积神经网络通过对图像进行卷积以及下采样，提取具有代表性的图像特征，坐标注意力模块通过在两个空间方向聚合特征，以极低的计算开销来捕获位置信息和通道关系，实现增强网络的图像特征表示；将特征提取网络输出的增强图像特征经过全连接层进入支持向量机对提取的图像特征进行图像分类，卷积神经网络利用支持向量机的合页损失函数反向传播训练网络模型，使得卷积神经网络中的梯度可以反向传播，进而学习较低级别的特征。本方法将嵌入坐标注意力机制的卷积神经网络与SVM相融合实现图像分类，提高了图像分类精度。提高了图像分类精度。提高了图像分类精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习与支持向量机融合的图像分类方法

[0001]本专利技术涉及图像分类
，具体涉及一种基于深度学习与支持向量机融合的图像分类方法。

技术介绍

[0002]图像分类任务是计算机视觉的关键任务之一，也是热门研究方向之一，其目标是根据图像中所反映的不同特征信息划分到不同的特征类别。如何对图像进行准确的分类，实现最小的分类误差，成为了图像分类研究的关键问题。提高图像分类精度能够促进图像分类技术的发展，基于统计学习理论的支持向量机(Support Vector Machine，SVM)是一种基于核的机器学习模型，该模型在模式识别、模式分类、计算机视觉等各个领域的分类效果可观。但是传统的SVM难以处理数量庞大的图像数据，并且难以满足实际的分类精度需求，因此传统SVM不适合庞大复杂的图像分类，而深度学习(Deep Learning，DL)相较于SVM在图像特征学习与分类中有着显著优势。深度学习通过神经网络从图像中自主学习特征，提取出抽象高维的特征，并能紧密连接特征与分类器的关系，突破了SVM在此方面难以解决的问题。
[0003]卷积神经网络(Convolutional Neural Network，CNN)是深度学习模型中经典而广泛使用的结构。在上世纪90年代，CNN在手写数字为代表的图像分类与识别取得了良好的效果，达到了人眼识别的精度。在2012年，Krizhevsky等人训练的深度CNN在ImageNet大规模视觉识别挑战赛中获得了最佳图像分类效果，证明了CNN在图像分类中的有效性。
[000...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习与支持向量机融合的图像分类方法，其特征在于，包括以下步骤：S1、在深度学习卷积神经网络中嵌入坐标注意力模块，将嵌入有坐标注意力模块的卷积神经网络作为特征提取网络，所述卷积神经网络通过对图像进行卷积以及下采样，提取具有代表性的图像特征，所述坐标注意力模块通过在两个空间方向聚合特征，以极低的计算开销来捕获位置信息和通道关系，实现增强网络的图像特征表示；S2、将特征提取网络输出的增强图像特征经过全连接层进入支持向量机，通过支持向量机对提取的图像特征进行图像分类，提高对图像分类的泛化能力，所述卷积神经网络利用支持向量机的合页损失函数反向传播训练网络模型，使得卷积神经网络中的梯度可以反向传播，进而学习较低级别的特征。2.根据权利要求1所述的基于深度学习与支持向量机融合的图像分类方法，其特征在于，所述步骤S1中的坐标注意力模块包括坐标信息嵌入步骤和坐标注意力生成步骤，所述坐标信息嵌入步骤先将给定的X使用尺寸(H,1)和(1,W)的池化核沿着水平坐标方向和竖直坐标方向对每个通道输入特征图进行编码，之后通过两种变换沿着两个空间方向聚合特征，生成一对方向感知注意力特征图，一个方向感知注意力特征图沿着一个空间方向捕捉长期依赖关系，另一个方向感知注意力特征图保留精确的位置信息；所述坐标注意力生成步骤先是级联坐标信息嵌入步骤产生的两个特征图，然后使用1
×
1的共享卷积进行变换，生成空间信息在水平与垂直方向的中间特征图，接着将该中间特征图切分为两个单独的张量，最后使用两个1
×
1的卷积分别将两个单独的张量变换为与输入X相同的通道数，使用Sigmoid作为坐标注意力模块的激活函数。3.根据权利要求1所述的基于深度学习与支持向量机融合的图像分类方法，其特征在于，所述步骤S1中嵌入的坐标注意力模块位于卷积神经网络的中间层或顶层。4.根据权利要求1所述的基于深度学习与支持向量机融合的图像分类方法，其特征在于，所述步骤S1中嵌入有坐标注意力模块的卷积神经网络适用于ResNet18、AlexNet、LeNet、MobileNet或VGG网络模型。5.根据权利要求1所述的基于深度学习与支持向量机融合的图像分类方法，其特征在于，所述步骤S1中嵌入有坐标注意力模块的卷积神经网络适用于ResNet18网络模型，所述坐标注意力...

【专利技术属性】
技术研发人员：谭暑秋，潘嘉豪，
申请(专利权)人：重庆理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人