基于四元Sigmoid激活函数的图像分类方法及系统技术方案

技术编号:35827702 阅读:21 留言:0更新日期:2022-12-03 13:55
本发明专利技术涉及一种基于四元Sigmoid激活函数的图像分类方法,属于深度学习技术领域,利用基于四元Sigmoid激活函数的图像分类网络对待分类图像进行图像分类。该图像分类网络包括并联结构层;并联结构层包括:拼接层、四元Sigmoid激活函数支路和卷积支路;其中四元Sigmoid激活函数支路和卷积支路并联;四元Sigmoid激活函数支路利用四元激活函数对四元特征矩阵进行前向传播计算后,再进行卷积操作;卷积支路对四元特征矩阵进行卷积操作;拼接层将两个输出拼接。本发明专利技术利用四元Sigmoid激活函数和与之配合的并联结构,能够遵循四元数运算法则,从而保留了图像数据信息的完整性,提高了图像分类的准确性。提高了图像分类的准确性。提高了图像分类的准确性。

【技术实现步骤摘要】
基于四元Sigmoid激活函数的图像分类方法及系统


[0001]本专利技术涉及深度学习
,特别是涉及一种基于四元Sigmoid激活函数的图像分类方法及系统。

技术介绍

[0002]近年来深度学习以其强大的性能优势在图像处理领域逐渐替代了传统算法成为主流方法。伴随着大量研究人员的大量实验,有研究人员发现实数域的神经网络不能很好的保存高维信息导致出现性能瓶颈。四元数由于其天生具备处理高维信息的能力逐渐被更多研究人员所关注。因此将四元数应用到神经网络,得到四元神经网络是一个很重要的课题。
[0003]四元数的运算法则使四元数不是四个分量的简单组合,而是一个高维信息的整体。其作为一个整体,分量与分量之间相互关联,分量之间的联系里也保存有数据的信息。RGB彩色图像像素点的数据格式与四元数的数据相似,每个像素都是由R、G、B三元色的分量组成。所以出现很多使用四元数来表征像素信息,即使用四元数矩阵来表示彩色图像并进行图像处理。使用四元数表示的图像数据,其颜色分量之间也相互关联保存有图像的信息,如不遵守四元数的运算法则,将造成图像数据在图像处理过程中的丢失。因此有必要在使用四元数表示图像进行图像处理过程中遵循四元数的运算法则,保留数据信息的完整性。
[0004]现有的利用四元数进行图像处理的方法,大多是把表征像素信息的四元数看作四个分量(一个实部与三个虚部)的简单相加。计算四元数的激活函数,首先把一个完整的四元数分裂为四个实部,然后把每个实部分别输入到实数的激活函数得到各个分量的输出,最后再将每个输出拼凑回到一起还原回四元数的形式。这种方法没有考虑到使用四元数表示的图像数据,其颜色分量之间也相互关联,并保存有图像的信息,从而造成在图像处理过程中丢失了一些图像数据。
[0005]因此,本领域亟需一种遵循四元数的运算法则,保留图像数据信息完整性的技术方案。

技术实现思路

[0006]本专利技术的目的是提供一种基于四元Sigmoid激活函数的图像分类方法及系统,其能够遵循四元数运算法则,并满足深度学习反向传播的可微分条件,从而保留了图像数据信息的完整性,提高了图像分类的准确性,有效解决了现有技术中将四元数拆分为四个分量单独处理,不能把通道间的信息有效的利用起来的问题。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种基于四元Sigmoid激活函数的图像分类方法,所述方法包括:
[0009]获取待分类图像;
[0010]利用基于四元Sigmoid激活函数的图像分类网络对所述待分类图像进行图像分类;
[0011]所述基于四元Sigmoid激活函数的图像分类网络包括并联结构层;所述并联结构层包括:拼接层、四元Sigmoid激活函数支路和卷积支路;所述四元Sigmoid激活函数支路和所述卷积支路并联;
[0012]所述四元Sigmoid激活函数支路利用四元激活函数对四元特征矩阵进行前向传播计算后,再进行卷积操作,得到四元特征激活处理数据;所述卷积支路对四元特征矩阵进行卷积操作,得到四元卷积处理数据;所述拼接层将所述四元特征激活处理数据和所述四元卷积处理数据按四元特征矩阵形式拼接。
[0013]在一些实施例中,所述四元激活函数为:q=q
a
+q
b
i+q
c
j+q
d
k
[0014]其中,q表示四元图像特征信息,q
a
表示四元图像特征信息的实部分量;q
b
表示四元图像特征信息虚部i的分量;q
c
表示四元图像特征信息虚部j的分量,q
c
表示四元图像特征信息虚部k的分量;
[0015]所述四元激活函数中四元数的除法计算公式为:
[0016]在一些实施例中,在所述获取待分类图像之后,还包括:
[0017]将所述待分类图像进行取均值和方差归一化处理,并调整为32x32大小的RGB图。
[0018]在一些实施例中,所述基于四元Sigmoid激活函数的图像分类网络的训练过程,具体包括:
[0019]获取训练图像;
[0020]利用四元卷积层提取所述训练图像的四元图像特征信息;
[0021]将所述四元图像特征信息分别输入四元Sigmoid激活函数支路和卷积支路;所述四元Sigmoid激活函数支路利用四元激活函数对所述四元图像特征信息进行前向传播计算后,再进行卷积操作,得到四元激活处理数据;所述卷积支路对所述四元图像特征信息进行卷积操作,得到卷积处理数据;
[0022]将所述四元激活处理数据和所述卷积处理数据按四元特征矩阵形式拼接,得到四元特征矩阵;
[0023]对所述四元特征矩阵进行批量归一化和RELU激活函数操作,得到归一化四元特征矩阵;
[0024]利用全连接层根据所述归一化四元特征矩阵计算图像分类的概率,得到网络输出向量;
[0025]利用交叉熵损失函数计算所述网络输出向量与真实标签的损失值;
[0026]结合所述损失值进行反向传播,并更新网络参数,得到基于四元Sigmoid激活函数的图像分类网络。
[0027]在一些实施例中,在所述对所述四元特征矩阵进行批量归一化和RELU激活函数操作,得到归一化四元特征矩阵之后,还包括:
[0028]利用四元池化层对所述归一化四元特征矩阵进行池化操作,得到池化四元特征矩阵;
[0029]对所述池化四元特征矩阵依次进行卷积操作、批量归一化操作和RELU激活函数操
作。
[0030]在一些实施例中,所述四元激活函数为:q=q
a
+q
b
i+q
c
j+q
d
k
[0031]其中,q表示四元图像特征信息,q
a
表示四元图像特征信息的实部分量;q
b
表示四元图像特征信息虚部i的分量;q
c
表示四元图像特征信息虚部j的分量,q
c
表示四元图像特征信息虚部k的分量;
[0032]所述四元激活函数中四元数的除法计算公式为:
[0033]在一些实施例中,在所述获取训练图像之后,还包括:
[0034]对所述训练图像进行取均值、方差归一化操作,并调整所述训练图像的大小为32x32的3通道RGB图像。
[0035]在一些实施例中,所述利用四元卷积层提取所述训练图像的四元图像特征信息,具体包括:
[0036]对所述训练图像进行步长为1的卷积操作,得到一维四元特征矩阵;
[0037]利用四元卷积层提取所述一维四元特征矩阵的四元图像特征信息;所述四元卷积层的卷积核大小为3x3、特征边缘填充为1、步长为1以及四元卷积核为32。
[0038]在一些实施例中,在所述利用四元卷积层提取所述训练图像的四元图像特征信息之后,还包括:
[0039]将所述四元图像特征信息的每个通道特征数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于四元Sigmoid激活函数的图像分类方法,其特征在于,所述方法包括:获取待分类图像;利用基于四元Sigmoid激活函数的图像分类网络对所述待分类图像进行图像分类;所述基于四元Sigmoid激活函数的图像分类网络包括并联结构层;所述并联结构层包括:拼接层、四元Sigmoid激活函数支路和卷积支路;所述四元Sigmoid激活函数支路和所述卷积支路并联;所述四元Sigmoid激活函数支路利用四元激活函数对四元特征矩阵进行前向传播计算后,再进行卷积操作,得到四元特征激活处理数据;所述卷积支路对四元特征矩阵进行卷积操作,得到四元卷积处理数据;所述拼接层将所述四元特征激活处理数据和所述四元卷积处理数据按四元特征矩阵形式拼接。2.根据权利要求1所述的基于四元Sigmoid激活函数的图像分类方法,其特征在于,所述四元激活函数为:q=q
a
+q
b
i+q
c
j+q
d
k其中,q表示四元图像特征信息,q
a
表示四元图像特征信息的实部分量;q
b
表示四元图像特征信息虚部i的分量;q
c
表示四元图像特征信息虚部j的分量,q
c
表示四元图像特征信息虚部k的分量;所述四元激活函数中四元数的除法计算公式为:3.根据权利要求1所述的基于四元Sigmoid激活函数的图像分类方法,其特征在于,在所述获取待分类图像之后,还包括:将所述待分类图像进行取均值和方差归一化处理,并调整为32x32大小的RGB图。4.根据权利要求1所述的基于四元Sigmoid激活函数的图像分类方法,其特征在于,所述基于四元Sigmoid激活函数的图像分类网络的训练过程,具体包括:获取训练图像;利用四元卷积层提取所述训练图像的四元图像特征信息;将所述四元图像特征信息分别输入四元Sigmoid激活函数支路和卷积支路;所述四元Sigmoid激活函数支路利用四元激活函数对所述四元图像特征信息进行前向传播计算后,再进行卷积操作,得到四元激活处理数据;所述卷积支路对所述四元图像特征信息进行卷积操作,得到卷积处理数据;将所述四元激活处理数据和所述卷积处理数据按四元特征矩阵形式拼接,得到四元特征矩阵;对所述四元特征矩阵进行批量归一化和RELU激活函数操作,得到归一化四元特征矩阵;利用全连接层根据所述归一化四元特征矩阵计算图像分类的概率,得到网络输出向量;利用交叉熵损失函数计算所述网络输出向量与真实标签的损失值;结合所述损失值进行反向传播,并更新网络参数,得到基于四元Sigmoid激活函数的图
像分类网络。5.根据权利要求4所述的基于四元Sigm...

【专利技术属性】
技术研发人员:盖杉態页鹤
申请(专利权)人:南昌航空大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1