一种基于DMD及随机傅里叶特征变换的图像分类方法技术

技术编号:31622210 阅读:14 留言:0更新日期:2021-12-29 18:57
本发明专利技术涉及一种基于DMD及随机傅里叶特征变换的图像分类方法,属于图像分类技术领域。所述方法,包括:步骤1、对训练图片进行基于颜色的动态模式分解,得到训练图片显著色彩矩阵;步骤2、基于步骤1得到的显著色彩矩阵作为DMD特征,得到提取特征后的同类图片,并基于同类图片构建特征训练集X;步骤3、对特征训练集X中的同类图片特征进行训练,得到训练好的分类模型参数;步骤4、对于待分类图片进行分类。所述方法对于小样本图像、单一样本图像的识别准确率高;对于具有复杂背景的图像识别准确率高,且时间复杂度和空间复杂度低;避免神经网络结果选择和局部最小值问题;对高维、非线性分类问题具有很好的泛化性。分类问题具有很好的泛化性。分类问题具有很好的泛化性。

【技术实现步骤摘要】
一种基于DMD及随机傅里叶特征变换的图像分类方法


[0001]本专利技术涉及一种基于DMD及随机傅里叶特征变换的图像分类方法,属于图片分类


技术介绍

[0002]动态模式分解(Dynamic mode decomposition,DMD)是一种由数据驱动的方法,其不需要将高度复杂的系统准确分解成各自相干的时空结构方程,而是使用随时间增长、衰减和振荡的相干结构来求解或近似系统。其中的相干结构也被称为DMD模态。DMD将系统转换成各个模态的叠加,每个模态的强度都由与之对应的特征值来表示。DMD的优势在于尽管DMD模态和特征值的数学过程是线性的,但其通过叠加表示或者近似表示的系统确可以是非线性的,因此大大降低了运算成本。
[0003]DMD最初由Schmid在2010发表的文章《Dynamic mode decomposition of numerical and experimental data》中提出,并被广泛应用于分析非线性系统动力学中。DMD还被用来预测系统未来状态、自然语言处理、显著区域检测等领域。DMD受到了Koopman

operator分析的启发,因为其能够提供流体动力学系统中的非线性的动态本质信息而在流体领域被广泛应用。
[0004]DMD被广泛用于处理实时的动态数据,但利用其强大的分析能力,使其处理静态图片成为可能。将静态图片灰度矩阵进行DMD,将其分解成各个模态并叠加,形成低秩矩阵和稀疏矩阵,并将稀疏矩阵进行后续的分类识别,达到图片分类的目标。其中低秩矩阵表示图片中待识别目标的干扰背景,稀疏矩阵表示待识别目标。通过DMD可以将图片中的待识别目标进行突显,并消除背景干扰。
[0005]支持向量机(support vector machines,SVM)是一种二分类模型,包括一类支持向量机和二类支持向量机。传统SVM模型为线性分类器且模型是定义在特征空间上的最大间隔线性分类器。SVM的学习策略为间隔最大化,本质为一个求解凸二次规划问题,也等价于正则化合页损失函数最小化问题。
[0006]相较于二类支持向量机,基于DMD及随机傅里叶特征变换的图像分类方法模型类似于一类支持向量机(one

class SVM)模型,该模型在训练时只需一种类型的数据,且将原点看做与提供的训练集不同的另一类数据。该模型进行训练不需要同时提供带有正标签(positive label,PL)的数据和带有负标签(negative label,NL)的数据。与二类支持向量机模型相比,一类支持向量机模型更适合应用于异常检测、单训练样本识别等实际问题。
[0007]对于处理非线性二分类问题,SVM应用核函数,通过一个非线性变换将输入空间(欧式或某离散空间)对应到一个特征空间(希尔伯特空间),从而使得输入空间中的超曲平面模型对应到特征空间中的超平面模型,这样将二分类的学习任务通过在特征空间中求取线性SVM来完成。然而,由于映射函数无法显示表示,导致特征空间的维度无法明确确定,从而使得特征空间的维度通常很高,甚至达到无穷维度。这样就大大加深了SVM算法的时间复杂度,导致基于映射函数(核函数)的SVM无法满足快速处理大量数据的需求。
[0008]针对于SVM处理非线性问题时产生的高维特征空间问题,基于DMD及随机傅里叶特征变换的图像分类方法采取随机傅里叶特征变换(Random Fourier Features Transformation,RFFT)替换SVM中的核函数。通过找到一个新的映射函数近似映射函数,找到新的显示表达的,且维度可控的映射函数。因此在新的特征空间中训练线性学习器时,认为:控制特征空间维度,进而控制时间复杂度和计算复杂度,在大规模数据集上能有效提高计算效率。
[0009]在图片分类领域的分类方法主要有:最邻近算法(K

nearest Neighbour,KNN)、支持向量机(Support Vector Machine,SVM)、BP神经网络(Back Propagation Neural Network,BPNN)以及卷积神经网络(Convolutional Neural Network,CNN)。其中,KNN算法需要存储所有训练数据在预测时进行计算,其训练时间很短,但预测时间较长。KNN分类器更适合低维度数据,在图片分类中,大多数图片都属于高维度数据,包含大量像素,因此KNN算法在图片分类中预测时间较长,分类准确度较低。SVM分类器相比于KNN分类器更适合处理高维度数据,但是由于其自身算法的局限性,导致其需要大量时间来处理大批量图片数据,且在核函数选择上也没有统一的标准,需要根据经验进行判断,从而导致了算法在准确度和时间复杂度上的不理想。BPNN算法具有较强的非线性映射能力且具有高度的自学习和自适应能力,CNN算法在处理高维数据上优势更大,二者的图片分类准确率都很高,但都存在训练时间较长,训练结果难以收敛于全局最小值而出现局部极小化问题等缺点,从而导致二者在图片分类领域的高时间复杂度和计算复杂度。
[0010]本专利技术的目的是致力于解决上述算法在时间复杂度和算法复杂度较高的技术缺陷,同时保证较高的分类准确率。在分类准确度方面,基于DMD及随机傅里叶特征变换的图像分类方法与SVM、BPNN、CNN的准确率相当;然而,在复杂度方面,基于DMD及随机傅里叶特征变换的图像分类方法的优势凸显:该方法具有极低的运算复杂度,进而导致算法时间延迟极低,这使得该方法更适合处理海量的图片或非图片数据,适用于样本数量有限或小样本情况下的分类与识别。在处理小样本图片时,尤其针对单一样本图片,基于DMD及随机傅里叶特征变换的图像分类方法在建立模型上相较于其他算法的数据量需求更低。因此,基于DMD及随机傅里叶特征变换的图像分类方法在图片分类领域具有十分显著的优势。

技术实现思路

[0011]本专利技术的目的在于常见分类算法对于小样本图片分类、单一样本图片分类准确率较低、时间复杂度较高的技术缺陷,提出了一种基于DMD及随机傅里叶特征变换的图像分类方法。
[0012]为达到上述目的,采取如下技术方案:
[0013]所述基于DMD及随机傅里叶特征变换的图像分类方法,包括如下步骤:
[0014]步骤1、对训练图片进行基于颜色的动态模式分解,得到训练图片显著色彩矩阵;
[0015]步骤2、基于步骤1得到的显著色彩矩阵作为DMD特征,得到提取特征后的同类图片,并基于同类图片构建特征训练集X;
[0016]步骤3、对特征训练集X中的同类图片特征进行训练,得到训练好的分类模型参数;
[0017]其中,分类模型参数包括权重向量和分离间隔;且权重向量,记为w
new
,表示特征空间分离面的单位法向量;分离距离,记为ρ,ρ为分离面和坐标原点的距离;
[0018]步骤3、具体包括如下子步骤:
[0019]步骤3.1、对特征训练集中同类图片的DMD特征进行随机傅里叶特征变换,得到随机傅里叶特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DMD及随机傅里叶特征变换的图像分类方法,其特征在于:包括如下步骤:步骤1、对训练图片进行基于颜色的动态模式分解,得到训练图片显著色彩矩阵;步骤2、基于步骤1得到的显著色彩矩阵作为DMD特征,得到提取特征后的同类图片,并基于同类图片构建特征训练集X;步骤3、对特征训练集X中的同类图片特征进行训练,得到训练好的分类模型参数;其中,分类模型参数包括权重向量和分离间隔;且权重向量,记为w
new
,表示特征空间分离面的单位法向量;分离距离,记为ρ,ρ为分离面和坐标原点的距离;步骤3、具体包括如下子步骤:步骤3.1、对特征训练集中同类图片的DMD特征进行随机傅里叶特征变换,得到随机傅里叶特征变换后的数据集合Z;步骤3.2、从随机傅里叶特征变换后的数据集合Z中随机选择一个数据点作为初始权重向量并赋值给权重向量w;步骤3.3、基于权重向量w通过黄金分割线搜索计算分离间隔ρ;步骤3.4、对所有wz(x
j
)

ρ小于0的数据点z(x
j
)求平均后得到平均权重向量w
m
;其中,x
j
为特征训练集X的数据,z(x
j
)为数据集合Z中x
j
的对应项;步骤3.5、通过随机梯度下降方法选择w和w
m
间新的权重向量w
new
,并将w
new
赋值给w;步骤3.6、重复步骤3.3至步骤3.5,直至S次迭代后,得到趋于稳定的w
new
;将此w
new
记为最优权重向量w
*
;步骤3.7、根据黄金分割线搜索计算出最优权重向量w
*
对应的最优分离间隔ρ
*
;其中,最优权重向量w
*
以及最优分离间隔ρ
*
为训练好的分类模型参数;步骤4、对于待分类图片进行分类,具体包括如下子步骤:步骤4.1、对待分类图片进行预处理,得到预处理后的待分类图片;步骤4.2、对预处理后的待分类图片进行特征提取,得到待分类图片的特征;步骤4.3、基于待分类图片的特征进行随机傅里叶...

【专利技术属性】
技术研发人员:吴浩卢继华陈子健冯立辉傅雄军韩航程谢民
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1