一种基于局部近邻成分分析的图像特征提取方法技术

技术编号:24458624 阅读:89 留言:0更新日期:2020-06-10 16:18
本发明专利技术提供了一种基于局部近邻成分分析的图像特征提取方法。首先,构建特征提取神经网络模型,并进行网络参数和记忆银行初始化;然后,对训练数据集进行子集划分,提取其低维特征,利用记忆银行矩阵在低维特征空间中寻找每个样本的k近邻,并对原子集合和k近邻集合按照标签进行集合划分,以得到的所有集合中样本的相似性度量函数为目标函数进行网络迭代训练;最后,利用训练好的特征提取网络对待处理图像进行特征提取。本发明专利技术方法可以使得同类样本的特征向量在低维空间中聚集,不同类样本的特征向量在低维空间中分散,从而使得原始数据在低维空间中具备明显的聚类结构,能够更加有效地用于图像聚类和图像检索。

An image feature extraction method based on local neighborhood component analysis

【技术实现步骤摘要】
一种基于局部近邻成分分析的图像特征提取方法
本专利技术属机器学习和计算机视觉
,具体涉及一种基于局部近邻成分分析的图像特征提取方法,也可用于图像聚类和图像检索。
技术介绍
随着信息技术的发展,图像、视频、音频等数据呈现几何式地增长。机器学习作为挖掘数据潜在信息的关键技术,已逐渐成为学术界和工业界的重点研究领域,被广泛应用于人脸识别、图像检索、行人再识别等计算机视觉问题。在实际应用场景中,机器学习算法的性能往往受到输入特征的影响。但采集的原始图像数据往往具有高维数、多冗余、多噪音等特点,如何从原始图像数据中提取一个好的低维特征一直以来是机器学习领域的研究难点。近年来,随着深度神经网络的发展,深度图像特征提取已经成为解决上述难点的关键技术之一,其旨在利用深度神经网络学习一个非线性映射函数。该映射函数能够将原始图像数据投影到一个低维空间,在该空间中同类样本的特征向量距离近、相似性强,异类样本的特征距离远、相似性弱。目前,已经有大量有关深度特征提取的关键性技术被提出,其大致可以分为三类:1)损失函数设计;2)采样方法设计;3)集成学习。文献“F.Schroff,D.Kalenichenko,andJ.Philbin,“Facenet:Aunifiedembeddingforfacerecognitionandclustering,”inProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition,2015,pp.815–823.”提出了一种基于三边的损失函数,为深度特征提取提供了一种新的学习范式。文献“C.-Y.Wu,R.Manmatha,A.J.Smola,andP.Krahenbuhl,“Samplingmattersindeepembeddinglearning,”inProceedingsoftheIEEEInternationalConferenceonComputerVision,2017,pp.2840–2848”提出了一种基于距离的权重采样方法。为了降低三边损失函数带来的算法不稳定性,提高算法的收敛速度并降低时间消耗,文献“K.Sohn,“Improveddeepmetriclearningwithmulti-classn-pairlossobjective,”inProceedingsoftheAdvancesinNeuralInformationProcessingSystems,2016,pp.1857–1865.”提出一种N-pair损失函数。此外,文献“M.Opitz,G.Waltner,H.Possegger,andH.Bischof,“Bier-boostingindependentembeddingsrobustly,”inProceedingsoftheIEEEInternationalConferenceonComputerVision,2017,pp.5189–5198.”利用集成学习的思想同时训练多个神经网络,并将学习到的低维表示进行融合。最近,文献“K.Sohn,“Improveddeepmetriclearningwithmulti-classn-pairlossobjective,”inProceedingsoftheAdvancesinNeuralInformationProcessingSystems,2016,pp.1857–1865.”通过对多种损失函数和采样方法进行分析,提出了一个统一的学习框架,为深度图像特征提取领域提供了一个新的研究视角。上述算法都推动了深度图像特征提取的发展,并取得了较好的实验结果。但是,受深度学习训练方法的影响,上述方法存在两点不足:1)在每一次的迭代训练过程中没有利用全局的数据结构信息;2)忽略了数据在低维空间中的近邻结构分布。上述两个问题往往导致学习到的映射函数在实际场景中泛化性能较差。
技术实现思路
为了克服现有技术的不足,本专利技术提供一种基于局部近邻成分分析的图像特征提取方法。首先,构建特征提取神经网络模型,并进行网络参数和记忆银行初始化;然后,对训练数据集进行子集划分,提取其低维特征,利用记忆银行矩阵在低维特征空间中寻找每个样本的k近邻,并对原子集合和k近邻集合按照标签进行集合划分,以得到的所有集合中样本的相似性度量函数为目标函数进行网络迭代训练;最后,利用训练好的特征提取网络对待处理图像进行特征提取。本专利技术方法可以使得同类样本的特征向量在低维空间中聚集,不同类样本的特征向量在低维空间中分散,从而使得原始数据在低维空间中具备明显的聚类结构,能够更加有效地用于处理图像聚类以及图像检索任务。一种基于局部近邻成分分析的图像特征提取方法,其特征在于步骤如下:步骤1:提取Resnet50卷积神经网络模型中的特征提取模块作为特征提取神经网络模型,并以其在Imagenet数据集上训练得到的网络参数为初始化参数,设定特征提取网络的批次样本输入个数为b,b的取值为32、64或128;随机初始化记忆银行矩阵V,矩阵V的大小为n×d,n为带有标签的图像训练数据集X所包含的图像数量,n为b的整数倍,d为低维特征维数,取值为64、128或256;步骤2:将训练数据集X随机划分成t个不相交的数据子集X1、X2、…、Xt,t=n/b,每个子集包含b幅图像,以每个数据子集为步骤1得到的特征提取神经网络模型的输入,设定目标函数为相似性度量函数,学习率为e-5,训练次数xmax为50000,衰减次数为10000,采用Adam优化算法进行网络训练,具体为:步骤2.1:初始化子集序号p=1;步骤2.2:将数据子集Xp输入到步骤1得到的预训练特征提取神经网络模型,输出即为子集中每一幅图像的一个低维特征向量,设其中第i幅图像的低维特征向量为按下式对记忆银行矩阵中的第(p-1)b+i行进行更新:其中,表示更新后的记忆银行矩阵的第(p-1)b+i行向量,表示更新前记忆银行矩阵的第(p-1)b+i行向量,m为记忆更新参数,m=0.8;步骤2.3:对于子集中每一幅图像利用其标签将子集划分为正样本集合和负样本集合其中,正样本集合包括子集Xp中所有与标签相同的图像,负样本集合包括子集Xp中所有与标签不同的图像;并根据图像的标签将其k近邻图像集划分为两个集合和所述的k近邻图像集是指更新后的记忆银行矩阵中与行向量欧式距离最小的k个行向量所对应的图像构成的集合,是由中与的标签相同的图像构成的集合,是由中与的标签不同的图像构成集合;步骤2.4:利用下式计算相似性度量函数值L:其中,L表示度量损失;α表示控制正样本对的尺度参数,取值范围是α∈[1,5];β表示控制负样本对的尺度参数,取值范围是β∈[10,50];λ表示间隔,取值范围是λ∈[0.1,0.5];表示图像的低维特征向量与集合中第l1幅图像的低维特征向量的内积,l1=1,…,K1,K1表示集合中图像的数量,表示图像的低维特征向量与集合中第l2幅图像的低维特征向量的内积,l本文档来自技高网
...

【技术保护点】
1.一种基于局部近邻成分分析的图像特征提取方法,其特征在于步骤如下:/n步骤1:提取Resnet50卷积神经网络模型中的特征提取模块作为特征提取神经网络模型,并以其在Imagenet数据集上训练得到的网络参数为初始化参数,设定特征提取网络的批次样本输入个数为b,b的取值为32、64或128;/n随机初始化记忆银行矩阵

【技术特征摘要】
1.一种基于局部近邻成分分析的图像特征提取方法,其特征在于步骤如下:
步骤1:提取Resnet50卷积神经网络模型中的特征提取模块作为特征提取神经网络模型,并以其在Imagenet数据集上训练得到的网络参数为初始化参数,设定特征提取网络的批次样本输入个数为b,b的取值为32、64或128;
随机初始化记忆银行矩阵矩阵的大小为n×d,n为带有标签的图像训练数据集X所包含的图像数量,n为b的整数倍,d为低维特征维数,取值为64、128或256;
步骤2:将训练数据集X随机划分成t个不相交的数据子集X1、X2、…、Xt,t=n/b,每个子集包含b幅图像,以每个数据子集为步骤1得到的特征提取神经网络模型的输入,设定目标函数为相似性度量函数,学习率为e-5,训练次数xmax为50000,衰减次数为10000,采用Adam优化算法进行网络训练,具体为:
步骤2.1:初始化子集序号p=1;
步骤2.2:将数据子集Xp输入到步骤1得到的预训练特征提取神经网络模型,输出即为子集中每一幅图像的一个低维特征向量,设其中第i幅图像的低维特征向量为i=1,...,b,按下式对记忆银行矩阵中的第(p-1)b+i行进行更新:



其中,表示更新后的记忆银行矩阵的第(p-1)b+i行向量,表示更新前记忆银行矩阵的第(p-1)b+i行向量,m为记忆更新参数,m=0.8;
步骤2.3:对于子集中每一幅图像i=1,...,b,利用其标签将子集划分为正样本集合Pip和负样本集合其中,正样本集合Pip包括子集Xp中所有与标签相同的图像,负样本集合包括子集Xp中所有与标签不同的图像;...

【专利技术属性】
技术研发人员:聂飞平户战选王榕李学龙王政王瀚
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1