一种核化的逆近邻判别分析方法技术

技术编号：38200046 阅读：11 留言：0更新日期：2023-07-21 16:41

本发明专利技术公开了一种核化的逆近邻判别分析方法，包括如下步骤：获得训练图像样本；利用高斯核函数将输入数据映射到高维空间；利用核技巧以及逆近邻算法得到训练图像样本在高维空间中的类内散度矩阵和类间散度矩阵的表达；通过特征分解学习最大化类间散度矩阵和最小化类内散度矩阵的投影矩阵；利用投影矩阵对训练和测试图像样本进行特征提取；使用最近邻算法对测试样本进行分类。本发明专利技术首次将逆近邻线性判别分析方法推广到高维空间，以解决非线性数据的分类问题，提出使用高斯核函数进行高维映射，对该算法进行核化，利用核技巧进行非显式映射的推导，在高斯函数映射后的空间中建立高维逆近邻进而求取散度矩阵，其中利用核技巧实现高维空间中的距离表达。现高维空间中的距离表达。现高维空间中的距离表达。

全部详细技术资料下载

【技术实现步骤摘要】
一种核化的逆近邻判别分析方法

[0001]本专利技术属于逆近邻判别分析领域，尤其涉及一种核化的逆近邻判别分析方法。

技术介绍

[0002]线性判别分析法(LDA)是一种有监督的经典的线性学习方法，它源于Fisher判别式，它不仅可以用于特征降维，还可以有效解决有监督的分类问题。它的原理是在给定的训练样本中，试图找到能使类间散度矩阵最大化和类内散度矩阵最小化的投影矩阵，并利用该投影矩阵对测试样本进行降维，进而可以使用最近邻或其它分类器进行分类。作为一种有监督的特征提取方法，LDA已经在模式识别分类任务中，证明了它的可行性和有效性，并且被广泛应用于数据降维、信号分析、图像分类等领域。特别在手写数字识别、人脸识别、目标分类等视觉分类任务上有较显著的研究成果。
[0003]在LDA算法中，需要假设样本服从独立同分布(i.i.d.)，才能获得较好的分类结果。但当同一个类的样本来自几个不同的集群，有不同的方差时，使得上述假设不成立，则LDA难以得到很好的分类效果。混合判别分析(MDA)是解决该问题的一种重要方法，其使用高斯模型对不同的集群进行建模。另外一种解决方案是流形或者图论的方法对局部结构进行建模，还有一类方法是使用k近邻等非参数方法对局部邻域进行建模，其中基于逆近邻的线性判别分析(nLDA)是最近提出的其中一种解决多模态问题的有效方法。nLDA通过逆近邻算法构建散度矩阵，而逆近邻算法是一种有效的无监督离群点检测方法，它可以排除训练集中的“孤立点”，具有更优的分类能力。nLDA是一种直接将散度矩阵定义在邻域上的方法，

【技术保护点】

【技术特征摘要】
1.一种核化的逆近邻判别分析方法，其特征在于，包括如下步骤：S1、获得训练图像样本，所述训练图像样本为X＝[x1,x2,...,x
N
]；S2、利用高斯核函数将输入数据映射到高维空间，所述输入数据为训练图像样本；S3、利用核技巧以及逆近邻算法得到训练图像样本在高维空间中的类内散度矩阵和类间散度矩阵表达；S4、通过特征分解学习最大化类间散度矩阵和最小化类内散矩阵的投影矩阵；S5、利用投影矩阵训练和所述测试图像样本进行特征提取；S6、使用最近邻算法对所述测试图像样本进行分类。2.根据权利要求1所述的核化的逆近邻判别分析方法，其特征在于，所述利用高斯核函数将输入数据映射到高维空间具体为：定义一种映射使每个样本从原始特征空间R
d
映射到高维特征空间F，将其表示为：到高维特征空间F，将其表示为：其目的是使特征空间中的线性子空间可以通过映射向量来张成，其中表示将样本x从原始特征空间映射到高维特征空间中，是样本x在高维特征空间中的表示；将训练样本中的第i个图像向量x
i
和第j个图像向量x
j
的内积表示为以下的核函数形式：其中，<
·
>为高维特征空间中两个向量的内积；选择典型而有效的高斯核函数k
g
，并且进行内积计算，将其表示如下：其中，σ是高斯核函数中的一个可调参数。3.根据权利要求1所述的核化的逆近邻判别分析方法，其特征在于，所述利用核技巧以及逆近邻算法得到训练图像样本在高维空间中的类内散度矩阵和类间散度矩阵表达，具体为：S301、在高维核空间中去确定样本的逆近邻，高维空间中样本点在N个映射后的图像样本集合中的k阶逆近邻表达为:其中，表示高维样本点的k阶近邻；得到高维空间中的一个最优投影矩阵ω＝[ω1,ω2,...,ω
i
,...,ω
h
],h表示最后特征保留的维度,使得类间散度矩阵最大化和类内散度矩阵最小化,即最大化J
KRNDA
(ω)，用下面式子表示:在高维空间F中的h个投影向量ω＝[ω1,ω2,...,ω
i
,...,ω
h
],则投影向量在原始高维数据张成的F空间中线性表示：
其中，α
ij
和N分别指的是线性组合系数和训练样本总数；S302、得到了最优投影矩ω，通过对映射后的高维样本进行投影，即可获得降维后的判别特征则使用上面的线性表达式以及核技巧,上式中的表达成：其中α
i
＝[α
i1
,α
i2
,...,α
iN
]...

【专利技术属性】
技术研发人员：谭恒良，李旺旺，谢铭，冯健维，杜娇，杨朔，颜国风，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人