基于等距映射的人脸图像识别方法技术

技术编号:4176764 阅读:195 留言:0更新日期:2012-04-11 18:40
一种图像处理技术领域的基于等距映射的人脸图像识别方法,包括:对输入的图像进行预处理,并以向量形式表示;将列向量作为训练样本,组成训练样本集,然后将训练样本集中每个训练样本作为顶点建立邻域连接赋权无向图GX;根据邻域连接赋权无向图GX,计算得到每两个训练样本之间的最短路径,建立最短路径矩阵DG=(dG(i,j));对最短路径矩阵进行直接线性分类处理,得到最佳投影矩阵W;将最佳投影矩阵W作用于测试集Dtest,进行降维,得到低维的优化特征样本,然后用最小距离法或者K近邻法对测试集进行分类,得到人脸识别结果。本发明专利技术同时考虑图像像素间的空间关系特征,用直接线性判别分析方法取代多维尺度分析法,在人脸识别试验中取得了较高的识别率。

Facial image recognition method based on isometric mapping

A kind of image processing technology in the field of face image recognition method based on isometric mapping includes: the input image is preprocessed and expressed in vector form; the column vector as the training samples, the training sample set, then the training samples of each training sample set as the vertex neighborhood connected undirected weighted graph based on GX; neighborhood connected undirected weighted graph GX, calculate the shortest path between each of the two training samples, the establishment of the shortest path matrix (DG = dG (I, J)); direct linear classification of shortest path matrix, the optimal projection matrix W; optimal projection matrix W for the test set Dtest, dimensionality reduction, optimization of low dimensional feature samples, then classify the test set using the minimum distance method or K nearest neighbor method, get the face Recognition result. The invention takes into account the spatial relation characteristics between the image pixels, and replaces the multidimensional scaling analysis method with the direct linear discriminant analysis method, and achieves higher recognition rate in the face recognition test.

【技术实现步骤摘要】

本专利技术涉及的是一种图像处理
的方法,具体是一种基于等距映射的人脸图像识别方法
技术介绍
传统模式识别中,经典子空间方法如主成分分析法(Principal ComponentAnalysis, PCA) 、 Fisher线 性 判 另U 分 析 方 法 (Fisher Linear DiscriminantAnalysis,LDA)等本质上都是运用各种优化准则寻找高维输入空间到低维子 空间的最佳投影矩阵,它们在人脸、文字识别等应用中取得了良好的效果。但是在遇到一些 复杂的非线性问题时,就失去了它们的优势,基于此,非线性方法便应运而生, 一种是基于 核的方法,另外一种就是基于流形学习的方法。基于谱论的流形学习方法可以分为局部方 法与全局方法两种。 局部流形学习方法起始于Rowels和Saul提出的局部线性嵌入方法(Locally Linear embedding, LLE)(S. Roweis and L K. Saul. Nonlineardimensional reduction by locally linear embedding . Science, December2001 vol. 290 :2323-2326.),该方法 能够把高维输入空间的数据点映射到一个全局低维坐标系,同时保留了邻接点之间的关 系,这样,局部的几何结构就能够得到保持,近年来,在LLE方法的基础上,局部保持流形 学习方法逐渐发展成为一个比较活跃而且相对成熟的重要分支;全局流形学习方法起始 于Tenenbaum等提出的等距映射方法(IS0MAP) (J. B. Tenenbaum, V. de Silva, and John C丄angford. A global geometric framework for nonlinear dimensionalreduction. Science, 2000, vol.290 :2319-2323.),该方法首先构建每个输入数据点的邻域图,然后利 用邻域图中的最短路径得到近似的测地线距离,代替不能表达内在流形结构的Euclidean 距离,最后经过多维尺度分析(Multidimensional Scaling, MDS)处理,发现嵌入在高维输 入空间的低维嵌入.在人脸和手势的实验中,IS0MAP方法发现了嵌入高维空间中的潜在低 维参数空间。此后,引入了核的思想,一定程度上增强了 ISOMAP方法的推广能力。 以上方法都是基于重构误差最小化的思想,没有清晰的投影矩阵,对于模式分类 而言不是最优的,不能直接应用于识别。 此夕卜,已有的IS0MAP系列方法需要通过计算点与点间的欧氏距离寻找最近邻,进 而得到点与点间的最短路径。这种基于点的运算对噪声高度敏感,尤其在图像识别领域,对 哪怕很小的形变都会影响到整个方法的处理效果,不具有拓扑稳定性。 鉴于此,为了使等距映射算法能够很好的应用于模式识别领域,便提出了一种基 于邻域图像欧氏距离和Direct LDA的IS0MAP识别方法(KIMD-IS0MAP),该方法基于邻域 的图像欧氏距离(Image Euclidean Distance, MED)计算点与点间的距离,进而寻找最近 邻,建立全部数据点的距离关系矩阵,较之传统欧氏距离,图像欧氏距离考虑到二维图像像 素间的空间位置关系,对图像噪声有一定的鲁棒性。此外,运用基于邻域的图像欧氏距离, 可以一定程度上降低距离计算的时间复杂度。同时用直接线性判别分析方法(Direct LDA)4取代多维尺度分析法(MDS)进行降维,MDS方法基于可视化的准则,对分类而言不是最优的,不能直接用于识别,基于分类的Direct LDA方法便能够很好的解决这个问题,在减小计算复杂度和处理"小样本问题"上也有一定的优势。
技术实现思路
本专利技术针对现有技术存在的上述不足,提供一种,同时考虑图像像素间的空间关系特征,用直接线性判别分析方法取代多维尺度分析法,在人脸识别试验中取得了较高的识别率。 本专利技术是通过以下技术方案实现的,本专利技术包括以下步骤 第一步、对输入的高维空间中的n幅图像作为高维空间中的一个点,每幅图像的分辨率为MXN,对此n个点X = {Xl,x2,…,xj依次进行预处理,将每幅图像Xi, 1《i《n以向量形式表示,即将所得的每幅图像Xi,l《i《n为列向量,其中Xia,l《i《n,1《a《MXN为列向量的元素值,i为列向量的序号,a为列向量元素的序号。 所述的预处理是指灰度化处理、分辨率调整处理和小波分解处理。 第二步、将列向量作为训练样本,组成训练样本集,然后将训练样本集中每个训练样本作为顶点建立邻域连接赋权无向图Gx ; 所述的邻域连接赋权无向图Gx具体是指定义邻域大小为e邻域或K邻域,计算每个样本点Xi, 1《i《n同其余样本点的基于邻域的图像欧氏距离dIMED,并定义近邻点之间的边的权值为dx(i, j) = dIMED(Xi, Xj),则这些近邻点之间带权值的边组成邻域连接赋权无向图Gp 所述的K邻域是指当Xj是Xi的最近的K个点中的一个时判定为邻域关系且邻域边长为; 所述的£邻域是指当Xi和Xj的距离d誦(Xi,Xj)小于固定值e时,认为它们近邻,邻域边长为Xjxi。 所述基于邻域的图像欧氏距离dIMED是指所述MXN维图像向量化之后为=(xU2, ,;c"),其中x,"是二维图像像素点(k, 1)处的灰度值,令l尸。-《卜V(t-^)2+G-r)2为两像素Xia,a = kN+1和x ,b = k' N+l'之间的距离,定义像素^和Xib间的度量系数1.exp尺—尺2;rc^丄^ /2o"'_0 ,其它 其中O为像素集的方差参数,可设为1, A为以目标像素^或^为中心的邻域参数,根据应用环境的不同可自由设定。 则两幅图像X和Y间的基于邻域的图像欧氏距离为爐《M£D(U)= 2>y"——A) = (X —r)TG(X —,其中G = (gij),'■,)=i 其中u = G1/2X, v = G^Y,则图像欧氏距离重新表达为,ij7 MNX丽 d誦(X,Y) = (X-Y)TG1/2G1/2(X_Y) = (u-V)T(U-v); 其中G1/2 = r A1/2rT, A为G的特征值矩阵,r为对应的特征向量矩阵。 第三步、根据邻域连接赋权无向图Gx,计算得到每两个训练样本之间的最短路径,建立最短路径矩阵Dc二 (dG(i, j)); 所述的最短路径即测地距离,是指根据邻接图Gx,利用图论中经典的Floyd迭代算法或者Dijkstra算法计算流形上任意两点间的最短流形距离当图Gy有边xjXi时,设最短路径cUi, j) = dIMED(Xi, Xj);否则设dc(i, j)= ,则最短路径矩阵为 A; = WG (/, _/))=:=1进行直接线性分类处理,得到最佳投影矩阵W,具体包括以下步骤 4. 1)在最短路径矩阵De中随机选取训练样本集("加,《) ><1, 作为输入训练输入数据。令^= ,其中i^ j,D他)二O,共c类,作为高维输入。计算出类内离散度Sw和类间离散度Sb,然后由^ =^0^和^=^《计算出①b和气,根据任意矩阵LLT和本文档来自技高网
...

【技术保护点】
一种基于等距映射的人脸图像识别方法,其特征在于,包括以下步骤:    第一步、对输入的高维空间中的n幅图像作为高维空间中的一个点,每幅图像的分辨率为M×N,对此n个点X={x↓[1],x↓[2],…,x↓[n]}依次进行预处理,将每幅图像x↓[i],1≤i≤n以向量形式表示,即将所得的每幅图像x↓[i],1≤i≤n为列向量,其中:x↓[i]↑[a],1≤i≤n,1≤a≤M×N为列向量的元素值,i为列向量的序号,a为列向量元素的序号;    第二步、将列向量作为训练样本,组成训练样本集,然后将训练样本集中每个训练样本作为顶点建立邻域连接赋权无向图G↓[X];    第三步、根据邻域连接赋权无向图G↓[X],计算得到每两个训练样本之间的最短路径,建立最短路径矩阵D↓[G]=(d↓[G](i,j));    第四步、对最短路径矩阵D↓[G]=[d↓[G]↑[2](x↓[i],x↓[j])]↓[i,j=1]↑[n]进行直接线性分类处理,得到最佳投影矩阵W;    第五步、将最佳投影矩阵W作用于测试集D↓[tesi],进行降维,得到低维的优化特征样本,然后用最小距离法或者K近邻法对测试集进行分类,得到人脸识别结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李元祥魏宪许鹏
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1