一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法技术

技术编号:29280329 阅读:17 留言:0更新日期:2021-07-16 23:13
本发明专利技术公开了一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法,包括如下步骤:S1、首先利用2DPCA方法对原始数字图像A

A robust handwritten numeral recognition method based on improved 2dpca-eoca

【技术实现步骤摘要】
一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法


[0001]本专利技术涉及一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法,通过2DPCA方法降维以降低计算量,并利用空间投影法来设计误差性能指标函数,以克服噪声的影响,提高分类结果的准确性,设计改进ECOA方法,实现对手写数字的分类,同时,并利用最近邻法实现数字图像的最终分类,此方法适用于手写数字的识别,属于模式识别和图像处理领域。

技术介绍

[0002]手写数字识别是研究如何利用计算机自动识别人手写在纸张上的阿拉伯数字。其主要基于数据驱动技术进行分类识别。因此数据的准确性对识别结果尤为重要。但数据中通常存在噪声,在聚类簇中都可能包含噪声数据,所以真实的聚类数据和噪声数据很难区分。为克服噪声影响,需要对聚类参数进行反复试凑调整,但仍难以达到满意效果,并且聚类参数的改动也会影响到聚类结果,导致解的差异性较大。
[0003]EOCA方法采用启发式自组织的聚类方式可以有效克服这一问题,但EOCA在聚类中存在如下问题:1.输入变量难以确定;2.聚类结果的有效性评判缺乏公度性。为此,利用2DPCA方法降维以提供EOCA输入变量,并利用空间投影方法构造性能误差指标函数,实现对EOCA方法的改进,来进一步划分聚类空间和噪声空间,进而在聚类空间内评价改进EOCA中每次迭代聚类结果的质量,以进一步降低噪声影响,提高最终聚类结果的准确性。

技术实现思路

[0004]在手写数字识别中,传统的数据驱动方法采用聚类技术进行分类识别,存在着对数据中噪声的鲁棒性较差,且调节参数过多导致计算量较大的问题。本方法针对上述问题,引入2DPCA方法以降维输入图像,获得适宜的特征;为克服噪声的影响,通过引入空间投影法到EOCA方法中,利用来设计误差性能指标,以进一步实现噪声数据与聚类数据的准确划分,提高聚类结果的准确性;并通过最近邻法实现给定数字图像的分类,设计了一种基于改进2DPCA-EOCA的鲁棒手写数字分类方法。
[0005]针对现有技术存在的问题,本专利技术采用如下技术方案予以实现:
[0006]1、一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法,包括如下步骤:
[0007]S1、基于2DPCA方法对原始数字图像A
i
进行降维,得到图像的特征矩阵Y
i
,i=1,2,...N,其中A
i
为m
×
n的二维矩阵,N为图像的个数;
[0008]S2、基于空间投影构造改进一致性准则函数,实施对EOCA算法的改进;
[0009]S3、将图像A
i
的特征矩阵Y
i
作为EOCA方法的聚类输入,对其实施EOCA聚类,得到分类结果,作为参考模板,i=1,2,...N。
[0010]S4、利用参考模板,基于最近邻分类法,对任意输入的手写数字图像A

,实现分类识别。
[0011]所述步骤S1中2DPCA算法步骤为:
[0012](1)取N个原始训练图像A
i
(i=1,2,...,N);
[0013](2)定义图像A
i
的总体散布矩阵G
t
如下:
[0014][0015](3)对G
t
进行特征值分解,得到:
[0016]Λ=U
T
G
t
U
[0017]其中,Λ=diag(λ1,λ2,...,λ
n
)为特征值对角矩阵,U=[X1,X2,...,X
n
],X
i
为n维列向量,i=1,2,

,n。
[0018](4)保存U中的d个Λ=U
T
G
t
U最大特征值对应特征向量,得到最优投影特征矩阵X
opt
=[X1,X2,...,X
d
],其中X1,X2,...,X
d
为特征向量,分别对应特征值λ1,λ2,...,λ
d

[0019](5)对任意图像样本A
i
,令Y
i
=A
i
X
opt
,得到投影特征向量组Y
i
={Y
1i
,Y
2i
,...,Y
di
},i=1,2,

,N,作为降维后的参考模板,其中Y
li
为m维列向量,是图像A
i
的第l个特征向量,l=1,2,...,d。令Y={Y1,Y2,...,Y
N
},Y即为图像A
i
的特征矩阵。
[0020]所述步骤S2中空间投影算法步骤为:
[0021](1)利用正交投影进行X

Y的空间变换,将得到变换矩阵如下:
[0022][0023][0024]其中I
m
为m
×
m的单位矩阵;I
d-m
为(d-m)
×
(d-m)的单位矩阵;0
d-m,m
为(d-m)
×
m的单位矩阵;0
m,d-m
为m
×
(d-m)的单位矩阵。
[0025](2)令正交矩阵V=X
opt
,得到正交投影后的变换数据集:
[0026][0027]和
[0028][0029]其中X
C
为聚类数据集,X
N
为噪声数据集。
[0030]所述步骤S2中改进一致性准则函数J的构造公式为:
[0031][0032][0033]J=J
C
+J
N
[0034]其中第一部分J
C
表示聚类空间的误差信息,其包含了原始空间降维后的特征,J
N
表示噪声空间的信息。
[0035]所述步骤S3中EOCA算法的步骤为:
[0036](1)给定特征变量,采用标准变换预处理原始图像特征矩阵Y,得到归一化后的数据集作为聚类对象;
[0037](2)采用偶极子法分别生成子集A、B、C、D;
[0038](3)在子集A、B上分别基于改进一致性准则和相对不相似性测度进行层次聚类,之
后比较得到改进一致性准则的最小值J
AB
和候选聚类集合{c
AB
,V
AB
};对于C、D,同理获得其对应的最小改进一致性准则值J
CD
和候选聚类集合{c
CD
,V
CD
};
[0039](4)比较J
AB
和J
CD
,根据两者中的最小值,从候选集合{c
AB
,V
AB本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法,其特征在于,包括如下步骤:S1、基于2DPCA方法对原始数字图像A
i
进行降维,得到图像的特征矩阵Y
i
,i=1,2,...N,其中A
i
为m
×
n的二维矩阵,N为图像的个数;S2、基于空间投影构造改进一致性准则函数,实施对EOCA算法的改进;S3、将图像A
i
的特征矩阵Y
i
作为EOCA方法的聚类输入,对其实施EOCA聚类,得到分类结果,作为参考模板,i=1,2,...N。S4、利用参考模板,基于最近邻分类法,对任意输入的手写数字图像A

,实现分类识别。2.根据权利要求1一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法,其特征在于,所述步骤S1中采用2DPCA方法对原始图像降维的步骤为:(1)取N个原始训练图像A
i
(i=1,2,...,N),其中A
i
为m
×
n阶二维矩阵;(2)定义图像A
i
的总体散布矩阵G
t
如下:(3)对G
t
进行特征值分解,得到:Λ=U
T
G
t
U其中,Λ=diag(λ1,λ2,...,λ
n
)为特征值对角矩阵,U=[X1,X2,...,X
n
],X
i
为n维列向量,i=1,2,

,n。(4)保存U中的d个Λ=U
T
G
t
U最大特征值对应特征向量,得到最优投影特征矩阵X
opt
=[X1,X2,...,X
d
],其中X1,X2,...,X
d
为特征向量,分别对应特征值λ1,λ2,...,λ
d
。(5)对任意图像样本A
i
,令Y
i
=A
i
X
opt
,得到投影特征向量组Y
i
={Y
1i
,Y
2i
,...,Y
di
},i=1,2,

,N,作为降维后的参考模板,其中Y
li
为m维列向量,是图像A
i
的第l个特征向量,l=1,2,...,d。令Y={Y1,Y2,...,Y
N
},Y即为图像A
i
的特征矩阵。3.根据权利要求1一种基于改进2DPCA-EOCA的鲁棒手写数字识别方法,其特征在于,所述步骤S2中空间投影的步骤为:(1)利用正交投影进行X

Y的空...

【专利技术属性】
技术研发人员:王娜
申请(专利权)人:天津工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1