【技术实现步骤摘要】
一种手写体数字识别方法及装置
本申请涉及计算机应用
,特别涉及一种手写体数字识别方法及装置。
技术介绍
目前,手写体数字识别的应用较为广泛,如邮件分拣中的邮政编码识别、财税识别、金融数字识别等应用领域,人们对手写体数字识别的精度与准确度的要求日渐增高。K近邻分类器是一种经典的分类器,由于其计算方便得到广泛应用。但在K近邻分类器中的方案中涉及到的样本点之间的距离测度是预先制定的,因此,这种方案会使得进行手写体数字识别的准确率明显降低。
技术实现思路
本申请所要解决的技术问题是提供一种手写体数字识别方法及装置,用以解决现有技术中K近邻分类器中的距离测度预先制定,使得进行手写体数字识别的准确率降低的技术问题,进一步解决了现有近邻成分分析方案对小样本无法处理的技术问题。本申请提供了一种手写体数字识别方法,包括:分别将第一空间中的训练样本集合和手写体数字的待测样本映射至第二空间中;其中,所述训练样本集合包括至少两个训练样本,每个所述训练样本分别具有一个数字类别标识,所述训练样本集合中的训练样本包含至少两种数字类别;依据所述第二空间中的训练样本集合,确定测度变换矩阵;利用所述测度变换矩阵,分别获取所述待测样本与每个所述训练样本之间的距离值;依据每个所述距离值及其各自对应的数字类别标识,确定所述待测样本的数字类别。上述方法,优选的,所述分别将第一空间中的训练样本集合和测试样本集合映射至第二空间中,包括:利用zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T,将第一空间中的训练样本集合映射至第二空间中;其中,zi为所述第二空间中训练样本集合内的训 ...
【技术保护点】
一种手写体数字识别方法,其特征在于,包括:分别将第一空间中的训练样本集合和手写体数字的待测样本映射至第二空间中;其中,所述训练样本集合包括至少两个训练样本,每个所述训练样本分别具有一个数字类别标识,所述训练样本集合中的训练样本包含至少两种数字类别;依据所述第二空间中的训练样本集合,确定测度变换矩阵;利用所述测度变换矩阵,分别获取所述待测样本与每个所述训练样本之间的距离值;依据每个所述距离值及其各自对应的数字类别标识,确定所述待测样本的数字类别。
【技术特征摘要】
1.一种手写体数字识别方法,其特征在于,包括:分别将第一空间中的训练样本集合和手写体数字的待测样本映射至第二空间中;其中,所述训练样本集合包括至少两个训练样本,每个所述训练样本分别具有一个数字类别标识,所述训练样本集合中的训练样本包含至少两种数字类别;依据所述第二空间中的训练样本集合,使用马氏距离确定测度变换矩阵;利用所述测度变换矩阵,分别获取所述待测样本与每个所述训练样本之间的距离值;依据每个所述距离值及其各自对应的数字类别标识,确定所述待测样本的数字类别;所述依据所述第二空间中的训练样本集合,确定测度变换矩阵,包括:利用获取每个所述训练样本分别与区别于其自身的训练样本之间的近邻概率值;其中,pij为所述第二空间的训练样本集合中训练样本zi与训练样本zj作为近邻样本的概率值;依据每个所述训练样本的近邻概率值,确定每个所述训练样本属于每种所述数字类别的类别概率值;利用d(zi,zj)=(zi-zj)TQ(zi-zj)=(Azi-Azj)T(Azi-Azj)及每个所述训练样本的类别概率值,确定测度变换矩阵;其中,d(zi,zj)为所述第二空间的训练样本集合中训练样本zi与训练样本zj的距离,Q=ATA,A为所述第二空间中的测度变换矩阵。2.根据权利要求1所述的方法,其特征在于,所述分别将第一空间中的训练样本集合和测试样本集合映射至第二空间中,包括:利用zi=Φ(xi)=[k(xi,x1)k(xi,x2)…k(xi,xN)]T,将第一空间中的训练样本集合映射至第二空间中;其中,zi为所述第二空间中训练样本集合内的训练样本,Φ(xi)为预设的映射函数,xi为所述第一空间中训练样本集合中的训练样本,k(xi,xj)为核函数;利用z=Φ(x)=[k(x,x1)k(x,x2)…k(x,xN)]T,将所述第一空间中的测试样本映射至所述第二空间中;其中,x为所述第一空间中的待测样本,k(x,xj)为核函数,z为被映射至所述第二空间中的待测样本。3.根据权利要求1所述的方法,其特征在于,所述利用所述测度变换矩阵,分别获取所述待测样本与每个所述训练样本之间的距离值,包括:利用d(z,zi)=(Az-Azi)T(Az-Azi),i=1,…,N,获取所述待测样本与每个所述训练样本之间的距离值;其中,d(z,zi)为所述待测样本z与所述训练样本zi之间的距离值,A为所述测度变换矩阵,N为所述训练样本集合中训练样本的总个数。4.根据权利要求1、2、或3所述的方法,其特征在于,所述依据每个所述距离值及其各自对应的数字类别标识,确定所述待测样本的数字类别,包括:选取所述距离值小于或等于预设限值的训练样本;依据选取的训练样本的数字类别标识,确定所述待测样本的数字类别。5.一种...
【专利技术属性】
技术研发人员:张莉,丁春涛,仝霄,王邦军,何书萍,李凡长,
申请(专利权)人:苏州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。