System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图像处理,特别涉及一种手写数字分类方法、装置、介质和设备。
技术介绍
1、手写数字分类技术是图像处理和机器学习领域中的一个重要分支,它利用计算机算法对图像中的手写数字进行识别和分类。数字签名是手写体数字识别技术的一个重要应用领域,在金融、法律和商业文档中,数字的合法性验证对于确保文档的完整性和真实性至关重要,通过对手写数字进行分类验证,可以有效地保护个人和企业的合法权益。
2、在现有技术中,cn103093235b,公开了一种基于改进距离核主成分分析的手写体数字识别方法,该方法首先对样本进行二值化预处理,将处理后的样本数据利用距离核映射的核特征空间,在核特征空间利用k均值聚类将训练样本集分为n类子集,然后在核空间中计算核矩阵的特征向量得到变换矩阵,利用变换矩阵进行特征提取,将提取的特征数据集放入支持向量机建立训练模型,最后利用模型预测测试样本的识别率。
3、但是,上述方法在对手写数字图像这种高维、线性不可分数据进行降维的过程中,会造成图像信息的丢失,从而导致对手写数字的识别准确性不高。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种手写数字分类方法、装置、介质和设备。
2、本说明书采用下述技术方案:
3、本说明书提供了一种手写数字分类方法,包括:
4、采集具有类别标签的手写数字图像数据,并将手写数字图像数据映射到线性可分的希尔伯特空间中;
5、在希尔伯特空间中,获得手写数字图像数据的总体特
6、在希尔伯特空间内,通过主成分分析将手写数字数据投影到高方差方向,获得高方差数据;计算高方差数据的协方差矩阵,并将该协方差矩阵进行分解,获得一一对应的投影特征值lj和投影特征向量,所述投影特征值lj用于表征与投影高方差数据对应的投影特征向量方向上的离散程度;
7、使用总体特征值λj替换投影特征值lj,对投影协方差矩阵进行频谱校正,基于频谱校正后的投影协方差矩阵构建频谱校正判别分析函数,使用频谱校正判别分析函数计算待分类的手写数字的类别属性。
8、进一步地,所述具有类别标签的手写数字图像数据的总体协方差矩阵σ为:
9、
10、其中,σ2是用于衡量非spiked特征根大小的待定数值,ip是p*p维的单位矩阵,λj为偏离于分布中心的特征值,称为spiked特征根,vj是其对应的特征向量,vj t是vj的转置;k={1,2},r1表示大spiked特征根的个数,r2表示小spiked特征根的个数。
11、进一步地,所述通过主成分分析将的手写数字数据投影到高方差方向,具体包括:
12、计算希尔伯特空间η中数据的样本均值和样本协方差矩阵sφ:
13、
14、其中,ni表示第i类训练样本的样本个数,为第i类样本的第j个样本;
15、n代表总样本量,是样本投影到希尔伯特空间后的样本;q=[q0,q1],q0是0类样本中心化以后的样本向量;表示在希尔伯特空间中第i类训练样本的样本均值;sφ为样本协方差矩阵;t表示转置;
16、对样本协方差矩阵sφ进行核变换,获得核变换样本矩阵和核变换样本协方差矩阵
17、基于核变换样本协方差矩阵构造投影矩阵使用投影矩阵对原始手写数字数据进行投影。
18、进一步地,所述对样本协方差矩阵sφ进行核变换,获得核变换样本矩阵和核变换样本协方差矩阵具体包括:
19、对样本协方差矩阵sφ谱分解,获得希尔伯特空间中n维基坐标{w1,w2,...,wn};
20、将希尔伯特空间η中的数据投影到n维基坐标{w1,w2,...,wn}上,得到变换后的特征向量y=[y1,y2,...,ym]t;
21、基于变换后的特征向量y=[y1,y2,...,ym]t计算核变换样本矩阵和核变换样本协方差矩阵
22、
23、其中,为变换后的第i类样本的第j个样本,表示样本投影到希尔伯特空间后的样本;分别是基于变换后样本所获得的第0类和第1类的协方差矩阵。
24、进一步地,所述对样本协方差矩阵sφ谱分解,获得希尔伯特空间中n维基坐标{w1,w2,...,wn},具体包括:
25、将样本协方差矩阵sφ进行谱分解,获得:
26、qqt=wdwt
27、w=[w1,w2,…,wn]
28、d=diag[λ1,λ2,…,λn]
29、其中,w1~wn为n个特征向量基底,λ1~λn为特征值;
30、根据qqt=wdwt获得qqtwi=λiwi;
31、在qqtwi=λiwi两边同乘以qt,获得(qtq)qtwi=λiqtwi;
32、令r=qqt,则qtwi是r的特征向量,它与qqt具有相同的特征值;
33、将矩阵r进行谱分解:
34、r=γeγt
35、γ=[γ1,γ2,…,γn]
36、其中,e是单位矩阵,γ1~γn是分解得到的向量;
37、则样本协方差矩阵的特征向量表示为:
38、
39、此时,{w1,w2,...,wn}是希尔伯特空间中n维的基坐标,将映射的样本φ(x)投影到特征向量基底{w1,w2,...,wn}上,得到变换后的特征向量y=[y1,y2,...,ym]t。
40、进一步地,所述基于核变换样本协方差矩阵构造投影矩阵使用投影矩阵对原始手写数字数据进行投影,具体包括:
41、对核变换样本协方差矩阵进行特征分解,获得前k个特征值对应的特征向量;
42、基于与最大特征值所对应的特征向量构造投影矩阵
43、基于前k个特征值对应的特征向量构造投影矩阵
44、将原始手写数字数据与投影矩阵相乘,获得降维后的数据矩阵:
45、
46、其中,是特征向量矩阵,是特征向量对角矩阵,是的逆;
47、是希尔伯特空间中的原始手写数字数据,是由的前k列特征向量所构成的投影矩阵,k的取值由样本维度p和pca降维比例dim来决定,k=floor(p*dim),floor为向下取整,是降维后的数据矩阵。
48、进一步地,所述频谱校正判别分析函数为:
49、
50、其中,y是待分类的手写数字图像,分别是希尔伯特空间中不同类别数字图像的样本均值;是频谱校正后的投影协方差矩阵,π0、π1分别是不同类别数字图像的样本先验概率。
51、一种手写数字分类装置,包括:
52、数据获取模块,用于采集具有类别标签的手写数字图像数据,并将手写数字图像数据映射到线性可分的希尔伯特空间中;
53、校本文档来自技高网...
【技术保护点】
1.一种手写数字分类方法,其特征在于,包括:
2.如权利要求1所述的手写数字分类方法,其特征在于,所述具有类别标签的手写数字图像数据的总体协方差矩阵Σ为:
3.如权利要求2所述的手写数字分类方法,其特征在于,所述通过主成分分析将手写数字数据投影到高方差方向,具体包括:
4.如权利要求3所述的手写数字分类方法,其特征在于,所述对样本协方差矩阵SΦ进行核变换,获得核变换样本矩阵和核变换样本协方差矩阵具体包括:
5.如权利要求4所述的手写数字分类方法,其特征在于,所述对样本协方差矩阵SΦ谱分解,获得希尔伯特空间中n维基坐标{w1,w2,...,wn},具体包括:
6.如权利要求3所述的手写数字分类方法,其特征在于,所述基于核变换样本协方差矩阵构造投影矩阵使用投影矩阵对原始手写数字数据进行投影,具体包括:
7.如权利要求1所述的手写数字分类方法,其特征在于,所述频谱校正判别分析函数为:
8.一种手写数字分类装置,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~7任一所述的方法。
...【技术特征摘要】
1.一种手写数字分类方法,其特征在于,包括:
2.如权利要求1所述的手写数字分类方法,其特征在于,所述具有类别标签的手写数字图像数据的总体协方差矩阵σ为:
3.如权利要求2所述的手写数字分类方法,其特征在于,所述通过主成分分析将手写数字数据投影到高方差方向,具体包括:
4.如权利要求3所述的手写数字分类方法,其特征在于,所述对样本协方差矩阵sφ进行核变换,获得核变换样本矩阵和核变换样本协方差矩阵具体包括:
5.如权利要求4所述的手写数字分类方法,其特征在于,所述对样本协方差矩阵sφ谱分解,获得希尔伯特空间中n维基坐标{w1,w2,...,wn},具体包括:
...
【专利技术属性】
技术研发人员:张晓颖,刘洁,李华,孙全文,陈国良,杨世宏,杨梦茹,
申请(专利权)人:长春大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。