【技术实现步骤摘要】
本专利技术涉及一种基于集成学习算法Bagging和单类SVM的,属于计算机图像处理和字符识别
技术介绍
随着中国经济的快速发展,越来越多的外国人热衷到中国,汉语逐渐成为热门语言。然而,如何写汉字成为重要而又困难的事情。随着计算机及网络的发展与普及,很多对外汉语专业的教师希望能通过文档扫描的方式,利用模式识别技术来自动评估和指导外国学生的汉字书写。现有多种手写字符分类和识别技术。对于手写字符鉴别,目前大部分技术专注于在线手写字符鉴别和签名验证。这些手写字符鉴别和验证技术根据特征提取方法可以分为两大类基于变形的方法和基于结构的方法。但关注一般意义上的手写字符鉴别的研究较少,其原因主要包括手写字符鉴别本身是个很困难的任务;手写字符鉴别需要很多细节而琐碎的技术,比如要处理许多非常相似的结构、笔画和书写风格等;另外,一般意义上的手写字符识别总是要应对大类别数的问题,尤其是汉字。因此手写汉字鉴别面临巨大挑战。
技术实现思路
本专利技术所要解决的技术问题是,提供一种可对手写汉字进行自动评估和指导、汉字识别准确率高的。本专利技术包括以下步骤a,将手写汉字样本正规化处理大小 ...
【技术保护点】
1.一种计算机鉴别手写汉字的方法,其特征是:包括以下步骤,a.将手写汉字样本正规化处理大小为64*64;b.提取手写汉字样本的加权方向码直方图WDCH特征;c.采用PCA主元分析方法进行特征降维;d.采用Bootstrp方法抽取T个训练样本集S’;即每个训练样本集S’都是从初始训练集S中有放回地随机选取N个训练样本来组成,其中可以有重复样本,并且保证每个训练样本集的样本替换率为50%,各个训练集之间相互独立;e.选择单类SVM及相应RBF核进行手写汉字鉴别;用上述T个训练样本集S’分别独立训练生成T个单类SVM分类器Ci,其中T个分类器可以并行训练生成;对于单类SVM,正样 ...
【技术特征摘要】
1.一种计算机鉴别手写汉字的方法,其特征是包括以下步骤,a.将手写汉字样本正规化处理大小为64*64;b.提取手写汉字样本的加权方向码直方图WDCH特征;c.采用PCA主元分析方法进行特征降维;d.采用Bootstrp方法抽取T个训练样本集S’;即每个训练样本集S’都是从初始训练集S中有放回地随机选取N个训练样本来组成,其中可以有重复样本,并且保证每个训练样本集的样本替换率为50%,各个训练集之间相互独立;e.选择单类SVM及相应RBF核进行手写汉字鉴别;用上述T个训练样本集S’分别独立训练生成T个单类SVM分类器Ci,其中T个分类器可以并行训练生成;对于单类SVM,正样本集X = Ix1, x2,. . .,%},N为样...
【专利技术属性】
技术研发人员:殷绪成,
申请(专利权)人:江苏奥博洋信息技术有限公司,
类型:发明
国别省市:32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。