一种用于手写汉字识别的图像特征提取方法技术

技术编号:4325252 阅读:342 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种用于手写汉字识别的图像特征提取方法,将手写汉字图像切分成一系列稳定的特征提取区域,再通过尺度不变性特征变换算法对这些区域进行特征提取。本发明专利技术克服了直接应用SIFT特征点定位无法提取有效的适应不同书写风格的尺度不变特征的问题,结合手写汉字图像的特点,应用弹性网格技术与SIFT特征,设计出基于二次局部弹性区域的SIFT特征的手写汉字特征提取方法。

【技术实现步骤摘要】

本专利技术属于模式识别与人工智能
,特别是涉及一种手写汉字图像 识别处理方法。
技术介绍
一个手写汉字识别系统分为预处理、特征提取、分类识别和后处理四个模 块,其中特征提取被认为是汉字识别中一个关键的步骤之一,对整个系统的最 终性能有着重要的影响。近年来,很多学者在如何获取有效的特征方面做了很多研究工作,取得了很多优秀的成果。Gabor特征是各种汉字特征中的一种较 为有效的特征,它应用的背后有着很好的生物视觉理论支持。事实上,模式识 别与计算机视觉和生物视觉理论在一直以来都有着紧密的联系。随着计算机视觉与生物视觉理论的发展,-最近有越来越多先进的图像特征 提取算法被提出。其中,David G. Lowe2004年发表在International Journal of Computer Vision的论文Distinctive Image Features from Scale-Invariant Keypoints提出的尺度不变性特征变换算法(Scale Invariant Feature Transform,简称SIFT)被认为是最有代表性的特征提取算法之一,受到了计 算机视觉领域广泛的关注。SIFT整套算法包括定位特征点与对特征区域提取特 征向量两部分,提取出来的特征向量一般被称为SIFT描述子(SIFT descriptor). SIFT特征已经被广泛应用于图像配准、图像检测、目标识别等 领域,并且有着出色的表现。但是,在汉字识别领域,特别是手写汉字识别领域,SIFT特征却无法成功的应用,这是因为自由书写汉字由于个人风格的差异, 即使是同一个字的图形也有很大差别,同时还有加上笔画形变,噪声点等问题让这种差异性变得更大。因此,SIFT特征点定位方法对脱机手写汉字识别是不适合的,需要寻找更合适的特征定位策略。 _
技术实现思路
本专利技术的目的是为了克服直接应用SIFT特征点定位无法提取有效的适应不同书写风格的尺度不变特征的问题,结合手写汉字图像的特点,应用弹性网格技术与SIFT特征,设计出基于二次局部弹性区域的SIFT特征的手写汉字特 征提取方法。为了实现专利技术目的,本专利技术采用的技术方案为 ,将手写汉字图像切分成一系列稳定的特征提取区域,再通 过尺度不变性特征变换算法对这些区域进行特征提取。具体包括如下几个主要步骤 (1)、先水平后垂直弹性切分手写汉字图像成局部子图像块; (2 )、对子图像块提取SIFT描述子特征;(3) 、先垂直后水平再次切分手写汉字图像成局部图像块,重复(2);(4) 、拼接所有局部图像块SIFT特征形成最终特征向量。所述步骤(1)弹性切分脱机手写汉字图像成子图像块的过程是通过先对汉字图像在水平方向上非均匀弹性划分3个长方形,划分的原则是让每个长方形内具有相等的汉字像素,然后在垂直方向上在各个长方形图块内部进行非均匀弹性切分,使得每个长方形图块均切分出3个彼此间汉字像素相等的小长 方形图块,最终得到9块子图像块。所述步骤(2)通过对图像块提取SIFT描述子特征过程是通过先将切分 出的图块大小进行线性归一化,然后对每块图块区域提取SIFT描述子特征,提取中使用的SIFT描述子参数为切分区域数目为2X2、统计方向为8,于 是每块图块获得的特征向量维数为32。所述步骤(2)提及的SIFT描述子特征通过在局部区域计算所有像素的梯 度向量,然后用以区域中心为中心的二维高斯函数对所有梯度向量的幅值进行 加权,接着把局部区域规则切分为7VAW的子区域,在每个子区域上统计D个 方向的梯度方向直方图,计算每个梯度方向累加值可形成一个种子点,每个种 子点有8个方向的向量信息,最后组合各种子点形成输出的特征。具体做法是 第一步在特征提取区域使用S0BEL算子计算该区域内每个像素点的梯度的幅值 和方向,第二步使用中心位于特征提取区域的中心二维高斯函数 6邓[-( +/)/2一]与特征提取区域中每个像素的梯度幅值进行相乘(式中o 二0.75X区域宽度),第三步在特征区域内规则切分出iVX7V个子区域(图4中 N=2),每个区域的中心赋予一,个称为种子点的梯度方向直方图统计向量(统计 方向共八个,彼此间隔为45度),第四步统计区域的梯度方向直方图,具体过 程为,若某个像素点梯度方向落在某一个统计方向的附近,则其相应的梯度幅 值就累加在这个方向上,累加过程中,像素梯度幅值经过三线性插值后一一累 加到毗连的各直方图块中,第五步将SIFT描述子向量进行归一化。所述步骤(3)使用的切分方法为通过先对汉字图像在垂直方向上进行弹 性划分为3个长方形,划分的原则是让每个长方形内具有相等的汉字像素,然 后再在水平方向上以相同的方法对每个长方形进行切分,切成3个彼此间汉字 像素相等的图块,获取另外9块子图像块。所述步骤(4)拼接所有图块特征形成最终特征向量通过将步骤(2)、 (3)获取的18个图块特征进行顺序拼接,获得一个576 (18X32)维特征向量,接 着对这个向量中每一个元素进行/4的变换,变换后的特征向量为最终输出的 特征向量。与SIFT特征不同,本专利技术在特征定位上,使用了寻找稳定的特征区域的 特征定位策略。弹性局部区域SIFT汉字特征提取方法使用了弹性切分方法, 将汉字图像切分成一系列稳定的特征提取区域,再对这些区域提取了有效的尺 度不变方向特征。本专利技术与已有的汉字特征提取方法相比,具有如下的优点和有益效果(1) 、本专利技术中应用的SIFT描述子是一种基于生物视觉原理构造的特征, 大量实验证明其对图像仿射变换,3D视点变换和非刚性变形具有优秀的鲁棒 性;(2) 、使用弹性切分方法,能把汉字图像切分成一系列稳定的特征区域, 对这些区域进行大小归一化后提取的一系列SIFT描述子特征拼捧组成了具有 良好性能的特征;(3) 、对汉字图像整体提取SIFT描述子,在提取过程中,把原来无视图 像内容的规则划分改进为能适应不同手写风格的弹性网格划分有效改进了识别 性能;(4) 、本专利技术的两种特征提取方法在脱机汉字识别中具有良好的有效性 在数据库使用国家863计划采集到的HCL2000手写汉字样本数据库,随机挑选 500套样本进行训练,200不重复的样本进行测试,分类器使用改进二次判决函 数(MQDF)分类器,测试结果表明本专利技术的弹性局部区域尺度不变方向特征提取方法获取的特征首选字识别率是96.061%,前10个候选字的识别率为 99.639%。附图说明图1是本专利技术的弹性局部区域SIFT汉字特征提取方法的流程框图; 图2是本专利技术采用的汉字识别系统的结构框图; 图3是SIFT描述子特征的提取流程框图; 图4是SIFT描述子的提取示意图。具体实施例方式本专利技术的弹性局部区域SIFT汉字特征提取方法的流程图如附图1所示, 具体为先将输入的汉字图像进行两种不同的弹性切分,获取一共18个不同的图 像区域(图块),然后把这些图块线性归一化为统一大小,再对它们提取SIFT 描述子特征,最后把所有描述子特征顺序拼接成最终的特征向量。本专利技术的弹性局部区域SIFT汉字特征提取过程中应用到的SIFT描述子特 征的提取流程图如附图2,其构造示意图如附图3,具体为第一步在特征提取区 域使用SOBEL算子计算该区域内每个像素点的梯度的幅值和方向,如图本文档来自技高网
...

【技术保护点】
一种用于手写汉字识别的图像特征提取方法,其特征在于将手写汉字图像切分成一系列稳定的特征提取区域,再通过尺度不变性特征变换算法对这些区域进行特征提取。

【技术特征摘要】
1、一种用于手写汉字识别的图像特征提取方法,其特征在于将手写汉字图像切分成一系列稳定的特征提取区域,再通过尺度不变性特征变换算法对这些区域进行特征提取。2、 根据权利要求1所述的用于手写汉字识别的图像特征提取方法,其特征在于包括如下步骤-(1) 、首次切分手写汉字图像成局部图像块;(2) 、对子图像块提取尺度不变性特征变换描述子特征;(3) 、再次切分手写汉字图像成局部图像块,重复步骤(2);(4) 、拼接所有局部图像块尺度不变性特征变换描述子特征,形成最终特 征向量。3、 根据权利要求2所述的用于手写汉字识别的图像特征提取方法,其特 征在于所述步骤(1)的切分方法为先水平后垂直弹性切分,具体先对汉字图像 在水平方向上非均匀弹性划分3个长方形,使每个长方形内具有相等的汉字像 素,然后在垂直方向上在各个长方形图块内部进行非均匀弹性切分,使得每个 长方形图块均切分出3个彼此间汉字像素相等的小长方形图块,最终得到9块 子图像块。4、 根据权利要求2所述的用于手写汉字识别的图像特征提取方法,其特 征在于所述步骤(2)对局部图像块提取尺度不变性特征变换描述子特征过程是: 先将切分出的局部图像块大小进行线性归一化,然后对每个局部图像块区域提 取尺度不变性特征变换描述子特征,提取中使用的尺度不变性特征变换描述子 参数为切分区域数目为2X2、统计方向为8,于是每个局部图像块获得的特征向量维数为32。5、 根据权利要求2或4所述的用于手写汉字识别的图像特征提取方法,其 特征在于所述步骤(2)提及的尺度不变性特征变换描述子特征通过在局部图像块区域计算所有像素的梯度向量,然后用以区域中心为中心的二维高斯函数对 所有梯度向量的幅值进行加权,接着把局部区域规则切分为多个子区域,在每 个...

【专利技术属性】
技术研发人员:金连文张志毅丁凯
申请(专利权)人:华南理工大学
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1