一种非标准字体的汉字自动符识别方法技术

技术编号:16500971 阅读:46 留言:0更新日期:2017-11-04 11:44
本发明专利技术提出了一种非标准字体的汉字自动符识别方法,采用如下步骤:步序1:基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数,通过重构图像实现滤除噪声、处理边缘柔化;步序2:利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用;步序3:将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中,经行识别。本发明专利技术的技术方案解决了复杂环境下欢子存在的角度倾斜、光照不良、噪声干扰、边缘模糊、污损遮挡等情况下的非标准字体的汉字识别问题。

A non standard font automatic character recognition method Chinese characters

The invention provides a non standard font character recognition method Chinese characters automatically, by using the following steps: Step 1: sparse encoding to obtain image recognition Chinese characters base vectors and sparse coefficients based on, by processing the soft edge filter out noise, image reconstruction; step 2: using the gradient direction histogram to extract the complex plane the environment gradient feature recognition and edge Chinese characters in order to reduce the negative influence of Chinese characters recognition; step 3: non standard input font will get to the recognition of the Chinese characters edge gradient feature to Chinese characters classifier, the recognition. The technical scheme of the present invention solves the problem of non standard font Chinese character recognition under the condition of complex environment, such as tilt angle, poor illumination, noise interference, edge blur, stain and occlusion, etc. of Fandy.

【技术实现步骤摘要】
一种非标准字体的汉字自动符识别方法
本专利技术涉及汉字识别领域,涉及汉字分类器的训练,属于一种非标准字体的汉字自动符识别方法。
技术介绍
文字识别在当下方兴未艾的物联网领域有着越来越高的使用需求,比如在输入法、车牌识别、税票识别和文献录入等实际用途中有着极高的实用化需求,正确定位和识别这些文字对于基于内容的内容检索和信息过滤有着重要的意义。目前已经有不少的相关技术已经投入到商业使用中,并且有些已经产生了较好的经济效益。但是,绝大部分文字识别技术都限制于某些特定的场景,比如智能识别印刷体汉字。根据实际应用的场景不同,目前主流的汉字识别算法主要分为两大类,即基于汉字笔画跟踪的方法和基于汉字图片的方法。目前基于汉字笔画跟踪的方法主要使用在中文输入设备上,比如手机的手写输入。然而,更多的实际应用环境下的非标准字体汉字的识别并不适用该方法进行识别,因此基于图片的汉字识别更适用于复杂环境下的非标准字体的汉字识别。具体而言,待提取文字的图像可以分为文档图像、场景图像和原生数字图像三大类,其中后两者更适用与复杂环境下的非标准字体汉字的识别。场景图像是指用摄像头拍摄到的图像,场景中的文字信息也会作为场景的一部分被拍摄到场景图像中,因此场景图像中的文字一般会淹没在复杂的背景环境中,同时可能会存在角度偏斜,光照不良以及无损缺失等情况;原生数字图像则是计算机按照一定的算法以数字形式保存的图像信息,为了便于在网络上传播,因此一般无法避免低分辨率的情况,且通常存在压缩损失和边缘柔化不良的问题。复杂条件下图像文字提取系统的结构如图1所示,包括文本定位,文字分割和文字识别三大部分,其中文字识别是最为复杂,也是需求最为迫切的一项技术。
技术实现思路
针对现有非标准字体汉字识别技术的不足,本专利技术提出了一种非标准字体的汉字自动符识别方法。本专利技术的技术方案解决了复杂环境下欢子存在的角度倾斜、光照不良、噪声干扰、边缘模糊、污损遮挡等情况下的非标准字体的汉字识别问题。为了解决上述技术问题,本专利技术采用如下技术方案:一种非标准字体的汉字自动符识别方法,其特征在于,包括以下步骤:步序1:基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数,通过重构图像实现滤除噪声、处理边缘柔化;步序2:利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用;步序3:将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中,经行识别。前述的一种非标准字体的汉字自动符识别方法,其特征在于,步序1利用稀疏编码得到的基向量和稀疏系数是通过多次训练得到的,在训练阶段,需要对目标函数进行优化求解:minf(B,S)=[重构误差]+β[稀疏惩罚因子]式中,X=(x1,x2,x3,…,xn)表示训练集中的n幅包含汉字的图像减去各自的平均灰度值后得到的m个k维向量的训练数据集,其中k为每幅图像的像素数量,同样的B=(b1,b2,b3,…,bn)表示经稀疏编码计算得到的n个k维稀疏系数向量;S表示稀疏系数矩阵,每一列的Si为一副图像的n维稀疏系数向量;β表示一个用来平衡重构误差和稀疏性的常数,Φ(Sij)表示非线性的稀疏惩罚函数,因此惩罚函数可以表示为:该目标函数为优化目标,原理是基于整个图像求得所有的基向量B和对应的稀疏系数S。前述的一种非标准字体的汉字的识别方法,其特征在于,所述的1中重新构建图像的方法是根据基向量B对任意的一个待识别汉字的图像I中求取它的稀疏系数,然后再根据Inew(x,y)=BS+t进行重构得到复原图像Inew,上式中t为图像I的平均灰度值。前述的一种非标准字体的汉字的识别方法,其特征在于,步序2需要在步骤1中构建的复原图像上提取梯度方向直方图的特征,具体为:(a)需要计算点(x,y)的梯度幅值G(x,y)和方向θ(x,y),具体的计算公式如下,其中GX(x,y),GY(x,y)分别表示该位移点在水平方向和垂直方向上的梯度幅度,相邻位移点的计算方法如下:Gx(x,y)=I(x+1,y)-I(x-1,y)Gy(x,y)=I(x,y+1)-I(x,y-1)(b)在每一个块内基于单元格平面统计直方图,对于该单元格内每一个像素点的权值的确定,需要根据其梯度幅度值采用高斯加权统计得到梯度方向所属的直方图分组;(c)通过滑动检测窗口扫描图像,直到将检测窗口中的所有检测块的特征向量依次地连接起来,重新在系统中构建起待识别非标准字体汉字的边缘梯度特征。前述的一种非标准字体的汉字的识别方法,其特征在于,所述的检测块内的单元格平面统计直方图,对于同一块内所有单元格的特征向量均采用L2-Hys归一化方式进行归一化处理,即它可以通过先进行L2-norm,对结果进行截短,然后再重新归一化得到。前述的一种非标准字体的汉字的识别方法,其特征在于,步序2中的所述负面作用包括字体倾斜、光照不均、部分遮挡。前述的一种非标准字体的汉字的识别方法,其特征在于,步序3中所述的汉字分类器为ILDA分类器,具体是先进行分类训练,完成训练后方可实现汉字的识别。本专利技术的有益效果是:本专利技术的原理简单清晰,通过采用稀疏编码和梯度方向上的平面直方图相结合的方式,实现了在复杂环境中的非标准字体汉字的自动化识别功能。特别是对于汉字处于光照强度不一、受噪声干扰和边缘柔化存在差异甚至是部分遭到遮挡时都有较强的识别准确率,解决了在复杂环境下,非标准字体汉字的机器自动化识别的难题,大幅提高了汉字识别速度和准确率,为物联网和互联网+的实际应用提供了一条新的思路。附图说明下面结合附图和具体实施方式对本专利技术作进一步描述:图1是本专利技术的示意图。具体实施方式下面结合附图对本专利技术作进一步描述:一种非标准字体的汉字自动符识别方法,其特征在于,包括以下步骤:步序1.基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数,通过重构图像实现滤除噪声、处理边缘柔化;从理想条件下的数学角度分析,稀疏编码是对图像数据进行线性分解后得到基向量和稀疏系数的过程。建立稀疏编码模型后,对于每一个输入图像,只有少数的几个基函数会有较大的响应输出,能够消除数据之间的高阶相关冗余,因此可以用在图像特征提取和过滤噪声等方面,本步序是基于稀疏编码用以除去图像信息中的噪声。在训练阶段,需要对目标函数进行优化求解:minf(B,S)=[重构误差]+β[稀疏惩罚因子]式中,X=(x1,x2,x3,…,xn)表示训练集中的n幅包含汉字的图像减去各自的平均灰度值后得到的m个k维向量的训练数据集,其中k为每幅图像的像素数量,同样的B=(b1,b2,b3,…,bn)表示经稀疏编码计算得到的n个k维稀疏系数向量;S表示稀疏系数矩阵,每一列的Si为一副图像的n维稀疏系数向量。β表示一个用来平衡重构误差和稀疏性的常数,Φ(Sij)表示非线性的稀疏惩罚函数,反映了图像编码的稀疏程度,因此惩罚函数可以表示为:根据优化目标,基于整幅汉字图像求取所有的基向量B和对应的稀疏系数S。要求所有的输入图像各向同性地分布在基向量上,并且所有基向量上的稀疏系数的分布概率也是相同的。通过系数编码的处理,可以发现重构后的非标准字体汉字图像与重构后的训练图像表现出了更强的相似性,噪声和边缘柔化问题因此得到了很好地处理,因此从算法上保证了文字识别系统对这两种一台情况的鲁棒性本文档来自技高网
...
一种非标准字体的汉字自动符识别方法

【技术保护点】
一种非标准字体的汉字自动符识别方法,其特征在于,包括以下步骤:步序1:基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数,通过重构图像实现滤除噪声、处理边缘柔化;步序2:利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用;步序3:将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中,经行识别。

【技术特征摘要】
1.一种非标准字体的汉字自动符识别方法,其特征在于,包括以下步骤:步序1:基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数,通过重构图像实现滤除噪声、处理边缘柔化;步序2:利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用;步序3:将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中,经行识别。2.根据权利要求1所述的一种非标准字体的汉字自动符识别方法,其特征在于,步序1利用稀疏编码得到的基向量和稀疏系数是通过多次训练得到的,在训练阶段,需要对目标函数进行优化求解:式中,X=(x1,x2,x3,…,xn)表示训练集中的n幅包含汉字的图像减去各自的平均灰度值后得到的m个k维向量的训练数据集,其中k为每幅图像的像素数量,同样的B=(b1,b2,b3,…,bn)表示经稀疏编码计算得到的n个k维稀疏系数向量;S表示稀疏系数矩阵,每一列的Si为一副图像的n维稀疏系数向量。β表示一个用来平衡重构误差和稀疏性的常数,Φ(Sij)表示非线性的稀疏惩罚函数,因此惩罚函数可以表示为:该目标函数为优化目标,原理是基于整个图像求得所有的基向量B和对应的稀疏系数S。3.根据权利要求2所述的一种非标准字体的汉字的识别方法,其特征在于,所述的1中重新构建图像的方法是根据基向量B对任意的一个待识别汉字的图像I中求取它的稀疏系数,然后再根据Inew(x,y)=BS+t进行重构得到复原图像Inew,上式中t为图像I的平均灰度值。4.根据权利要求1所述的一种非标准字体的汉字的识别方...

【专利技术属性】
技术研发人员:顾亦熹高沁瑶高兰英高留其
申请(专利权)人:昆山遥矽微电子科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1