一种非标准字体的汉字自动符识别方法技术

技术编号：16500971 阅读：46 留言：0更新日期：2017-11-04 11:44

本发明专利技术提出了一种非标准字体的汉字自动符识别方法，采用如下步骤：步序1：基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数，通过重构图像实现滤除噪声、处理边缘柔化；步序2：利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用；步序3：将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中，经行识别。本发明专利技术的技术方案解决了复杂环境下欢子存在的角度倾斜、光照不良、噪声干扰、边缘模糊、污损遮挡等情况下的非标准字体的汉字识别问题。

A non standard font automatic character recognition method Chinese characters

The invention provides a non standard font character recognition method Chinese characters automatically, by using the following steps: Step 1: sparse encoding to obtain image recognition Chinese characters base vectors and sparse coefficients based on, by processing the soft edge filter out noise, image reconstruction; step 2: using the gradient direction histogram to extract the complex plane the environment gradient feature recognition and edge Chinese characters in order to reduce the negative influence of Chinese characters recognition; step 3: non standard input font will get to the recognition of the Chinese characters edge gradient feature to Chinese characters classifier, the recognition. The technical scheme of the present invention solves the problem of non standard font Chinese character recognition under the condition of complex environment, such as tilt angle, poor illumination, noise interference, edge blur, stain and occlusion, etc. of Fandy.

全部详细技术资料下载

【技术实现步骤摘要】
一种非标准字体的汉字自动符识别方法
本专利技术涉及汉字识别领域，涉及汉字分类器的训练，属于一种非标准字体的汉字自动符识别方法。
技术介绍
文字识别在当下方兴未艾的物联网领域有着越来越高的使用需求，比如在输入法、车牌识别、税票识别和文献录入等实际用途中有着极高的实用化需求，正确定位和识别这些文字对于基于内容的内容检索和信息过滤有着重要的意义。目前已经有不少的相关技术已经投入到商业使用中，并且有些已经产生了较好的经济效益。但是，绝大部分文字识别技术都限制于某些特定的场景，比如智能识别印刷体汉字。根据实际应用的场景不同，目前主流的汉字识别算法主要分为两大类，即基于汉字笔画跟踪的方法和基于汉字图片的方法。目前基于汉字笔画跟踪的方法主要使用在中文输入设备上，比如手机的手写输入。然而，更多的实际应用环境下的非标准字体汉字的识别并不适用该方法进行识别，因此基于图片的汉字识别更适用于复杂环境下的非标准字体的汉字识别。具体而言，待提取文字的图像可以分为文档图像、场景图像和原生数字图像三大类，其中后两者更适用与复杂环境下的非标准字体汉字的识别。场景图像是指用摄像头拍摄到的图像，场景中的文字信息也会作为场景的一部分被拍摄到场景图像中，因此场景图像中的文字一般会淹没在复杂的背景环境中，同时可能会存在角度偏斜，光照不良以及无损缺失等情况；原生数字图像则是计算机按照一定的算法以数字形式保存的图像信息，为了便于在网络上传播，因此一般无法避免低分辨率的情况，且通常存在压缩损失和边缘柔化不良的问题。复杂条件下图像文字提取系统的结构如图1所示，包括文本定位，文字分割和文字识别三大部分，其中文...
一种非标准字体的汉字自动符识别方法

【技术保护点】
一种非标准字体的汉字自动符识别方法，其特征在于，包括以下步骤：步序1：基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数，通过重构图像实现滤除噪声、处理边缘柔化；步序2：利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用；步序3：将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中，经行识别。

【技术特征摘要】
1.一种非标准字体的汉字自动符识别方法，其特征在于，包括以下步骤：步序1：基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数，通过重构图像实现滤除噪声、处理边缘柔化；步序2：利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用；步序3：将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中，经行识别。2.根据权利要求1所述的一种非标准字体的汉字自动符识别方法，其特征在于，步序1利用稀疏编码得到的基向量和稀疏系数是通过多次训练得到的，在训练阶段，需要对目标函数进行优化求解：式中，X＝(x1,x2,x3,…,xn)表示训练集中的n幅包含汉字的图像减去各自的平均灰度值后得到的m个k维向量的训练数据集，其中k为每幅图像的像素数量，同样的B＝(b1,b2,b3,…,bn)表示经稀疏编码计算得到的n个k维稀疏系数向量；S表示稀疏系数矩阵，每一列的Si为一副图像的n维稀疏系数向量。β表示一个用来平衡重构误差和稀疏性的常数，Φ(Sij)表示非线性的稀疏惩罚函数，因此惩罚函数可以表示为：该目标函数为优化目标，原理是基于整个图像求得所有的基向量B和对应的稀疏系数S。3.根据权利要求2所述的一种非标准字体的汉字的识别方法，其特征在于，所述的1中重新构建图像的方法是根据基向量B对任意的一个待识别汉字的图像I中求取它的稀疏系数，然后再根据Inew(x,y)＝BS+t进行重构得到复原图像Inew，上式中t为图像I的平均灰度值。4.根据权利要求1所述的一种非标准字体的汉字的识别方...

【专利技术属性】
技术研发人员：顾亦熹，高沁瑶，高兰英，高留其，
申请(专利权)人：昆山遥矽微电子科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人