基于十六值变换的符号识别方法技术

技术编号：6114978 阅读：216 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于十六值变换的符号识别方法，包括如下步骤：（1.1）针对待识别符号的类型，准备该类型所有符号的符号图像（1.2）对每个符号图像，建立背景十六值变换的特征描述，获得代表该符号图像的特征表达，构建该类型符号的特征知识库（2.1）对输入图像进行二值化处理，从中分割出待识别的符号图像（2.2）对符号图像规整化（2.3）对规整化后的符号图像建立背景十六值变换的特征描述，获得代表该符号图像的特征表达（2.4）根据获得的符号图像的特征表达，利用构建的特征知识库，识别出符号。本发明专利技术能有效消除非法符号的干扰，具有特征提取简单、识别率高、识别速度快等特点，大大提高了符号识别技术的可用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像数据处理与模式识别方法，具体涉及一种符号识别方法。
技术介绍
符号识别是在各种纸质文档数字化过程中自动识别其上各种印刷体、手写体图符标注的过程。理想的符号识别能正确识别出数字化文档图像上的各种符号标注，并不受各种干扰的影响，从而使更高层的图像理解成为可能。传统的符号识别方法(参见文献张忻中.汉字识别技术.北京清华大学出版社，1992 ；周昌乐.手写汉字的机器识别.北京科学出版社，1997.) 一般有基于神经网络的识别和基于形状分析的识别两大类。神经网络是一种计算智能中的仿生结构算法，它是一类由结点相互连结所组成的计算模型，每一结点通过简单的运算完成从输入到输出的计算，然后这一输出结果通过连接传到其他结点。神经网络模拟了大脑神经系统，结点对应神经元，连接对应神经元传递信号的突触。基于神经网络的识别需要设计网络系统，还需要通过训练样本对其进行训练学习。而基于形状分析的识别提取待识别符号的形状描述特征进行匹配识别，属于统计模式识别的方法。这些传统方法在扫描图像质量好、不同符号之间差异很大而相同符号之间差异很小的情况下可以取得较好的识别效果。但在实际的扫描图像上，往往会有噪声和符号变形等因素的影响。不同应用背景的数字化文档图像中，有的符号是印刷体，有的符号是手写体，即使同一种符号之间可能存在较大形状差异。此外，从图像上分割出来的待识符号中还常常存在许多非法符号会对识别造成干扰。对于这些情况，如果采用传统的方法来识别则会出现时间开销大、算法适用范围窄、抗干扰能力差和识别率不高等缺点。
技术实现思路
本专利技术提出一种，解决现有符号识别方法抗干扰能力...

【技术保护点】
１．一种基于十六值变换的符号识别方法，通过图像处理方式对符号进行识别，该方法具体包括如下步骤：（１）特征知识库的建立步骤（１．１）针对待识别符号的类型，准备该类型所有符号的符号图像；（１．２）对每个符号图像，建立背景十六值变换的特征表达，确定该图符背景区域的类型，获得代表该符号图像的特征表达，建立该类型所有图像符号的特征表达，即可构建出该类型符号的特征知识库；（２）符号识别步骤（２．１）对输入图像进行二值化处理，从中分割出待识别的符号图像；（２．２）统一尺度的保真规整化：即保持高宽比例一定将包含待识别符号图像的最小外接矩阵图像进行缩放处理，使其长边为一定值，并将该缩放后的图像居中填充到以该定值为边长的正方形空白图像中，形成规整化后的符号图像；（２．３）对规整化后的符号图像，建立背景十六值变换的特征表达，确定规整化后的符号图像背景区域的类型，从而获得代表该符号图像的特征表达；（２．４）根据获得的符号图像的特征表达，利用上述构建的特征知识库，即可识别出待识别符号。

【技术特征摘要】

【专利技术属性】
技术研发人员：明德烈，田甜，田金文，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：83

全部详细技术资料下载我是这个专利的主人