基于十六值变换的符号识别方法技术

技术编号:6114978 阅读:216 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于十六值变换的符号识别方法,包括如下步骤:(1.1)针对待识别符号的类型,准备该类型所有符号的符号图像(1.2)对每个符号图像,建立背景十六值变换的特征描述,获得代表该符号图像的特征表达,构建该类型符号的特征知识库(2.1)对输入图像进行二值化处理,从中分割出待识别的符号图像(2.2)对符号图像规整化(2.3)对规整化后的符号图像建立背景十六值变换的特征描述,获得代表该符号图像的特征表达(2.4)根据获得的符号图像的特征表达,利用构建的特征知识库,识别出符号。本发明专利技术能有效消除非法符号的干扰,具有特征提取简单、识别率高、识别速度快等特点,大大提高了符号识别技术的可用性。

【技术实现步骤摘要】

本专利技术属于图像数据处理与模式识别方法,具体涉及一种符号识别方法。
技术介绍
符号识别是在各种纸质文档数字化过程中自动识别其上各种印刷体、手写体图符标注的过程。理想的符号识别能正确识别出数字化文档图像上的各种符号标注,并不受各种干扰的影响,从而使更高层的图像理解成为可能。传统的符号识别方法(参见文献张忻中.汉字识别技术.北京清华大学出版社,1992 ;周昌乐.手写汉字的机器识别.北京科学出版社,1997.) 一般有基于神经网络的识别和基于形状分析的识别两大类。神经网络是一种计算智能中的仿生结构算法,它是一类由结点相互连结所组成的计算模型,每一结点通过简单的运算完成从输入到输出的计算,然后这一输出结果通过连接传到其他结点。神经网络模拟了大脑神经系统,结点对应神经元,连接对应神经元传递信号的突触。基于神经网络的识别需要设计网络系统,还需要通过训练样本对其进行训练学习。而基于形状分析的识别提取待识别符号的形状描述特征进行匹配识别,属于统计模式识别的方法。这些传统方法在扫描图像质量好、不同符号之间差异很大而相同符号之间差异很小的情况下可以取得较好的识别效果。但在实际的扫描图像上,往往会有噪声和符号变形等因素的影响。不同应用背景的数字化文档图像中,有的符号是印刷体,有的符号是手写体,即使同一种符号之间可能存在较大形状差异。此外,从图像上分割出来的待识符号中还常常存在许多非法符号会对识别造成干扰。对于这些情况,如果采用传统的方法来识别则会出现时间开销大、算法适用范围窄、抗干扰能力差和识别率不高等缺点。
技术实现思路
本专利技术提出一种,解决现有符号识别方法抗干扰能力差、难以工程实用化的问题;其识别结果用于纸质文档数字化及自动理解,提高符号识别的可用性。,步骤为(1)特征知识库的建立步骤(1. 1)针对待识别符号的类型,准备该类型所有符号的标准符号图像;(1. 2)对于一个符号的图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,形成对其特征的描述;(1. 3)对准备的所有符号图像进行上一步的处理,建立某一类型所有符号的特征描述,即可构建出该类型符号的特征知识库。(2)符号识别步骤(2. 1)对输入图像进行二值化,从中分割出待识别的符号图像;(2. 2)统一尺度的保真规整化,即保持高宽比例将包含待识别符号图像的最小外接矩阵图像进行缩放,使其长边为一定值,并将图像居中填充到以该定值为边长的正方形空白图像中,形成规整化后的符号图像;(2. 3)使用背景十六值变换的特征表达方法,对规整化后的待识别图像的特征进行描述;(2. 4)基于特征知识库和背景区域的特征描述对图符进行识别。本专利技术相对现有技术具有以下优点1.提出了一种基于十六值变换的符号背景描述方法,通过该描述方法获取了图符背景区域的结构特征,该特征描述方法具有抗干扰能力强,能够适应小角度旋转、尺度缩放等特点,同时具有算法简洁、计算复杂度低的特点;2.基于符号背景十六值变换特征描述的符号标注识别方法,能够自动识别数字化图像上的各种印刷体、手写体符号,识别率高,同时具有算法简洁、计算复杂度低、易于工程实现等特点;采用本专利技术,可以快速识别数字化图像上的各种印刷及手写体符号标注,对于图像上的其它特殊符号标注,基于该特征描述方法也可以快速实现自动识别录入。同时该算法时间复杂度和空间复杂度都很低,可用非常低的硬件成本实现。在识别性能、处理速度和性价比等方面均优于现有符号识别系统。附图说明图1是本专利技术的流程图;图2是数值背景表达算法示意图; 图3是数值背景表达结果示意图;图4是待识别的符号示例图;图5是图4中各符号经数值背景表达后典型背景区域的特征值示意图;图6是统一尺度的保真规整化示意图;图7是0 9十个待识别的手写体数字图像及其经数值背景表达后的结果,其中 (a)是0 9十个待识别的手写体数字图像示例,(b)是各数字图像经数值背景表达后典型背景区域的特征值示意图。具体实施例方式为了更加清楚明白的阐述本专利技术的目的、技术方案和优点,下面结合附图及具体实施例对本专利技术作进一步详细的说明。针对传统的识别方法在有符号变形和非法符号干扰等情况下识别效果不理想的问题,本专利技术提出了一种。其基本思想是对二值符号图像 (图符)中的背景像素按照一定规律进行编码得到十六种不同的特征值,以此来反映每个背景像素所处的环境,从而反映图符的结构特征。该识别方法的处理流程如图1所示,首先预估需要识别的符号所属的类型,准备好该类型所有符号的图像,分别进行十六值背景表达,建立各符号与特征表达之间的联系,形成特征知识库,作为识别前的准备。输入一幅扫描的图像,首先作预处理,对图像进行二值化并从中分割出待识别的符号;接着对待识图符进行规整化,保持高宽比例将其规整为符合一定要求的图像;然后对规整化后的图像进行背景十六值数值表达变换,形成图符背景区域的特征值;最后利用知识库进行特征识别,并输出识别结果。图1是处理流程图。一种,包括(1)预估待识别符号的类型,构建包含该类型中所有符号的特征知识库的步骤;(2)基于知识库的符号识别步骤。其中,构建所述特征知识库的步骤具体为(1. 1)针对待识别符号的类型,准备该类型所有符号的符号图像,该符号图像满足(i) 一定尺寸(如64*64像素,与之后识别过程中对输入图像进行规整的尺寸一致)的正方形二值图像;(ii)符号的最小外接矩阵居中且其长边等于正方形图像边长;(iii)图像中的符号形态规整、标准。(1. 2)对于所准备的该类型中一个符号的标准图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,形成对其特征的描述;数值背景表达就是对图像中的背景点进行数值变换,以获取图符背景区域的结构特征。建立背景十六值变换特征的数值背景表达并确定图符的背景区域类型的过程主要分以下两步首先,计算该符号图像背景点的特征值。置背景点的初始特征值为0。数值变换就是对图像进行扫描,对每一个背景点P进行变换。具体做法是从P出发,分别向垂直向上(方向4)、垂直向下(方向2)、水平向左 (方向1)、水平向右(方向3)四个方向引射线,如图2所示。若在方向3上遇到遮挡(即遇到目标像素),则特征值加1 ;若在方向1上遇到遮挡,则特征值加2 ;若在方向2上遇到遮挡,则特征值加4 ;若在方向4上遇到遮挡,则特征值加8,如此形成每个背景点的特征值。所有背景点经过上述变换后,共可能形成C’4° + C14 + C42 + C43 + C = 16种不同的特征值,这16种特征值分别代表该像素所处的不同背景环境。表1列出了背景点所有可能的特征值。图3是一幅待识别符号图像的数值背景表达结果示意图(“*”表示符号的目标像素)。表1背景和区域的特征值及其表达的含义权利要求1.一种,通过图像处理方式对符号进行识别,该方法具体包括如下步骤(1)特征知识库的建立步骤(1.1)针对待识别符号的类型,准备该类型所有符号的符号图像;(1.2)对每个符号图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,获得代表该符号图像的特征表达,建立该类型所有图像符号的特征表达,即可构建出该类型符号的特征知识库;(2)符号识别步骤(2. 1)对输入图像进行二值化处理,从中分割出待识别的符号图像;(2. 2)统一尺度的保真规整化即本文档来自技高网...

【技术保护点】
1.一种基于十六值变换的符号识别方法,通过图像处理方式对符号进行识别,该方法具体包括如下步骤:(1)特征知识库的建立步骤(1.1)针对待识别符号的类型,准备该类型所有符号的符号图像;(1.2)对每个符号图像,建立背景十六值变换的特征表达,确定该图符背景区域的类型,获得代表该符号图像的特征表达,建立该类型所有图像符号的特征表达,即可构建出该类型符号的特征知识库;(2)符号识别步骤(2.1)对输入图像进行二值化处理,从中分割出待识别的符号图像;(2.2)统一尺度的保真规整化:即保持高宽比例一定将包含待识别符号图像的最小外接矩阵图像进行缩放处理,使其长边为一定值,并将该缩放后的图像居中填充到以该定值为边长的正方形空白图像中,形成规整化后的符号图像;(2.3)对规整化后的符号图像,建立背景十六值变换的特征表达,确定规整化后的符号图像背景区域的类型,从而获得代表该符号图像的特征表达;(2.4)根据获得的符号图像的特征表达,利用上述构建的特征知识库,即可识别出待识别符号。

【技术特征摘要】

【专利技术属性】
技术研发人员:明德烈田甜田金文
申请(专利权)人:华中科技大学
类型:发明
国别省市:83

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1