用于识别字符的装置和方法制造方法及图纸

技术编号:2935681 阅读:128 留言:0更新日期:2012-04-11 18:40
一个字符图案是从从文件,列表等中所读取的图象数据中提取的,并且由手写/打印字符辨别单元在手写字符和打印字符间进行辨别。手写/打印字符辨别单元从字符图案中获得N个特征向量,其中特征向量中包括一个至少表示该字符图案的复杂性和线性的特征;并使用所获得的特征向量来识别手写字符和打印字符间的字符图案。一个字符识别单元根据辨别结果,即为手写字符还是打印字符,执行相应的字符识别处理。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】
目前,对外围输入设备的高级字符识别技术的要求很高。本专利技术涉及一种,和一种用于存储字符识别程序的存储介质。尤其是,本专利技术涉及一种,和一种用于存储字符识别程序的存储介质,其中所涉及的装置和方法区别文件中的打印字符和手写字符从而更准确地识别字符。在现有技术中,如果要识别一个包括有手写字符和打印字符的文件,则首先需要执行两个处理,即识别手写字符的处理和识别打印字符的处理。然后,对这两个处理的结果进行比较以获得一个更可靠的识别结果,从而识别文件。上述现有技术中通过执行两个处理(分别识别手写字符和打印字符)并对这两个处理的识别结果进行比较,从而获得更可靠的识别结果。由于现有技术需要花费很长的时间来执行识别处理,因此现有技术中的字符识别还存在不足。本专利技术致力于解决现有技术中的上述问题,其目的在于更准确地识别手写字符和打印字符,并缩短执行字符识别处理所需要的时间。为了解决上述问题,本专利技术对一个图案的特征进行识别,当图案的特征表示该图案为手写字符时,则执行识别手写字符的处理,当图案的特征表示该图案为打印字符时,则执行识别打印字符的处理。因此,甚至当文件包括手写字符和打印字符时,也可通过只执行手写字符识别处理和打印字符识别处理中的一种处理而获得精确的识别结果,从而可以成功地缩短执行字符识别处理所需要的时间,而不会降低字符识别的精确度。根据本专利技术的一个方面,可根据图案的格式或规律性来辨别手写字符或打印字符。由于打印字符在图案形状和排列方面比手写字符更规律,因此可通过检查图案形状和排列的规律性把手写字符与打印字符区别开来,从而缩短执行子处理所需要的时间。附图说明图1为一个根据本专利技术的第一实施例的字符识别装置的结构框图。图2为一个根据本专利技术的第二实施例的字符识别装置的结构框图。图3表示本专利技术所应用的一个系统的结构的示例。图4为一个根据本专利技术的第三实施例的字符识别装置的结构框图。图5表示根据本专利技术的一个实施例的手写/打印字符辨别单元的结构。图6为由手写/打印字符辨别单元执行的处理的流程图。图7表示每个字符类型/集合和特征参数间的关系。图8表示用于辨别手写字符和打印字符的方法。图9表示明朝字体的线宽差异。图10为根据本专利技术的一个实施例的复杂性提取处理的流程图。图11表示提取复杂性(线密度)的处理的概念。图12为根据本专利技术的一个实施例的线性提取处理的流程图。图13表示线性提取处理的概念。图14为根据本专利技术的一个实施例的线宽差异提取处理的流程图。图15表示线宽差异提取处理的概念。图16表示手写字符和打印字符的底线坐标位置的差异,和差异提取处理;和图17为一个字符位置差异的提取处理的流程图。下面将参看附图来描述根据本专利技术的一个实施例的字符识别装置。图1为一个根据本专利技术的第一实施例的字符识别装置的结构框图。图1中,特征识别单元111用于识别从输入图象中所提取的图案的特征。例如,特征识别单元111根据图案的规律性来辨别图案是手写字符还是打印字符。也即,由于打印字符比手写字符更有规律性,因此在图案的规律性比较高时,则特征识别单元111判定该图案为一个打印字符,在图案的规律性比较低时则判定该图案为一个手写字符。由特征识别单元111所识别的图案的特征包括图案的复杂性,图案的线性,图案的线宽差异,图案排列位置的差异,图案倾斜度的差异,图案尺寸的差异等。可根据图案的线密度,黑色象素的密度,欧拉数,轮廓线长度等来识别图案的复杂性。可结合经过辨别分析等处理后所得到的多个特征来识别图案的特征。手写字符识别单元113用于识别手写字符。打印字符识别单元114用于识别打印字符。打印字符可为印刷字符,打字机打印字符,由字处理人员所输入的字符等。字符识别选择单元112根据特征识别单元111的辨别结果选择手写字符识别单元113或打印字符识别单元114。也即,当特征识别单元111判定将要识别的图案为手写字符时,则字符识别选择单元112选择手写字符识别单元113,并通知手写字符识别单元113对将要识别的图案的字符进行识别。当特征识别单元111判定将要识别的图案为打印字符时,则字符识别选择单元112选择打印字符识别单元113,并通知打印字符识别单元113对将要识别的图案的字符进行识别。因此,有可能使用手写字符识别单元113或打印字符识别单元114来实现字符识别处理,从而可缩短执行字符识别处理所需要的时间,而不会降低识别的精确度,甚至在只使用手写字符识别单元113和打印字符识别单元114中的一个来执行字符识别处理的情况下也是如此。图2为一个根据本专利技术的第二实施例的字符识别装置的结构框图。如图2所示,第二实施例解决了上述问题。字符图案提取单元1从文件或列表的图象中提取一个字符图案。然后,复杂性提取单元2a和线性提取单元2b获得第N个特征向量,其中特征向量中至少包括表示字符图案的复杂性和线性的特征。接下来,手写/打印字符辨别单元2f使用上述特征向量来辨别该字符图案是手写字符还是打印字符。根据辨别结果,字符识别单元3执行相应的手写字符识别处理或打印字符识别处理。线密度可作为表示字符图案的复杂性的特征。线宽差异提取单元2c从由字符图案提取单元1所提取的字符图案中提取表示线宽差异的特征量,其中线宽差异是通过移去一定的图案后得到的,其中所移去的图案为其与包括在字符图案中的字符笔画的结束点,交点和角点相距预定距离的图案。然后根据所提取的特征量辨别字符图案是手写字符还是打印字符。根据辨别结果,相应地执行手写字符识别处理或打印字符识别处理。由于打印字符可以明朝字体等字体的形式表示,因此线宽差异提取单元2c可获得每个笔画或每个笔画方向上的线宽差异,其中明朝字体在每个笔画方向上有不同的线宽。字符位置差异提取单元2d用于获得字符位置的差异。当一个字符图案表示字符位置差异很大时,则手写/打印字符辨别单元2f判定该图案为手写字符,并通知手写字符识别单元3a对该图案的字符进行识别。另一方面,当一个字符图案表示字符位置差异很小时,则手写/打印字符辨别单元2f判定该图案为打印字符,并通知打印字符识别单元3b对该图案的字符进行识别。除了字符位置的差异,也可通过检查字符的倾斜度的差异,尺寸的差异等来辨别字符图案是手写字符还是打印字符。在本实施例中,需获得第N个特征向量以在手写字符和打印字符间进行辨别,并识别字符是手写字符还是打印字符,其中特征向量中至少包括表示字符图案的复杂性的特征和表示字符图案的线性的特征。因此,可精确地辨别出手写字符和打印字符,并可在短时间内执行字符识别处理。而且,通过使用线密度作为一个表示字符图案的复杂性的特征,可方便并快速地获得特征量。可通过使用表示线宽差异的特征量来辨别手写字符或打印字符从而获得线宽差异,而不会受到因对明朝字体添加修饰符等所造成的影响,从而可准确地辨别出手写字符或打印字符,其中线宽差异是通过移去一定的图案后得到的,其中所移去的图案为距包括在字符图案中的字符笔画的结束点,交点和角点预定距离的图案。另外,通过获取每个笔画或每个笔画方向上的线宽差异,可以获得线宽差异而不会受到由于明朝字体的笔画方向而造成的线宽的不同的影响,从而可以正确地辨别手写字符或打印字符。图3表示本专利技术所使用的一个系统的结构的例子。图3中,11为同总线10相连的CPU,其中。同总线10相连的本文档来自技高网...

【技术保护点】
一种用于识别一个字符的方法,包括如下步骤: 从文件或列表的图象中提取一个字符图案; 从该字符图案中获得N个特征向量,其中特征向量中包括一个至少表示该字符图案的复杂性和线性的特征;和 使用该特征向量来辨别手写字符和打印字符间的字符图案,并根据辨别结果执行字符识别处理。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:柏冈润二直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1