由字符图象直方图0-1图形表示识别字符的方法和装置制造方法及图纸

技术编号:2936635 阅读:243 留言:0更新日期:2012-04-11 18:40
从输入的文件图象中提取预定的识别单元,根据所提取的识别单元制备直方图。通过用预先制备的各个识别目标类别的0-1图形表示,对由制备的每个识别单元的直方图中提取的0-1图形表示进行部分地校核,并检索和识别单元相符的识别目标类别的候选物。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于识别纸上的字符图象的字符识别方法和装置。字符识别装置适用于形成电子文件或数据库、文件处理、自动翻译、以及大容量的印刷文件处理的信息处理装置,并已进行了广泛的研究的研制。用来识别纸上印刷的或手写的字符图象的常规的字符识别系统一般包括(1)文件图象输入处理,(2)字符提取处理,(3)预处理(平滑、标准化、细线变换等),(4)特征提取处理,(5)大分类处理,(6)细分类处理,(7)记入(Post)处理等。在这种字符识别系统中,纸上的字符图象作为光学图象被读取,并把光图象转变为电信号。读进系统中的字符图象例如根据边缘分布的直方图被提取进入识别单元,例如字符单元中。然后,被提取的字符经过预处理,以便有效地识别,在特征得取处理中,输入字符的特征,如拓朴特征、在被分成网格图形的象素单元中的特征等被提取,从而用结构分析法图形匹配法等进行识别处理。大分类处理专门用于例如具有大量字符种类的汉字字符,并用简单方法限制或缩小候选物。在细分类处理中,对经过限制的候选物进行更仔细地识别处理。而且,在记入处理中,当候选物不能借助于各个输入字符的识别处理被确定时,相邻的输入字符被连接,并参考适当的语法作为字符串判别。常规字符识别系统具有如下问题。在字符提取处理中,当有几个离散的字符连续地出现时,易于发生提取错误。这是决定字符识别精度的主要因素之一。作为有效的解决这一问题的措施,已知有一种用于改进和识别精度有关的字符提取方法。然而,这方法需要长的识别时间。在特征提取处理中,被规格化成预定大小的字符图象在象素(位)单元中被扫描,字符的特征量(通过数字表示特征获得的)考虑扫描象素和其相邻的象素之间的关系被提取。这种特征量表示每个字符的整个的或全部的特征,但并不总是揭示出每个字符的突出的特征。因此,特征量容易受噪声的影响。在常规的大分类或细分类中所用的字符识别中,进行图形匹配(距离计算)以便测量用特征量表示的未知的输入字符和字典中的标准图形的总体相似度,并按照较小的距离选择合适数量的候选类型。在这种常规的方法中,因为距离是分类的唯一标准,而使每个字符的突出的结构特征在分类过程中不能灵活地利用。为此,在常规的方法中,未知的输入图形必须和所有字符类型的标准图形进行比较。例如,当字符类型数量为5000时,就需要5000次距离计算。这一缺点是高速字符识别的严重障碍。而且,在这种字符识别处理中,难于检查分类或识别结果的有效性,因为识别错误的检查和校正操作被委托给记入处理,例如用大词典校对。这缺点也严重地阻碍了而速处理。在另一方向,日本专利申请分开NOS.63—15383(图形校正装置),63—118993(字符识别方法),以及63—131287(字符识别系统)试图通过实现高速大分类来实现高速处理,所采用的方法与距离计算无关,并只对少数的受限制的候选字符类型进行距离计算。然而,在这些方法中,因为字符图象被扫描,并借助于检查在象素单元(一点)中的相邻象素的方法来提取特征工作为基本手段,因而所提取的特征容易受噪声影响,并且,要使用这种特征量来限制候选字符类型并具有高的精度是相当困难的。如上所述,常规的字符识别方法和装置在抗噪声能力识别速度以及识别精度方面不能付诸满意地应用,这是由于所用的识别处理的性质决定的。本专利技术是考虑上述情况作出的,其目的是提供一种字符识别的方法和装置,借助于同时改善抗噪能力、识别速度和识别精度来改善其实用性。通过字符图象的直方图,借助于有效地利用与字符结构有关的信息,可以实现极高速的且只有极高的精度的字符识别。更具体地说,按照本专利技术的字符识别装置包括提取装置,用来从输入文件图象中提取预定的识别单元;直方图制备装置,用来根据每个提取的识别单元制备直方图;以及大分类装置,用来检索和识别单元一致的识别目标类别的候选物,通过部分地核对从由识别单元制备的直方图中提取的0—1图形表示和预先制备的识别目标类别的0—1图形表示完成所述检索。大分类装置最好预先制备识别目标类别的直方图,代替预先制备识别目标类别的0—1图形表示,并在检索时由各个识别目标类别的直方图来制备0—1图形表示。该装置最好还包括细分类装置,用来检查检索的识别目标种类的候选的有效性。细分类装置最好根据对从制备的识别单元的直方图中提取的0—1图形表示和与检索的识别类别的候选物相符的预先制备的识别目标类别的0—1图形表示之间的部分地核对的结果,检查所述有效性。该装置最好还包括优先权确定装置,用来确定识别目标类别的检索的候选物的优先权。该装置最好还包括优先权确定装置,用来确定识别目标类别的被检查的候选物的优先权。优先权确定装置最好根据对基于制备的识别单元的直方图所制备的矢量图形表示和与检索的识别目标类别的候选物相应的预先制备的识别目标类别的矢量图形表示之间的距离的计算结果确定所述优选权。识别单元最好与一个字符相符。在另一方向,按照本专利技术的字符识别方法包括从输入文件图象中提取预定识别单元的提取步骤;由每一个提取的识别单元制备直方图的直方图制备步骤;以及大分类步骤,用于对从制备的每个识别单元的直方图中提取的0—1图形表示用预先制备的识别目标类别的0—1图形表示进行校核,并检索和识别单元相符的识别目标类别的候选物。大分类步骤最好包括在检索时由预先制备的识别目标类别的直方图来制备0—1图形表示的步骤,代替使用预先制备的识别目标类别的0—1图形表示。本方法最好还包括细分类步骤,用来检查检索的识别目标类别的候选物的有效性。所述细分类步骤最好包括根据对从识别单元的制备的直方图中提取的0—1图形表示和与识别目标类别的检索的候选物相符的识别目标类别的预先制备的0—1图形表示之间的部分核对结果进行检查所述有效性的步骤。本方法最好还包括确定检索的识别目标类别的优先权的优先权确定步骤。所述优先权确定步骤最与包括根据对基于制备的识别单元的直方图制备的矢量图形表示和预先制备识别目标类别的矢量图形表示中和检索的识别目标类别的候选物相符的那些矢量图形表示之间的距离计算结果确定优先权的步骤。识别单元最好相应于一个字符。本专利技术注意到这样的事实,即垂直和水平线段之间的尺寸和位置关系直接地反映在垂直的和水平方向的直方图的结构中,还注意到,钭线段之间的尺寸和位置关系反映在两个方向即±45°方向的直方图中,这样,按照本专利技术,通过利用直方图的0—1图形表示,可充分吸收噪声的影响,并且每个字符的结构信息可被有效地利用。更具体地说,按照本专利技术,输入文件图象被提取进入预定的识别单元即字符单元中,根据所提取的识别单元,制备例如垂直和水平方向的直方图。从所制备的每个识别单元的直方图中提取的0—1图形表示,用预先制备的识别目标类别的0—1图形表示进行校核,从而检索和识别单元相符的识别目标类别的候选物,从而限制类别候选物(例如字符候选物)的数量。结果,识别目标类别的一个或几个候选物作为识别结果(或作为大分类结果)被输出。本专利技术只需要简单的操作,例如比较/判别,计数等,而不需要任何复杂的图象处理,例如根据图形匹配方法的距离计算,规格化、细—线(thin—line)变换,以及在现有技术中的字符图象的处理。在本专利技术中,简单的处理,即制备直方图是唯一的图象处理。用这种方式,通过用较小的计算量用标准图形校核未知的输入本文档来自技高网...

【技术保护点】
一种字符识别装置,包括:提取装置(4),用来从输入的文件图象中提取预定的识别单元;直方图制备装置(10),用来由所提取的识别单元制备直方图;0-1图形表示字典存储装置(12),用来存储各个识别目标类别的0-1图形表示;以及识 别装置(6),用来对由制备的每个识别单元的直方图中提取的0-1图形表示用存储在所述0-1图形字典存储器中的0-1图形表示进行核对,并输出符合于识别单元的识别目标类别的候选物。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:木村正行
申请(专利权)人:北陆先端科学技术大学院大学长
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1