文字识别装置制造方法及图纸

技术编号:2935979 阅读:117 留言:0更新日期:2012-04-11 18:40
即使仅根据文字信息就能正确地识别文字,也需要输入文字属性信息,反之,如不输入文字属性信息,仅根据文字信息不能正确识别文字时,则无法改善识别能力。识别装置22根据输入装置21输入的书写信息进行文字识别,将识别结果存储在识别结果存储装置23中,并在识别结果显示装置24中显示,识别结果限定装置28根据选择输入装置27选择输入的文字属性信息,从在23中存储的识别结果中。对在24中显示的识别结果进行限定,实现文字识别。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及识别输入文字的文字识别装置,特别是涉及对书写信息加上文字属性信息进行文字识别的文字识别装置。现有技术1图28是特开平5-20300号公报(文书处理装置)中公开的以前的文字识别装置的结构的框图。这个文字识别装置是利用文字的文字属性信息进行文字识别,在读取名片时,如果背面有英文表示,对这个信息一起读取。在图中,1为读取名片的表面图象和背面图象的读取装置,2为根据这个读取装置1读取的表面图象和背面图象,识别名片的表面文字和背面文字的识别装置。3为对这个识别装置识别的背面文字是否是英文表示进行判定的判定装置,4为当这个判定装置判定出是英文表示时,将表面文字和背面文字分类成住所、姓名、电话号码等的各个住址名簿记录数据的分类装置。5为将这个分类装置分类的表面文字和背面文字的各个住址名簿数据分别予以比较,选择与表面文字的表示一致的背面文字的表示的选择装置,6是根据这个选择装置选择的背面文字的表示,生成与该表示相对应的标注假名的生成装置。7是将这个生成装置6生成的标注假名与和这个标注假名相对应的表面文字的表示相关联并存储的存储装置。下面说明其工作过程。首先,由读取装置1读取名片的表面图象和背面图象。由识别装置2识别读取图象上的表面文字和背面文字,由判定装置3判定该背面文字是否是英语表示。判定结果如是英语表示,由分类装置4将该表面文字和背面文字按住址、姓名、电话号码等各住址名簿数据分类。选择装置5将这个分类的表面文字和背面文字的各个住址名簿数据分别予以比较,选择与表面文字的表示一致的背面文字的表示。此时,表面文字的识别结果的表示与背面文字的表示不一致时,选择装置5在识别表面文字时与存储的后面的候选进行比较,选择最一致的部分。此后,生成装置6根据选择的背面文字的表示,生成与此表示相对应的标注假名,将生成的标注假名与和标注假名相对应的表面文字的表示相关联并存储在存储装置7中。现有技术2图29是特公平3-19589号公报(光学文字读取装置)公开的表示以前的文字识别装置的结构的框图。这个文字识别装置也是利用文字的文字属性信息进行文字识别,对于汉字部分的识别结果及假名部分的识别结果,利用单词信息提高准确度。在图中,11是扫描票单,将该票单上记录的汉字及标注假名的假名文字进行光电变换,并输出各量化图象(二进制信号构成的文字图象)的扫描部。12是根据这个扫描部11输出的量化图象,以字符为单位对票单上的汉字及标注假名的假名文字进行识别处理的文字识别部。13是预先分别存储汉字及片假名文字的以单词为单位的识别用表(辞典),根据文字识别部输出的汉字及片假名文字的各个识别结果(以文字为单位)识别由各自的文字构成的各个单词的单词识别部。14是控制部,对该单词识别部13输出的汉字及片假名文字的各单词单位的识别结果进行检查,该检查结果若各单词单位的识别结果相互对应,此识别结果作为最终结果输出。另外,这个控制部14还控制扫描部11、文字识别部12及单词识别部13的各个动作。下面说明其工作过程。图30是输入的票单的一个例子的说明图,在这个票单上,如图所示,设有记录汉字15的汉字区域15a和记录该汉字15的标注假名用的片假名文字(以下称片假名)16的标注假名区域16a。首先,由扫描部11对图30所示票单进行扫描,该票单上的汉字区域15a中记录的汉字15和,标注假名区域16a中记录的片假名16,分别被变换成量化图象送到文字识别部12。文字识别部12根据从扫描部11来的各量化图象对汉字15及片假名16进行以字符为单位的识别处理。图31表示该文字识别部12的识别结果的说明图,图中,17是片假名16的识别结果,18是汉字15的识别结果。在片假名16的识别结果17中,第1个文字和第2个文字分别限定成有一个候选文字和,第3个文字有和2个候选文字。同样地,在汉字15的识别结果18中,第2个文字限定成有1个候选文字,第1个文字有和2个文字的候选文字。这样,文字识别部12识别的以字符为单位的各个识别结果,按顺序输出到单词识别部13。单词识别部13首先根据得到的以字符为单位的各个识别结果(通常各文字存在多个候选文字),将它们予以组合制成候选单词。即,从片假名16的识别结果17制成2个候选单词和,从汉字15的识别结果18制成和2个候选单词。然后单词识别部13检查这样制成的各候选单词在单词单位的识别用表中是否存在,存在的候选单词作为单词识别部13的识别结果输出。图32是表示单词识别部13使用的单词单位的识别用表的内容的一个例子的说明图,这个单词单位的识别用表分为片假名区域19和汉字表示区域20。单词识别部13检查各候选单词在该单词单位的识别用表中是否存在。即将片假名单词与片假名区域19中的单词,汉字单词与汉字表示区域20中的单词分别比较。在此例中,片假名区域19中的和汉字表示区域20中的和作为候选单词输出到控制部14。控制部14对从单词识别部13输出的作为识别结果的候选单词进行检查,只将图32所示的单词单位的识别用表的同一行中存在的候选单词作为最终结果输出。在这个例子中,与片假名区域19中的同一行的汉字表示区域20中,对应的单词只有,所以它作为最终结果输出。专利技术要解决的课题如现有技术1及现有技术2所示,利用文字属性信息进行文字识别的文字识别装置具有以上的结构,因此通过读取装置1和扫描部11读取名片上印刷的文字和票单上用笔记录的文字,同时读取文字属性信息(标注假名),故存在着即使只用文字信息就可以正确识别时,也要输入文字属性信息,反之,没有输入文字属性信息时,只用文字信息无法正确识别的问题。另外,因为现有技术1及现有技术2的文字识别装置对文字属性信息也进行识别处理,当不能正确识别文字属性信息时,即使能正确识别文字信息,也不能得到识别结果。在现有技术2的文字识别装置中,文字属性信息是用手书写的,此时,需要对汉字及标注假名两者都书写,存在着书写量大,给书写者增加负担的问题。现有技术2的文字识别装置是利用单词信息,需要对构成单词的文字和标注假名都书写,存在着不书写时不能利用单词信息,无法实现单词识别的问题。当现有技术1和现有技术2应用于在图形输入板上用笔书写文字,并进行实时识别的联机文字识别装置时,因为在很多情况下,该联机文字识别装置没有物理键盘,更会增加输入文字属性信息的负担。本专利技术的目的是得到一种能解决上述问题,即使在没有物理键盘的联机的文字识别装置中,也能容易地利用文字属性信息的文字识别装置。本专利技术的另一个目的是得到一种在进行文字识别后,只有当文字识别结果不正确时,通过输入文字属性信息,由此能改善文字识别结果的文字识别装置。本专利技术的另一个目的是得到一种利用文字属性信息,减轻文字识别处理的计算量的同时,提高文字识别的准确度的文字识别装置。本专利技术的另一个目的是得到一种当书写构成单词的文字的一部分,根据一部分信息输出候选单词时,利用文字属性信息减少候选单词数量的文字识别装置。本专利技术的另一个目的是得到一种在书写单词进行单词识别后,只当单词识别结果不正确时,才输入文字属性信息,从而改善单词识别结果的文字识别装置。技术方案本专利技术的文字识别装置,由识别装置在输入装置输入的书写信息的基础上进行识别文字,将识别结果存储在识别结果存储装置,并在识别结果显示装置中显示本文档来自技高网...

【技术保护点】
一种文字识别装置,其特征在于,它包括:输入文字的书写信息的输入装置;根据所述输入装置输出的书写信息识别文字,并将该识别结果输出的识别装置;存储所述识别装置输出的识别结果的识别结果存储装置;对所述识别结果存储装置中存储的识别结果进行显示的识别结果显示装置;收存文字的文字属性信息的文字属性辞典;对所述文字属性信息进行显示的文字属性显示装置;对在文字属性显示装置中显示的文字属性信息进行选择的选择输入装置;根据所述选择输入装置选择输入的文字属性信息,从在所述识别结果存储装置中存储的识别结果中,对在所述识别结果显示装置中显示的识别结果进行限定的识别结果限定装置。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:川又武典宫原景泰
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1