图象处理方法、装置及其存储介质制造方法及图纸

技术编号:2935849 阅读:168 留言:0更新日期:2012-04-11 18:40
通过自动鉴别并不总是以共同的取向送进的多种图象取向而改善可操作性并通过消除在馈送之前把图象沿着一个共同取向排列或在馈送之后把各个取向校正到一个共同取向的需要而减小操作者的负担的技术。在为取向识别功能指定了自动模式的情况下通过使能其中取向鉴别以及倾斜校正能够在操作者的指令之前进行的模式而改善可操作性。通过判定取向或倾斜识别是否适当并提供判定的结果给操作者而改善处理的准确性。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种输入图象的取向鉴别。近年来,诸如字符识别装置或传真设备的文件数字化装置已经随着计算机技术性能的提高而得到实际的开发。随着这些装置的推广,具体是在商业领域中,对用具有自动文件馈送器(ADF)的扫描器一次将大量文件转换为图象数据的需要持续地增长。因此,从工业的角度看效率是最受注意的。通常,ADF被送进了大量相同尺寸和取向的文件。如果沿着纵向方向和横向方向的文件是混合的,所获得的图象数据将具有不同的取向。如果某些文件有不同尺寸,这些文件可能倾向于在ADF中行进时发生转动,且获得的图象数据可能具有错误的取向。由于传统的字符识别装置或文件装置假定文件是沿着一个共同的取向处理的,操作者在文件被送进这种装置之前是沿着一个共同的取向来排列它们的取向的。另外,为了保证适当的操作,在文件被装置处理之后,操作者必须借助视觉一个一个地在显示器上检查所有文件图象和它们是否具有错误的取向,操作者必须提供一个指令以使其转动一个适当的角度(90°、180°或270°)。因此,一次处理大量的文件可使装置的实用性大大降低,降低操作者的效率和增大操作者的负担。本专利技术的目的,是通过对不总是沿着一个共同的取向送进的多个图象的取向进行自动鉴别,而减小操作者的负担并改善效率。本专利技术的另一个目的,是通过对可能具有不同的取向的多个图象的每一个的取向进行自动鉴别,来减小操作者的负担并改善效率。进一步地,本专利技术的再一个目的,是通过判定自动鉴别的结果是否正常并通知外界其结果,而改善处理的准确性。附图说明图1是根据本专利技术的功能框图。图2是用于显示一个文件图象取向校正部分4和一个校正指令部分6的处理之间的配合的流程图。图3显示了用于文件图象取向校正指令的输入窗口的一个例子。图4显示了根据本专利技术的装置的硬件配置。图5是显示一个校正指令部分的处理的流程图。图6是用于显示当一个取向校正处于自动模式时的流程图。图4显示了根据本专利技术的装置的硬件配置。在图4中,标号401显示了一个中央处理单元(CPU),它通过执行存储在存储器402中的控制程序来控制根据本专利技术的处理。在以下的流程图中显示的步骤也由CPU401来执行。存储器402是由RAM、ROM、以及硬盘组成的存储装置,其中存储有用于CPU 401的控制程序和各种参数、输入图象数据、以及字符识别字典。标号403显示了一种外部存储介质,它能够被装入本装置中和从本装置中取下,诸如光盘、磁盘、磁-光盘、以及磁带。存储在存储器402中的程序和数据从这种外部存储介质读出。处理的结果被提供到外部存储介质403。标号404显示了一种通信I/F,用于通过网络或公共线路与其他终端进行数据通信,和将要存储在存储器402中的数据或处理结果可通过这种通信I/F提供。标号405显示了诸如键盘或指点器的输入装置,它被用来传送操作者的指令。读出图象、启动字符识别、和指定识别处理产生的文本数据的存储目的地的指令是通过输入装置405输入的。标号406显示了一个扫描器,它对文件进行光学读取并向本装置提供电子信号形式的文件图象。标号407显示了诸如CRT或液晶显示器的显示器,它被用来显示处理产生的文本数据并被作为与操作者的界面。标号408显示了一种激光束打印机(LBP)或喷墨打印机,它被用来以所希望的字体打印处理产生的文本数据。图1是根据本专利技术的功能框图。在图1中标号2显示了用于输入文件图象的输入部分,这些图象被从扫描器406或外部存储介质403或通过通信I/F 404从其他终端被送入本装置。标号4显示了一种文件图象取向校正部分,用于校正输入的文件图象的取向;6是一个校正指令部分;8是用于文件图象的一个区域鉴别部分;且10是用于识别字符的一个字符识别部分;它们都可以用CPU 401实现,如以下的流程图所显示的。标号12显示了用于向显示器407、打印机408、或外部存储介质403或通过通信I/F 404向其他终端提供识别结果的输出部分。标号14显示了一种文件图象存储器,它可能由存储器402实现。现在描述根据本专利技术的装置的操作。文件首先通过输入部分2被转换成预定的图象并被存储在文件图象存储器14中,而不论包含文件的介质是什么。所获得的文件图象通过文件图象存储器14被提供给文件图象取向校正部分4,且是否需要校正取决于来自校正指令部分6的指令。如果校正指令部分6未表示校正图象的指令,文件图象取向校正部分4不进行任何校正且随后具有输入取向的图象被提供给区域鉴别部分8。文件图象取向校正部分4和校正指令部分6的操作将在后面得到详细描述。文件图象取向校正部分4进行的图象校正的结果在文件图象存储器14中被累积起来。区域鉴别部分8分析图象,并按照其属性—诸如字符、表格、图、图象和照片—将它分成子区,并按照区的获得或在坐标系中与一个基准位置的距离、属性、尺寸以及位置信息的顺序,向存储器402提供构成分配给区的号的每一个子区的块数据。该块数据被存储在存储器402中。具有被区域鉴别部分8判定为字符区的属性“字符”的子区中的图象数据被传递到字符识别部分10,以进行字符识别。字符识别产生的文本数据被传递到输出部分12并随后通过显示器407输出,或以与文本数据的图形字符码相应的字体由打印机408打印。在文本输出中,原始文件的布局可通过在其中文本数据根据包含在块数据中的该区的位置信息得到识别的字符区内排列适当字体,而得到再现。或者,字符识别产生的文本数据或文本与块数据可被存储在外部存储介质403中,或通过通信I/F而被提供给其他终端。现在详细描述文件图象取向校正部分4和校正指令部分6。图2是流程图,用于显示文件图象取向校正部分4与校正指令部分6的处理之间的配合。步骤S202是输入文件图象取向校正指令的处理,其中操作者用输入装置405指定所希望的模式。在此步骤指定的模式,即文件图象取向是否应该得到自动校正的指令被存储在存储器402中。图3显示了在显示器407上实际显示的指令输入窗口的一个例子。当此窗口上组“转动”中的指令“自动”(300)的复选框被选择时,文件图象取向校正部分4将进行自动取向校正。当用于指令“无”的复选框被选择时,不进行自动取向校正。应该理解的是,选择这样的指令复选框是一种表示图象,以使操作者直观地知道指令是否被选择且该选择可通过把一个鼠标器光标置于指令复选框上并在其上点击鼠标器键而得到实现。对于组“转动”、“黑白”、“倾斜校正”、“插入页”、以及“输入图象”中的每一个,只能选择一个复选框,且如果在一个组中的一个复选框已经如上所述地得到选择,该组中的其他复选框就不能得到选择,即与这些复选框联系的指令不能得到选择。各组中选定的指令被存储在存储器402中,作为与该组数据相联系的标记数据。这种标记数据将在鼠标键每次被点击时得到更新。即使为组“转动”已经选择了指令“自动”,指令“自动”在选择任何其他的指令“无”、“90°CW”、“180°”以及“90°CCW”时都应该被撤消选定。在图3显示的指令输入窗口上选定的所有指令都作为输入图象的设定数据而被存储在存储器402中。步骤S204是实际输入一个文件的处理,其中读取文件的指令被发给扫描器的驱动器(如果采用了的话),或从文件读取的文件数据被转换成一个预定的图象,且在两种情况下,文件数据都以一种扩展的形式本文档来自技高网...

【技术保护点】
一种图象处理方法,包括以下步骤: 鉴别多个输入图象中每一个的各个图象取向; 根据所述识别的取向校正各个图象;以及 识别包含在所述校正图象中的字符。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:金田北洋金津知俊
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1