当前位置: 首页 > 专利查询>株式会社PFU专利>正文

信息处理装置、信息处理方法以及程序制造方法及图纸

技术编号:7843951 阅读:151 留言:0更新日期:2012-10-13 02:17
能高效生成用于OCR软件等的定义信息的信息处理装置、方法及程序。本发明专利技术的信息处理装置包括:区域识别部,针对在图像数据内由规定的表现方式指定的区域,来识别第一区域和第二区域,第一区域是由第一区域指定表现方式指定的区域,第二区域是由与第一区域指定表现方式不同的第二区域指定表现方式指定的区域;位置信息取得部,在图像数据内取得由区域识别部识别出的第一区域的位置信息,作为用于指定成为字符识别对象的区域的位置信息;项目名取得部,取得字符信息来作为项目名,字符信息是通过对由区域识别部识别出的第二区域内存在的字符进行识别而得的信息,项目名是针对由位置信息取得部取得的位置信息所指定的成为字符识别对象的区域的项目名。

【技术实现步骤摘要】

本专利技术涉及信息处理装置、信息处理方法以及程序的技术。
技术介绍
近年来,根据业务改善以及成本消减的观点,在各种业务中正在开展文牍精简化(paperless,无纸化办公)。但在一个方面看来,仍然使用纸的情况还多数存在,例如在交易文件等方面仍然使用纸。以往,为了对这样使用纸的业务的效率进行改善,而使用了OCR (Optical Character Recognition :光学字符识别)软件。为了在这样的OCR软件中指定读取区域等,需要该读取区域等的定义信息。在以下列举的专利文献I以及专利文献2中,公开了与该定义信息相关的技术。 在专利文献I中公开了这样的技术按颜色来扫描图像数据,由此读取与颜色相对应的字符种类。另外,在专利文献2中公开了这样的技术对在由规定色框围起的区域内记载的属性信息进行识别,生成读取项目的属性信息定义体。现有技术文献专利文献专利文献I JP实开平05-008670号公报,专利文献2 JP特开平05-081472号公报。然而,在以往的技术中,用户在制作OCR软件的定义信息时,针对从图像数据中取得的读取区域的位置信息,需要通过手动输入来设定用于表示该读取区域的记载内容的项目名。
技术实现思路
本专利技术正是考虑这样的问题点而做成的,目的在于,提供一种能够高效生成用于OCR软件等的定义信息的技术。本专利技术为了解决上述问题而采用以下的结构。S卩,本专利技术的信息处理装置,其特征在于,包括区域识别部,其用于针对在图像数据内由规定的表现方式指定的区域,来识别第一区域和第二区域,所述第一区域是由第一区域指定表现方式指定的区域,所述第二区域是由与所述第一区域指定表现方式不同的第二区域指定表现方式指定的区域,位置信息取得部,其用于在所述图像数据内取得由所述区域识别部识别出的所述第一区域的位置信息,来作为用于指定成为字符识别对象的区域的位置信息,项目名取得部,其用于取得字符信息来作为项目名,所述字符信息是通过对由所述区域识别部识别出的所述第二区域内存在的字符进行识别而得的信息,所述项目名是针对由所述位置信息取得部取得的所述位置信息所指定的所述成为字符识别对象的区域的项目名。在此,区域指定表现方式是指,用于指定区域的表现方式,例如框、填充图、阴影坐寸ο通过上述结构,识别出图像数据内中的第一区域与第二区域。并且,从第一区域取得用于指定成为字符识别对象的区域的位置信息。另外,从第二区域取得针对该成为字符识别对象的区域的项目名。因此,用户无需通过手动输入来设定与所取得的位置信息相关的针对成为字符识别对象的区域的项目名。因此,通过上述结构,能够高效地生成(制作)用于OCR软件等的定义信息。另外,作为本专利技术的其它方式,本专利技术的信息处理装置还具有用于使所述第一区域与所述第二区域相对应关联的对应关联部, 所述项目名取得部,在被所述对应关联部对应关联的所述第一区域和第二区域中,可以从被对应关联的所述第二区域取得所述字符信息来作为针对特定区域的项目名,所述特定区域是由特定位置信息指定的所述成为字符识别对象的区域,所述特定位置信息是从被对应关联的所述第一区域取得的位置信息。通过上述结构,使得用于指定成为字符识别对象的区域的位置信息与针对该成为字符识别对象的区域的项目名相对应关联。因此,用户无需再进行使所取得的位置信息与项目名相对应关联的处理。因此,通过上述结构,能够高效地生成(制作)用于OCR软件等的定义信息。另外,作为本专利技术的其它实施方式,所述对应关联部可以使所述第一区域与在图像数据上距离所述第一区域最近的所述第二区域相对应关联。另外,作为本专利技术的其它实施方式,所述对应关联部,可以判断所述第一区域的位置与所述第二区域的位置的位置关系是否满足规定条件,使判断为满足规定条件的所述第一区域与所述第二区域相对应关联。另外,作为本专利技术的其它实施方式,所述对应关联部,可以在图像数据内纵向排列的多个第一区域与纵向排列的多个第二区域中,判断为横向排列的一个第一区域与一个第二区域满足所述规定条件。另外,作为本专利技术的其它实施方式,所述对应关联部,可以在图像数据内横向排列的多个第一区域与横向排列的多个第二区域中,判断为纵向排列的一个第一区域与一个第二区域满足所述规定条件。另外,作为本专利技术的其它实施方式,所述对应关联部,可以识别存在于图像数据内的表示所述第一区域与所述第二区域的对应关系的规定的对应关系指示表现方式,基于识别出的该对应关系,使所述第一区域与所述第二区域相对应关联。另外,作为本专利技术的其它实施方式,本专利技术的信息处理装置还可以具有用于生成项目定义信息的项目定义信息生成部,所述项目定义信息包括用于对由所述位置信息取得部取得的所述成为字符识别对象的区域进行指定的所述位置信息,由所述项目名取得部取得的针对由所述位置信息指定的所述成为字符识别对象的区域的所述项目名。此外,作为本专利技术的其它实施方式,可以是用于实现以上各结构的信息处理方法,也可以是程序,也可以是存储了这样的程序的、计算机能够读取的存储介质。另外,作为本专利技术的其它实施方式,也可以是由用于实现以上各结构的多个装置构成的信息处理系统,所述多个装置能够相互通信。通过本专利技术,提供了一种能够高效地生成(制作)用于OCR软件等的定义信息的技术。附图说明图I例示出实施方式的信息处理装置的处理。图2例示出实施方式的信息处理装置的结构。图3是表示实施方式的信息处理装置的处理顺序一例的流程图。图4表示通过实施方式的信息处理装置处理的图像数据的一例。图5表示第一区域与第二区域的扫描顺序的一例。图6表示第一区域与第二区域的对应关联的一例。 图7表示第一区域与第二区域的对应关联的一例。图8表示第一区域与第二区域的对应关联的一例。图9表示第一区域与第二区域的对应关联的一例。图10表示从图4所示的图像数据中取得的项目定义信息的一例。附图标记的说明I信息处理装置,2扫描仪,11存储部,12控制部,13 总线,14输入输出部,31区域识别部,32位置信息取得部,33项目名取得部,34对应关联部,35项目定义信息生成部50、50a、50b、50c 第一区域,60、60a、60b、60c 第二区域,70对应关系指示表现方式(箭头),71对应关系指示表现方式(线段),72a、72b对应关系指示表现方式(标记)。具体实施例方式下面,说明本专利技术的一方面的信息处理装置、信息处理方法以及程序等的实施方式(下面也称为“本实施方式”)。但是,本实施方式是例示,本专利技术并非限于本实施方式的结构。此外,虽然通过自然语言(中文等)来说明本实施方式中出现的数据,但在具体实施中,能够用计算机可识别的模拟语言、指令、参数、机器语言等来指定。§ I信息处理装置利用图I以及图2来说明本实施方式的信息处理装置。< 概要 >图I例示出本实施方式的信息处理装置所执行的处理。本实施方式的信息处理装置对第一区域50和第二区域60进行识别,该第一区域50和第二区域60是在图像数据内根据规定表现方式而指定的区域。第一区域50由第一区域指定表现方式来指定。另一方面,第二区域60由第二区域指定表现方式来指定。即,第一区域50和第二区域60的区域指定表现方式不同。区域指定表现方式是用于指定区域的表现方式,例如,框、填充图(filling)、各种阴影等。在图I所本文档来自技高网...

【技术保护点】

【技术特征摘要】
2011.03.17 JP 2011-0593621.一种信息处理装置,其特征在于,包括 区域识别部,其用于针对在图像数据内利用规定的表现方式来指定的区域,识别第一区域和第二区域,所述第一区域是利用第一区域指定表现方式来指定的区域,所述第二区域是利用与所述第一区域指定表现方式不同的第二区域指定表现方式来指定的区域, 位置信息取得部,其用于在所述图像数据内取得由所述区域识别部识别出的所述第一区域的位置信息,作为用于指定成为字符识别对象的区域的位置信息, 项目名取得部,其用于取得字符信息作为项目名,所述字符信息是通过对由所述区域识别部识别出的所述第二区域内存在的字符进行识别所得到的信息,所述项目名是利用由所述位置信息取得部取得的所述位置信息来指定的所述成为字符识别对象的区域的项目名。2.如权利要求I所述的信息处理装置,其特征在于, 还具有用于使所述第一区域与所述第二区域相对应关联的对应关联部, 所述项目名取得部从所述第二区域取得所述字符信息作为特定区域的项目名,所述特定区域是利用特定位置信息来指定的所述成为字符识别对象的区域,所述特定位置信息是从通过所述对应关联部与该第二区域相对应关联的所述第一区域取得的位置信息。3.如权利要求2所述的信息处理装置,其特征在于, 所述对应关联部使所述第一区域与在图像数据上离所述第一区域最近的所述第二区域相对应关联。4.如权利要求2所述的信息处理装置,其特征在于, 所述对应关联部判断所述第一区域的位置与所述第二区域的位置之间的位置关系是否满足规定条件,并使判断为满足规定条件的所述第一区域与所述第二区域相对应关联。5.如权利要求4所述的信息处理装置,其特征在于, 所述对应关联部,在图像数据内纵向排列的多个第一区域与纵向排列的多个第二区域中,将横向排列的一个第一区域与一个第二区域判断为满足所述规定条件。6.如权利要求4所述的信息处理装置,其特征在于, 所述对应关联部,在图像数据内横向排列的多个第一区域与横向排列的多个第二区域中,将纵向排列的一个第一区域与...

【专利技术属性】
技术研发人员:伊藤修光泽田敬藤塚诚弘毛木达也
申请(专利权)人:株式会社PFU
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1