信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法制造方法及图纸

技术编号:17212131 阅读:27 留言:0更新日期:2018-02-07 23:15
本发明专利技术提供信息提取装置、图像形成装置、信息提取装置的控制方法。信息提取装置包括存储部、图像读取装置以及控制部。基于参照原稿(参照图像数据)中的上色区域的颜色,控制部将上色区域分类成第一上色区域和第二上色区域。存储部存储包含第一上色区域的特征图像数据和表示从特征图像数据到第二上色区域的距离和方向的位置数据。控制部根据比较图像数据中的与特征图像数据匹配的区域的位置和位置数据规定提取区域。控制部使从提取区域提取的提取信息存储于存储部。

An information extraction device, an image forming device with an information extraction device, and a control method for an information extraction device

The invention provides a control method for an information extraction device, an image forming device, and an information extraction device. The information extraction device includes a storage unit, an image reading device, and a control unit. Based on the color of the color region in the reference manuscript (referring to the image data), the control department classifications the color region into the first color region and the second color region. The storage unit stores the feature image data including the first color region and the location data representing the distance and direction from the feature image data to the second color region. The control department specifies the extraction area according to the location and location data of the region that matches the feature image data in the comparison image data. The control unit stores the extraction information extracted from the extraction area in the storage section.

【技术实现步骤摘要】
信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法
本专利技术涉及从图像数据中提取信息的装置以及该装置的控制方法。
技术介绍
有时会事先录入好资料的格式(文档格式)。然后,从包含录入格式的图像数据中提取信息。例如,从通过扫描资料(原稿)而获得的图像数据中提取信息。有时在提取信息前,会判定通过扫描而获得的图像数据是否与录入格式一致。已知有以下那样的与基于格式的信息的提取相关的技术的一例。具体来说,已知有一种系统,该系统参照存储的格式数据对多个单元按照某种规则配置的文本的布局进行解析,并存储存在于各单元的信息的类型和规定了单元间的邻接关系的格式数据,提取文本的图像数据,求出来自图像数据的多个单元的提取和单元间的邻接关系,并将文本的单元间的邻接关系与格式数据规定的单元间的邻接关系进行比较,特定文本的单元中的对应的格式数据规定的单元并特定文本中的信息的配置,按照所特定的信息的配置来识别包含于文本的信息。在账簿那样的资料中记录有信息。例如记录有姓名、住所、电话号码。如果能从资料的图像数据中自动提取期望的信息进行数据化,则很方便。不需要输入者一边看资料一边通过键盘手动输入信息。另外,有时也会在资料中设置有回答栏。回答栏是回答者的选项的填写栏。例如,回答栏包括复选框、被圆环绕的记号。填写者点击符合的框。或者,用圆环绕符合的记号。如果能自动提取在回答栏中进行选择的信息(什么样的记号被填写在哪个位置),则也可以不对每张资料都确认选择的回答。以往,要自动提取资料的信息,需要预先录入信息提取区域的位置。例如,在信息处理装置中录入资料的格式定义用的图像数据中的提取信息的区域(信息提取区域)的位置。例如,在PC中阅览格式的图像数据。然后,使用者使用指示设备(例如鼠标)规定矩形区域。这样,规定出信息提取区域。正常情况下,在格式的录入、信息提取区域的设定操作中使用PC。另外,因为设定的信息提取区域的偏移,有时无法准确地获取信息。因此,有时要能够细致地调整(设定)信息提取区域的大小、位置。但是,存在操作越细则信息提取区域的设定操作越容易变难的问题。在上述的公知技术中,用一个格式数据来识别单元的大小不同但邻接关系相同的文本。但是,前提是在PC中使用。另外,没有设定提取信息的区域的功能。因此,在上述的公知的技术中,无法解决上述的问题。
技术实现思路
(一)要解决的技术问题本专利技术就是鉴于上述问题点而完成的,其能够不使用PC而容易地设定提取信息的区域。(二)技术方案本专利技术的第一方面的信息提取装置包括存储部、图像读取装置以及控制部。所述存储部存储数据。所述图像读取装置读取原稿并生成所述原稿的图像数据。所述控制部对所述图像读取装置通过读取参照原稿而获得的参照图像数据中的作为被上色的区域的上色区域进行识别。所述控制部基于所述上色区域的颜色将所述上色区域分类成第一上色区域和第二上色区域。所述控制部使所述参照图像数据中的包含所述第一上色区域的特征图像数据存储于所述存储部。所述控制部使表示从所述特征图像数据到所述第二上色区域的距离和方向的位置数据存储于所述存储部。所述控制部判定读取所述参照原稿后的所述图像读取装置通过读取比较原稿而获得的比较图像数据内是否包含与所述特征图像数据匹配的区域。在判定为包含时,所述控制部根据所述比较图像数据内的与所述特征图像数据匹配的区域的位置以及基于所述位置数据的距离和方向规定提取区域。所述控制部将包含于所述提取区域的信息作为提取信息提取。所述控制部使所述提取信息存储于所述存储部。在判定为未包含时,所述控制部不规定所述提取区域且不提取所述提取信息。本专利技术的第二方面的图像形成装置包括上述的信息提取装置。本专利技术的第三方面的信息提取装置的控制方法,存储数据,读取原稿并生成所述原稿的图像数据,对通过读取参照原稿而获得的参照图像数据中的作为被上色的区域的上色区域进行识别,基于所述上色区域的颜色将所述上色区域分类成第一上色区域和第二上色区域,存储所述参照图像数据中的包含所述第一上色区域的特征图像数据,存储表示从所述特征图像数据到所述第二上色区域的距离和方向的位置数据,判定读取所述参照原稿后通过读取比较原稿而获得的比较图像数据内是否包含与所述特征图像数据匹配的区域,在判定为包含时,根据所述比较图像数据内的与所述特征图像数据匹配的区域的位置以及基于所述位置数据的距离和方向规定提取区域,将包含于所述提取区域的信息作为提取信息提取,并存储所述提取信息,在判定为未包含时,不规定所述提取区域且不提取所述提取信息。(三)有益效果根据这些信息提取装置、图像形成装置、信息提取装置的控制方法,能够仅在为了在特定发送方式下发送图像数据而进行表读入时自动地使图像形成装置成为连续读入模式。由此,在特定发送方式下的发送中,能够消除只发送一页图像数据的误发送。另外,能够提高图像形成装置的使用性。本专利技术的进一步的特征、优点通过以下所示的实施方式更加明确。附图说明图1是表示实施方式的多功能一体机的一例的图。图2是表示在实施方式的信息提取装置中读取参照原稿的流程的一例的流程图。图3是表示实施方式的参照原稿的一例的图。图4是表示实施方式的信息提取模式设定画面的一例的图。图5是表示在实施方式的信息提取装置中读取比较原稿的流程的一例的流程图。具体实施方式本专利技术能够不使用PC而容易地设定提取信息的区域。以下使用图1~图5来说明本专利技术的信息提取装置1。对包含信息提取装置1的图像形成装置进行说明。作为图像形成装置举出多功能一体机100为例进行说明。但是,在本实施方式中记录的结构、配置等各要素并不限定专利技术的范围,仅是说明例而已。(多功能一体机100的概要)首先,使用图1来说明实施方式的多功能一体机100。多功能一体机100包括控制部2和存储部3。控制部2对装置整体的动作进行综合控制。控制部2对多功能一体机100的各部进行控制。控制部2包括CPU21、图像处理部22、匹配处理部23以及OCR处理部24。CPU21进行与控制相关的运算。图像处理部22对图像数据实施任务所需要的图像处理。匹配处理部23对特征图像数据D2与比较图像数据D4进行比较。匹配处理部23判定与特征图像数据D2匹配的区域(类似度达到阈值以上的区域)是否包含于比较图像数据D4中。OCR处理部24进行对图像数据的OCR处理。OCR处理部24从图像数据中提取文本数据。存储部3包括ROM、RAM、HDD那样的存储装置。存储部3存储控制用程序、各种数据。控制部2与图像读取装置4能够通信地连接。图像读取装置4包括原稿传递部4a、图像读取部4b。原稿传递部4a向读取位置传递设置好的原稿。图像读取部4b是包括光源、图像传感器的扫描器单元。图像读取部4b读取原稿传递部4a传递的原稿。另外,图像读取部4b读取设置于原稿台(接触玻璃)上的原稿。然后,图像读取部4b生成图像数据。图像读取部4b能够进行彩色模式的读取。控制部2对原稿传递部4a和图像读取部4b的动作进行控制。操作面板5包括显示面板51(相当于消息输出部)、触控面板52以及硬键53。控制部2对显示面板51的显示进行控制。控制部2使设定用画面显示于显示面板51。控制部使操作图像显示于显示面板51。操作图像例如是软键。基于触控面板52的输出,控制部2识别触控的操作本文档来自技高网
...
信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法

【技术保护点】
一种信息提取装置,其包括:存储部,其存储数据;图像读取装置,其读取原稿,并生成所述原稿的图像数据;以及控制部,其对所述图像读取装置通过读取参照原稿而获得的参照图像数据中的作为被上色的区域的上色区域进行识别,并基于所述上色区域的颜色将所述上色区域分类成第一上色区域和第二上色区域,使所述参照图像数据中的包含所述第一上色区域的特征图像数据存储于所述存储部,使表示从所述特征图像数据到所述第二上色区域的距离和方向的位置数据存储于所述存储部,并判定读取所述参照原稿后的所述图像读取装置通过读取比较原稿而获得的比较图像数据内是否包含与所述特征图像数据匹配的区域,在判定为包含时,根据所述比较图像数据内的与所述特征图像数据匹配的区域的位置以及基于所述位置数据的距离和方向规定提取区域,并将包含于所述提取区域的信息作为提取信息提取,使所述提取信息存储于所述存储部,在判定为未包含时,不规定所述提取区域且不提取所述提取信息。

【技术特征摘要】
2016.07.28 JP 2016-1480951.一种信息提取装置,其包括:存储部,其存储数据;图像读取装置,其读取原稿,并生成所述原稿的图像数据;以及控制部,其对所述图像读取装置通过读取参照原稿而获得的参照图像数据中的作为被上色的区域的上色区域进行识别,并基于所述上色区域的颜色将所述上色区域分类成第一上色区域和第二上色区域,使所述参照图像数据中的包含所述第一上色区域的特征图像数据存储于所述存储部,使表示从所述特征图像数据到所述第二上色区域的距离和方向的位置数据存储于所述存储部,并判定读取所述参照原稿后的所述图像读取装置通过读取比较原稿而获得的比较图像数据内是否包含与所述特征图像数据匹配的区域,在判定为包含时,根据所述比较图像数据内的与所述特征图像数据匹配的区域的位置以及基于所述位置数据的距离和方向规定提取区域,并将包含于所述提取区域的信息作为提取信息提取,使所述提取信息存储于所述存储部,在判定为未包含时,不规定所述提取区域且不提取所述提取信息。2.根据权利要求1所述的信息提取装置,其特征在于,所述信息提取装置包括消息输出部,当读取所述参照原稿后,每读取一次所述比较原稿,所述信息输出部输出表示所述提取信息是否已被提取的消息。3.根据权利要求1或2所述的信息提取装置,其特征在于,所述控制部使所述提取区域的图像数据和对所述提取区域的图像数据进行OCR处理而获得的文本数据的任意一方或者双方作为所述提取信息存储于所述存储部。4.根据权利要求1或2所述的信息提取装置,其特征在于,所述控制部将与所述第二上色区域相同大小或者比所述第二上色区域大的区域规定为所述提取区域。5.根据权利要求1或2所述的信息提取装置,其特征在于,所述控制部以框为基准规定所述特征图像...

【专利技术属性】
技术研发人员:山田笃志
申请(专利权)人:京瓷办公信息系统株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1