The invention provides a control method for an information extraction device, an image forming device, and an information extraction device. The information extraction device includes a storage unit, an image reading device, and a control unit. Based on the color of the color region in the reference manuscript (referring to the image data), the control department classifications the color region into the first color region and the second color region. The storage unit stores the feature image data including the first color region and the location data representing the distance and direction from the feature image data to the second color region. The control department specifies the extraction area according to the location and location data of the region that matches the feature image data in the comparison image data. The control unit stores the extraction information extracted from the extraction area in the storage section.
【技术实现步骤摘要】
信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法
本专利技术涉及从图像数据中提取信息的装置以及该装置的控制方法。
技术介绍
有时会事先录入好资料的格式(文档格式)。然后,从包含录入格式的图像数据中提取信息。例如,从通过扫描资料(原稿)而获得的图像数据中提取信息。有时在提取信息前,会判定通过扫描而获得的图像数据是否与录入格式一致。已知有以下那样的与基于格式的信息的提取相关的技术的一例。具体来说,已知有一种系统,该系统参照存储的格式数据对多个单元按照某种规则配置的文本的布局进行解析,并存储存在于各单元的信息的类型和规定了单元间的邻接关系的格式数据,提取文本的图像数据,求出来自图像数据的多个单元的提取和单元间的邻接关系,并将文本的单元间的邻接关系与格式数据规定的单元间的邻接关系进行比较,特定文本的单元中的对应的格式数据规定的单元并特定文本中的信息的配置,按照所特定的信息的配置来识别包含于文本的信息。在账簿那样的资料中记录有信息。例如记录有姓名、住所、电话号码。如果能从资料的图像数据中自动提取期望的信息进行数据化,则很方便。不需要输入者一边看资料一边通过键盘手动输入信息。另外,有时也会在资料中设置有回答栏。回答栏是回答者的选项的填写栏。例如,回答栏包括复选框、被圆环绕的记号。填写者点击符合的框。或者,用圆环绕符合的记号。如果能自动提取在回答栏中进行选择的信息(什么样的记号被填写在哪个位置),则也可以不对每张资料都确认选择的回答。以往,要自动提取资料的信息,需要预先录入信息提取区域的位置。例如,在信息处理装置中录入资料的格式定义用的图像数据中的提 ...
【技术保护点】
一种信息提取装置,其包括:存储部,其存储数据;图像读取装置,其读取原稿,并生成所述原稿的图像数据;以及控制部,其对所述图像读取装置通过读取参照原稿而获得的参照图像数据中的作为被上色的区域的上色区域进行识别,并基于所述上色区域的颜色将所述上色区域分类成第一上色区域和第二上色区域,使所述参照图像数据中的包含所述第一上色区域的特征图像数据存储于所述存储部,使表示从所述特征图像数据到所述第二上色区域的距离和方向的位置数据存储于所述存储部,并判定读取所述参照原稿后的所述图像读取装置通过读取比较原稿而获得的比较图像数据内是否包含与所述特征图像数据匹配的区域,在判定为包含时,根据所述比较图像数据内的与所述特征图像数据匹配的区域的位置以及基于所述位置数据的距离和方向规定提取区域,并将包含于所述提取区域的信息作为提取信息提取,使所述提取信息存储于所述存储部,在判定为未包含时,不规定所述提取区域且不提取所述提取信息。
【技术特征摘要】
2016.07.28 JP 2016-1480951.一种信息提取装置,其包括:存储部,其存储数据;图像读取装置,其读取原稿,并生成所述原稿的图像数据;以及控制部,其对所述图像读取装置通过读取参照原稿而获得的参照图像数据中的作为被上色的区域的上色区域进行识别,并基于所述上色区域的颜色将所述上色区域分类成第一上色区域和第二上色区域,使所述参照图像数据中的包含所述第一上色区域的特征图像数据存储于所述存储部,使表示从所述特征图像数据到所述第二上色区域的距离和方向的位置数据存储于所述存储部,并判定读取所述参照原稿后的所述图像读取装置通过读取比较原稿而获得的比较图像数据内是否包含与所述特征图像数据匹配的区域,在判定为包含时,根据所述比较图像数据内的与所述特征图像数据匹配的区域的位置以及基于所述位置数据的距离和方向规定提取区域,并将包含于所述提取区域的信息作为提取信息提取,使所述提取信息存储于所述存储部,在判定为未包含时,不规定所述提取区域且不提取所述提取信息。2.根据权利要求1所述的信息提取装置,其特征在于,所述信息提取装置包括消息输出部,当读取所述参照原稿后,每读取一次所述比较原稿,所述信息输出部输出表示所述提取信息是否已被提取的消息。3.根据权利要求1或2所述的信息提取装置,其特征在于,所述控制部使所述提取区域的图像数据和对所述提取区域的图像数据进行OCR处理而获得的文本数据的任意一方或者双方作为所述提取信息存储于所述存储部。4.根据权利要求1或2所述的信息提取装置,其特征在于,所述控制部将与所述第二上色区域相同大小或者比所述第二上色区域大的区域规定为所述提取区域。5.根据权利要求1或2所述的信息提取装置,其特征在于,所述控制部以框为基准规定所述特征图像...
【专利技术属性】
技术研发人员:山田笃志,
申请(专利权)人:京瓷办公信息系统株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。