图像积累设备与方法技术

技术编号:2868954 阅读:220 留言:0更新日期:2012-04-11 18:40
管理信息提取设备,它在表格形式学习过程中学习文件的分格线结构以及用户明确的管理信息如标题等的位置,并将它们存储于布局词典中。作业中,使从输入文件的图像中提取出的分格线结构与上述布局词典中文件内的分格线结构匹配。然后参考此布局词典中的位置信息而从输入文件中提取管理信息。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种系统,用于通过例如扫描器之类的输入装置等将文件与图样转换为图像数据,给图像数据增加处理信息并积累结果数据;同时涉及一种设备,用在图像识别中来识别图像中的分格线的结构,还涉及到进行上述处理的方法。
技术介绍
近来,将信息存储于纸上的传统方法已转换为将数据存储于电子媒体上的方法。例如,电子文件编排系统可以用如图像扫描器等光电转换器等将纸上存储的文件转换为光盘,磁盘上的经过转换文件图像,同时将检索用关键字之类的管理信息添加到此已转换的文件图像上。由于在上述方法中是把文件作为图像数据存储,与在字符识别技术中编码好来存储文件所有字符的方法相比,就需有较大的盘存储容量。但是上述方法易配合以高的处理速度,同时还可以原样地存储含有异于字符的数据的图像与表。另一方面,所存储的信息则要利用附加的管理信息如关键字、序号等与文件图像在一起检索。这类常规的系统需要耗费很大的气力与时间来指派关键字,不能提供用户友好工艺。为了解决上述传统系统的这一棘手问题,可将文件的标题设定为关键字,自动地提取,作为字符识别,并编码用于和文件图像一同存储。当前,识别字符的速度达每秒几十个字符,处理一张标准的文件页(约21cm×29.5cm)需约30秒至数分钟。为此,建议不要去识别整个文件的所有字符,而首先是从文件的图像中提取必要的标题,然后去识别它们。通过光电转换器来读取文件从获得的文件图像来提取文件的一部分例如文件标题的传统技术,已描述于本专利技术申请人提出的美国专利申请08/694503与日本专利申请H7-341983中,题名为“用于从文件图像中提取标题的标题提取设备及其相应方法”。图1A表明了这种标题提取设备的原理。图1A所示的标题提取设备包括字符区生成单元1、字符串区生成单元2以及标题提取单元3。字符区生成单元1通过标记图像元素的连接成份而提取通过扫描器等从文件图像输入的例如作为字符一部分的部分图案。然后通过组合若干个部分图案而提取(生成)一字符区。字符串区生成单元2组合一批字符区而提取(生成)一字符串区。标题提取单元3则提取作为一标题区的可能是一标题的字符串区。此时,标题提取单元3则利用一些显著的点,例如顶部与中心位置、比文件主体字符大小大的字符大小、字下划线的表示,等等,作为标题区的概率。此概率表示为各个字符串区的分数,用来依照从最高分到最低分的秩序获得标题区的一批候选者。在上面所述的方法中,能够从不含表的文件中提取标题区。而当文件含有表时,标题提取单元3则在字符中区生成单元2于该表中提取一字符串后,在考虑到字符数的条件下来提取标题区。例如,表明隐含标题存在性的项目名称的字符数,如“Subject”、“Name”等等是比较小的。构成表示标题本身的字符串的字符数则可能较大,例如“...relatiug to...”。这样,可能是一个标题的字符串便能够从相邻的字符串利用其中的字符数探测出。但是,存在着许多使用分格线的表格式文件,例如单据票证等。于是,上述传统的技术就有着很少可能从表中成功地提取出标题的问题。例如当标题是写在表的中心或底部周围时,仅仅依靠优先从顶部提取字符串是不可能正确地提取标题的。此外,如图1B所示,批准栏11位于表的顶部。要是在此批准栏11中存在有许多过量的字符串,如“general monager”(总经理)、“manager”(经理)“sub-manager”(副经理)、“person in charge”(负责人)等,则这些字符串将被优先提取,从而就不能正确地提取标题。如项目名称12与标题13相组合的结果所表示,标题可以写于项目名称12之下而不是在其右侧。此时项目名称与标题便只能根据相邻字符串字符数的信息来识别。此外,在日文中,项目名称不仅写作水平的而且也有写成垂直的。于是就很难明确项目名称的位置。当一个文件包含两个表时,标题有可能位于较小表上的某处。由于包含表的文件可以写作不同格式,表的前述概率便取决于各个文件,因而便降低了从表中提取标题的精确性。要是输入文件图像的状态不佳,则提取的精确性将进一步降低。在电子文件编排系统中,提取的标题区通过光学字符阅读器(OCR)进行字符识别生成字符码,并将其作为管理信息添加到图像上。这样便可以用字符码来检索数据库的图像。这时,要是可由OCR读取标题区中的字符串就不会有问题。但要是背景显示纹理图形或字符是设计的字型,则当前的OCR不能识别字符串。于是这时不能将管理信息添加到图像上。
技术实现思路
本专利技术的目的在于提供设备与方法以提取合适的管理信息,用来管理各种格式下的文件图像,同时提供根据此管理信息来累积图像的设备与方法。具有本专利技术的管理信息提取设备与图像累积设备的图像管理系统包括用户入口单元、计算单元、词典单元、比较单元、提取单元、存储单元、组生成单元与检索单元。根据本专利技术的第一方面,在此提供一种图像积累设备,此设备包括存储装置,用来存储作为积累的图像的管理信息的图像信息;以及检索装置,用来检索上述图像信息。根据本专利技术的第二方面,在此提供一种图像积累方法,此方法包括下述步骤存储用作积累图像管理信息的图像信息;以及检索此图像信息。附图说明图1A示明根据提出的专利申请的标题提取设备的配置;图1B示明表格式的文件;图2A示明管理信息提取设备的原理;图2B示明管理信息提取过程;图3是表明在学习一种表格形式时所进行的过程的第一流程图;图4是表明在作业中所进行的过程的第一流程图;图5示明信息处理设备的配置;图6是表明在学习一种表格形式时所进行的过程的第二流程图;图7示明分格线结构提取过程;图8表明管理信息位置的确定过程;图9表明粗分类中第一分格线的特征;图10表明粗分类中第二分格线的特征;图11表明粗分类中第三分格线的特征;图12表明粗分类中第四分格线的特征;图13表明提取相交字符串的方法;图14表明相交字符串;图15是表明交比计算过程的流程图;图16表明采用交比指示轮廓的分格线的特征;图17是表明作业中所进行过程的第二流程图;图18表明DP(动态程序设计)匹配; 图19是表明DP匹配过程的流程图;图20是表明管理信息位置计算过程流程图(1);图21是表明管理信息位置计算过程流程图(2);图22是表明管理信息位置计算过程流程图(3);图23表明应用用户输入方式与自动学习方式提取管理信息的过程;图24是表明表内管理信息提取过程流程图;图25是表明无分格线的文件图像的管理信息提取过程的流程图;图26是表明管理信息存储过程的流程图;图27是管理信息存储表;图28是表明管理信息检索过程的流程图;图29是相关曲线图;图30是表明形式识别过程的流程图;图31表明基准宽度、基准高度与基准点;图32表明水平分格线;图33表明垂直分格线;图34表明有关水平分格线的细节信息;图35表明有关垂直分格线的细节信息;图36表明模型匹配过程的流程图;图37是匹配表;图38表明阈的功能;图39表明顺序反转的情形;图40表明指定两组相对应的分格线的情形;图41表明由最佳路径集表示的分格线的对应关系;图42是表明节点布置过程的流程图;图43是表明路径生成过程的流程图(1);图44是表明路径生成过程的流程图(2);图45表明存储单元的节点串; 图46表明应用细节信息的确定过程;图47是表明最佳路径本文档来自技高网
...

【技术保护点】
图像积累设备,此设备包括:存储装置,用来存储作为积累的图像的管理信息的图像信息;以及检索装置,用来检索上述图像信息。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:直井聪胜山裕武部浩明
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1