图像处理装置和图像处理方法制造方法及图纸

技术编号:2931461 阅读:214 留言:0更新日期:2012-04-11 18:40
一种图像处理装置具有:读取单元;图形区提取单元;文字区提取单元;字符串提取单元;和关联单元。所述读取单元读取文档。所述图形区提取单元从所述读取单元所读取的文档中提取图形区。所述文字区提取单元从所述读取单元所读取的文档中提取文字区。所述字符串提取单元提取所述图形区中存在的字符串。所述关联单元基于所述字符串提取单元所提取的字符串将文字区的信息与图形区关联起来。

【技术实现步骤摘要】

本专利技术涉及从图像提取字符信息和图形信息并对所提取的信息进行组织的技术。
技术介绍
由于存储纸质文档需要大量的空间,因此近年来使用扫描仪或其它读取装置读取文档、将所读取的文档数字化并且在计算机中将其归档的技术得到越来越多的重视。当使用这些技术将文档数字化和归档时,把所读取的文档存储为图像会使文档中的字符串也被存储为图像,这防碍了关键字检索,并且当检索所需文档时,必须执行逐个检查表示这些文档的各幅图像的复杂过程。鉴于这个原因,当将文档数字化和归档时,希望准确地识别出显示图形的区域和显示字符串的区域,并且希望将表示字符串的图像内的字符串转换成文本以便于文档检索。在日本特开平1-266689A中公开了能够准确识别文档中的字符串区和图形区的技术的例子,而且采用这种技术能够准确识别文档中的字符串从而将其转换成文本。转换成文本并将文档内字符串区域中的字符串归档使得可以进行关键字检索并有利于数字化文档的再使用。然而,有时不仅希望再使用数字化文档来检索书写内容,还希望用于检索文档中包含的图形和照片等。由于通过与字符串相匹配来检索所需信息,所以使用上述的将书写内容转换成文本并将其归档的方法不可能检索文档内的图形和照片等,并且因此不可能检索所需信息。考虑到上述情况而制造出本专利技术,并且本专利技术提供了一种有利于检索数字化文档的图形区的技术。
技术实现思路
为了解决上文所讨论的问题,本专利技术提供了一种图像处理装置,其包括读取单元,其读取文档并生成表示所读取文档的图像的图像文件;图形区提取单元,其在所述图像文件所表示的图像中提取图形区;文字区提取单元,其在所述图像文件所表示的图像中提取文字区;字符串提取单元,其提取该图形区提取单元所提取的图形区中的字符串;文本提取单元,其从所述文字区提取单元所提取的文字区中提取包括与该字符串提取单元所提取的字符串相同的字符串的文本;和文档数据生成单元,其生成表示文档的文档数据,该文档包含所述图形区提取单元所提取的图形区和所述文本提取单元所提取的文本。根据这种图像处理装置,生成表示所读取文档的图像文件,并提取所述图像文件所表示的图像中的图形区和所述图像文件所表示的所述图像中的文字区。从文字区提取包括与所提取的图形区中的字符串相同的字符串的文本;并且生成表示包括所提取的图形区和所提取的文本的文档的文档数据。由于生成了表示包括图形区和该图形区中的文本的文档的文档数据,所以在检索文档数据以获得与图形区相关的字符串时,会返回包括图形区的文档数据作为检索结果。根据本专利技术的一个实施例,有利于检索数字化文档中的图形区。附图说明基于下图详细描述本专利技术的实施例,其中图1表示根据本专利技术一个实施例的通信系统的结构;图2是表示根据本专利技术一个实施例的图像处理装置的主要部件的结构的方框图;图3表示存储在根据该实施例的图像处理装置中的关联表的格式;图4是表示在CPU 102生成结构化文档时执行的处理的流程图; 图5是表示在CPU 102生成结构化文档时执行的处理的流程图;图6表示图像输入单元所读取的文档;图7表示从图像文件提取的区域;图8表示图像处理装置所生成的结构化文档;图9表示图像处理装置所提供的页面;图10表示结构化文档所表示的页面;图11表示图像输入单元所读取的文档;图12表示图像处理装置所生成的结构化文档。具体实施例方式<实施例结构> 图1表示包括根据本专利技术一个实施例的图像处理装置100的通信系统的示例。PC(个人计算机)200是个人计算机装置,并且与LAN(局域网)300相连。PC 200存储有WWW(万维网)浏览器软件,当运行该软件时,从与LAN 300相连的图像处理装置100获取各种文件,所获取的文件中的内容可以被解译并显示页面。图2是表示位于根据本专利技术一个实施例的图像处理装置100的硬件结构内的、根据本专利技术的主要组件的结构的方框图。如图2所示,图像处理装置100的组件与总线101相连,并通过该总线101在组件间进行数据传输。通信单元107通过通信线路(未示出)与LAN 300相连,并用作与PC 200和连接到LAN 300上的其它外部装置之间进行通信的通信界面。通信单元107在CPU 102的控制下,将从LAN 300发送的数据提供给CPU 102,并通过总线101将CPU 102所提供的数据发送到LAN 300。图像输入单元108具有将文档读取为图像的图像扫描仪,并在CPU102的控制下,读取放在图像扫描仪上的文档并将表示所读取文档的图像文件存储在存储单元105中。U/I(用户界面)单元106具有多个用于操作图像处理装置100的键(未示出),并根据用户的按键向CPU 102提供指令。例如,U/I单元106可具有读取键,当按下该读取键时,向CPU 102提供读取指令,指示读取放在图像输入单元108上的文档。此外,U/I单元106具有液晶显示器(未示出),所述液晶显示器在CPU 102的控制下,在其自身上显示文本、图形画面、菜单画面等。存储单元105具有能存储数据的装置(诸如硬盘装置),并存储以下这些程序服务器程序,其使图像处理装置100用作WWW服务器装置;控制程序,其控制图像处理装置100的各个单元;和CGI(公共网关接口)程序,其根据来自外部装置的指令进行工作。存储单元105还存储各种类型的文件,例如由图像输入单元108生成的图像文件和用HTML(超文本标记语言)写成的文件。如图3所示,存储单元105还存储格式关联表TB1。所述关联表TB1是使表示所读取文档中的图形区的文件与和所述图形区相关的字符串关联起来的表,并且该表包括表示文档中的图形区的图像文件的文件名、表示所述图形区标题的字符串、描述所述图形区的字符串和表示所述图形特征的字符串。ROM 103包含例如称为IPL(初始程序装入程序)的程序。一旦由电源(图中未示出)进行供电,CPU 102就从ROM 103读取IPL并执行它。当执行IPL时,CPU 102通过把RAM 104用作工作区来读取存储在存储单元105中的服务器程序和控制程序、运行这些程序、并控制图像处理装置100的各个单元。当CPU 102运行服务器程序时,图像处理装置100用作WWW服务器,并执行按照HTTP协议的通信。此外,CPU 102运行控制程序来执行图4和图5所示的流程图中所示的处理、从图像输入单元108读取文档并生成显示所读取文档概要的结构化文档。该结构化文档是文本数据并且用例如XHTML(扩展超文本标记语言)写成。此外,结构化文档语言不限于XHTML,而可以是XML(扩展标记语言)、HTML、SGML(标准通用标记语言)或可表示结构化文档的任何其它语言。如上所述,从CPU执行程序来实现各种功能的意义上来说,图像处理装置100的结构和普通计算机的硬件结构相同。<实施例的操作> 下面描述本实施例的操作。首先,参考图4中的流程图描述图像处理装置100生成结构化文档的操作,随后描述图像处理装置100使用所生成的结构化文档为PC 200提供检索服务的另一操作。应注意在以下的操作描述中,假设向图像处理装置100提供了电力并且CPU 102已正在执行控制程序。并且,在这些操作描述中,假设图像处理装置100读取如图6所示的本文档来自技高网...

【技术保护点】
一种图像处理装置,其包括:读取单元,其读取文档并生成表示所读取文档的图像的图像文件;图形区提取单元,其在所述图像文件所表示的图像中提取图形区;文字区提取单元,其在所述图像文件所表示的图像中提取文字区;字符串提 取单元,其提取所述图形区提取单元所提取的图形区中存在的字符串;文本提取单元,其从所述文字区提取单元所提取的文字区中提取包含与所述字符串提取单元提取的字符串相同的字符串的文本;以及文档数据生成单元,其生成表示包含所述图形区提取 单元所提取的图形区和所述文本提取单元所提取的文本的文档数据。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:田川昌俊田宗道弘刘绍明增市博田代洁石川恭辅伊藤笃佐藤直子
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1