用于内容识别的系统和方法技术方案

技术编号:2929122 阅读:153 留言:0更新日期:2012-04-11 18:40
公开了一种用于识别扫描文件内的内容的装置、系统和方法。所述装置包括修改模块、识别模块和分段模块。所述修改模块通过向扫描内容数据集应用S形函数而建立修改内容数据集。所述识别模块识别在修改内容数据集内的内容段。所述分段模块识别内容段的内容段类型。示例内容段类型包括文本、艺术线条和图像。

【技术实现步骤摘要】

本专利技术涉及扫描图像分割,具体上涉及识别在被扫描的文件中的文本、图像和艺术线条内容。
技术介绍
诸如绝版(out-of-print)书籍之类的硬拷贝文件的传统数字化是缓慢和困难的。部分地,所述困难起因于识别在给定文件中的各种类型内容的需要。一些典型内容类型是文本、图像和艺术线条。文本一般包括具有一致大小的小字符或符号。艺术线条一般包括线条和图案的绘制图。图像一般包括具有许多中间级(诸如灰度)来描绘某个画面的画面。文本和艺术线条基本上是双级的(例如黑和白)。相反,图像具有更多的半色调形式的灰度级(例如在8位系统中的256级)(例如,近似于中间色或阴影——诸如灰色——的空间分布的高分辨率像素)。术语“扫描内容”在此用于指被扫描和数字化的任何内容。术语“图像内容”指在扫描内容中的特定类型的内容、半色调图像。其他类型的内容包括文本和艺术线条,如上所述。为了保持扫描内容的优质再现,可以不同的方式来处理不同的内容类型。但是,为了以不同的方式来处理不同的内容类型,可能需要首先识别每个内容类型。一种传统的扫描技术使用在文件中的不同内容类型的人工识别。例如,一个人在内容段周围物理地绘制矩形限制的方框或其他标识符,以指示应当以某种方式来处理所述被限制的内容。内容段指具有一致内容类型的扫描文件或扫描内容的一部分。可以按照默认处理模式来处理在所述限制方框之外的内容。因此,在一个示例中,一个人可以在半色调图像段周围而不是在文本段周围绘制矩形限制方框。所述半色调图像可以被去遮蔽(descreen)以去除半色调,并且可以将文本简单地按比例放大到较高的分辨率,并且将阈值按比例变为两级。传统的去遮蔽使用用于将半色调平滑为共色(contone)图像的算法。不幸的是,这种用于在图像周围绘制矩形限制方框的传统方法缓慢并且成本大。另一种传统的扫描技术使用局部优化。局部优化使用在扫描内容中的局部信息,确定是否应当将内容段当作两级文本和艺术线条或半色调图像。但是,局部优化没有足够的信息来将扫描文件分割为可以按照每个段的内容类型而不同地处理的独立内容段。结果,局部优化扫描技术可导致降低的图像质量。从上述的讨论应当清楚的是,需要一种用于克服传统扫描分段技术的装置、系统和方法。有益的是,这样的装置、系统和方法将比人工分段更快和简单。另外,这样的装置、系统和方法将比局部优化技术更准确。
技术实现思路
响应于本领域的当前状态,具体上响应于还没有由当前的扫描分段技术完全解决的本领域内的问题和需要,已经开发了本专利技术的几个实施例。因此,本专利技术已经被开发来提供一种用于扫描分段的装置、系统和方法,其克服了在本领域内的许多或全部上述缺陷。本专利技术的各实施例便于扫描分段。具体上,某些实施例自动化扫描分段,包括识别段和每个段的内容类型。用于识别在扫描内容中的内容的装置配备逻辑单元,它包括多个模块,它们被配置来在功能上执行扫描分段所需要的操作。在所述实施例中的这些模块包括图像模块、修改模块、识别模块、分段模块、面积计算模块、面积比较模块、子图像模块、直方图计算模块、直方图比较模块和相邻模块。在一个实施例中,所述图像模块访问扫描内容数据集。所述扫描内容数据集可以作为修改内容数据集的基础,所述修改内容数据集继而可以用于识别扫描内容的可能内容类型。在一个实施例中,所述修改模块从扫描内容数据集建立修改内容数据集。为了建立修改内容数据集,修改模块可以向扫描内容数据集应用数学函数。在一个实施例中,所述修改模块向扫描内容数据集应用S形函数,以便建立修改内容数据集。在一个实施例中,所述识别模块识别在修改内容数据集内的内容段。所述识别模块可以使用8相邻连接性确定来识别修改内容数据集的内容段。在一个实施例中,所述分段模块识别在修改内容数据集内的内容段的内容段类型。对应地,所述分段模块识别扫描内容数据集的内容段的内容段类型。在一个实施例中,所述分段模块响应于所计算的段表面面积小于预定的最小图像表面面积的判定,将内容段的内容段类型识别为文本。在一个实施例中,如果所述段表面面积不小于预定的最小图像表面面积,则分段模块响应于修改内容直方图类似于扫描内容直方图的判定,将内容段的内容段类型识别为艺术线条。否则,所述分段模块可以响应于所述修改内容直方图不类似于扫描内容直方图的判定,将内容段的内容段类型识别为图像。或者,所述分段模块可以将所述内容段类型识别为另一内容类型。在一个实施例中,所述面积计算模块计算在修改内容数据集内的内容段的段表面面积。在一个实施例中,所述面积比较模块将所计算的内容段的段表面面积与预定的最小图像表面面积相比较。在一个实施例中,所述子图像模块定义子图像窗口,它包括其大小被确定为等于或大于所述最小图像表面面积的内容段。所述子图像窗口可以用于识别修改内容数据集的数据的一部分或扫描内容数据集的对应部分。在一个实施例中,所述子图像窗口可以是矩形的,其宽度和高度近似等于但是略大于所选择的内容段的所计算的宽度和高度。或者,所述子图像窗口可以使用其他形状的各种大小或轮廓。在一个实施例中,所述直方图计算模块计算用于描述扫描内容数据集的扫描内容直方图。具体上,所述直方图计算模块可以计算对应于被应用到扫描内容数据集的子图像窗口的扫描内容直方图。类似地,所述直方图计算模块可以计算对应于被应用到修改内容数据集的子图像窗口的修改内容直方图。在一个实施例中,所述直方图比较模块将修改内容直方图与扫描内容直方图相比较。在一个实施例中,所述相邻模块将预定范围的像素值转换为在预定范围内的单个像素值。换句话说,所述相邻模块向在某组像素值内的每个像素分配单个像素值。所述相邻模块可以对于对应于单色通道或多色通道的修改内容数据集执行这样的分组操作。一种本专利技术的系统也被提供来识别在扫描文件内的内容。所述系统可以被体现为具有扫描器、电子存储器件和分段装置的扫描器系统。所述扫描器捕获和数字化具有内容段的扫描内容。所述电子数据存储器件存储用于描述所述数字化的扫描内容的扫描内容数据集。所述分段装置识别内容段的内容段类型。所述系统也可包括用户界面、捕获模块和数字化模块。一种信号承载介质也被提供来存储程序,所述程序当被执行时执行识别在扫描内容内的内容的操作。在一个实施例中,所述操作包括通过向扫描内容数据集应用S形函数来建立修改内容数据集;识别在修改内容数据集内的内容段;并且在修改的扫描数据和原始扫描数据之间比较数据。在进一步的实施例中,所述操作可以包括确定与基本上黑色的像素的8相邻连接性,并且识别在所述内容段内的所有像素。在进一步的实施例中,所述操作可以包括计算在修改内容数据集内的内容段的段表面面积,将所述段表面面积与最小的图像表面面积相比较;并且/或者响应于所述段表面面积小于所述最小图像表面面积的判定,将内容段的内容段类型识别为文本。在进一步的实施例中,所述操作可以包括响应于内容段不是文本的判定,定义包括内容段的子图像窗口;计算对应于所述子图像窗口的扫描内容直方图;计算对应于子图像窗口的修改的扫描内容直方图;并且/或者,将修改的扫描内容直方图与所述扫描内容直方图相比较。在进一步的实施例中,所述操作可以包括响应于所述修改的扫描内容直方图类似于所述扫描内容直方图的判定,将内容段的内容段类型识别为艺术线条;响应于所述修改的扫描内容直方图本文档来自技高网
...

【技术保护点】
一种用于识别在扫描图像中的内容的装置,所述装置包括:修改模块,它被配置来通过向扫描内容数据集应用S形函数而建立修改内容数据集;识别模块,它耦合到所述修改模块,所述识别模块被配置来识别在修改内容数据集内的内容段;以及分段模块,它耦合到所述修改模块,所述分段模块被配置来识别内容段的内容段类型。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:詹姆斯T史密斯第二李红约瑟夫S齐斯兹克泽维斯基
申请(专利权)人:普驰有限责任公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1