光学扫描器及其软件制造技术

技术编号:2934942 阅读:243 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种用于扫描表面的光学扫描器及其软件,它有一个一维光学传感器但没有用于确定扫描速度的机械移动部件。本发明专利技术也提供一个处理通过扫描器扫描文本得到的文本图象的方法,由于瞬间扫描速度的可变性使该文本图象畸变。该方法利用文本中的模字符高度和对于每种字体的字体比得到在文本图象中每个位置上的局部校正因子。校正因子与在该位置上的瞬间扫描速度有关,用于校正畸变的文本图象。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于文本扫描器和与其一起使用的软件的领域。
技术介绍
手持式光学扫描器用于不同的应用包括扫描文本,阅读条码和获取图象。这些扫描器包括一个用于获取由一个中央处理器(CPU)管理和存储在一个存储器中的图象信息的光学扫描器。典型地信息由字符识别软件处理然后传送给一个用户应用装置如一个文字处理器,数据库或输送页。在一个给定的瞬间手持式光学扫描器的观察区域只包括整个被扫描媒体的一小部分。这样在使用时,使手持式光学扫描器通过整个被扫描媒体以便产生获取图象的一个时间系列,其中每个获取图象都与被扫描媒体的一小部分对应。因为以一个恒定速率获取图象,所以其后当从获取图象系列重建被扫描媒体时,由于当扫描时扫描速度的变化,将产生一个畸变的图象。手持式扫描器有一个基准扫描速度,在该基准扫描速度上获取图象与原始图象完全相同。基准扫描速度是光学扫描器的宽度(在扫描方向)和由传感器获取图象的速率的乘积。当扫描速度低于基准扫描速度时获取的被扫描媒体中的位置显得被拉长或扩大了,而当扫描速度高于基准扫描速度时获取的位置显得被压缩了。字符识别软件不能识别这种畸变图象。这样,必须通过在扫描方向上用一个等于瞬间扫描速度除以基准速度的校正因子对每个获取图象进行按比例缩放来处理每个获取图象。所以已有技术的扫描器包括用于连续地监视瞬间扫描速度的装置。例如,美国专利5,083,218公布了一种手持式光学扫描器,它有一个当扫描时沿着被扫描媒体滚动的轮子用于测量当扫描时每个时刻的瞬间速度。美国专利5,023,922公布了一种手持式光学扫描器,它有一个二维光学传感器其中瞬间速度是从一个图象横过传感器所需的时间间隔算出的。一个轮子或一个二维传感器的存在使手持式扫描器笨重和难以使用。所以,在技术上需要提供一个基本上消除或克服了已有技术扫描器的缺点的扫描器。在下面的描述和权利要求书中我们要用到这个术语表以及诸术语的定义,诸术语中的一些在技术上是已知的,另一些是我们创造的。视场—在一个瞬间由一个扫描器获取的被扫描媒体的部分。扫描图象—通过在一个表面上移动一个扫描器产生的一个二维图象。从当扫描时获取的视场的时间系列对扫描图象进行编辑。文本图象—一个由任何语言的文本组成的扫描图象。群集—一个在文本图象中诸黑象素的相连的组。典型地一个黑群集是单个字符但是可以是单个字符的一部分或两个或多个字符的组合。水平段—一条相连黑象素直线,它与文本行平行,有一个象素高度。水平段的长度等于它的黑象素的数目。堆—在一个扫描图象中至少一个预先确定数目的水平段的一个相连的阵列,它有下列特性(a)没有两条水平段是共线的;(b)在堆中最长的水平段的长度与最短的水平段的长度之比不超过一个预先确定的值;(c)堆中诸相邻水平段至少部分重叠(即,在堆中一对给定的相邻水平段中,从同一个视场获取的两个水平段中的每一个中至少有一个黑象素)。每个堆都有一个与它相关的高度,可以将该高度定义为,例如,它的组合的水平段的数目。每个堆也都有一个与它相关的宽度,可以将该宽度定义为,例如,它的水平组合段的平均长度,它的水平组合段的最小长度或它的水平段中任意一个的长度。我们不认为本专利技术受这些定义的约束,在本专利技术的范围内考虑用其它的高度和宽度的定义。每个堆也都有一个与它相关的最小尺度的有界矩形,在该矩形中两条相对的边是垂直的,另两条相对的边是水平的。基本垂直的堆—一个高度超过一个预先确定数的堆,其中堆的宽度与它的有界矩形的宽度之比超过一个预先确定的值。字符识别软件—任何用于将文本图象变换成ASCII字符串的软件包,例如光学字符识别(OCR)软件。停止间隔—一个连续的视场系列,视场数超过一个预先确定的数,所有的视场与第1个视场几乎相同。如果在一个视场中不存在一个长度大于一个预先确定长度的诸相连象素的子场,在该子场中所有的象素都与另一个视场中的诸对应象素不同,则这两个视场被认为是几乎相同的。字体比—在一个特定的字体中模字符高度(最通常的字符高度)与字符的最通常的基本垂直线宽度之比。字体比是一种给定字体的特征常数。对于大多数字体来说,字体比,典型地尽管不是必须的,约为6。校正因子—瞬间扫描速度除以基准速度。
技术实现思路
在下面的描述和权利要求书中,我们将文本行的方向以及手持式扫描器的扫描方向任意地指定为水平方向。作这样的指定只是为了描述本专利技术时比较简单。在本专利技术的范围内也可以考虑另一些扫描方向,我们不认为本专利技术受到这种任意指定的约束。在本专利技术的第一个方面,本专利技术提供一种扫描器,它有一个一维(线性)光学传感器,该传感器产生宽为一个象素长(高)为n个象素的图象,但该扫描器没有机械移动部件如一个轮子。当扫描器的传感器阵列在表面上移动以便扫描一行符号时,在由一个在扫描器内的内部时钟确定的恒定速率上获取一个扫描图象系列。可以将由传感器得到的图象信息存储在一个计算机处理装置中,并在该计算机处理装置中对它进行处理。在本专利技术的第二个方面,本专利技术提供一个用于确定当用手持式扫描器扫描时一个文本图象的瞬间校正因子的方法。因为瞬间校正因子等于瞬间扫描速度除以扫描器的基准速度,所以该方法等效于确定瞬间扫描速度的方法。该方法可以与没有任何机械移动部件的扫描器一起使用。它也可以与只有一个一维光学传感器的扫描器一起使用。本专利技术的方法可以用于消除由于扫描速度的变化在文本图象中引起的畸变,以便使该文本可以被光学字符识别软件识别或用户可以将它作为一个图象读出来。本专利技术的方法是建立在一个扫描图象中,在任何特定位置上的垂直距离(即与扫描方向垂直的距离)与在那个位置上的瞬间扫描速度无关的观察基础上的。特别是,在文本图象中,一个文本字符的高度与扫描速度无关。所以在文本图象中的模字符高度与当获取文本图象时扫描速度中的任何变化无关。如下面揭示的那样,能够从基本垂直的堆的宽度,扫描文本的模字符高度和字体比确定在包括一个基本垂直的堆的文本图象的一个位置上的瞬间扫描速度或等效地瞬间校正因子。这样,本专利技术提供用于扫描表面的扫描器,该扫描器的特征是它有一个一维光学传感器但没有用于确定扫描速度的机械移动部件。本专利技术还提供一个用于处理通过用扫描器扫描文本得到的获取的文本图象的方法,该文本有一种或多种字体,每种字体都有一个字体比,已经在一个瞬间扫描速度上扫描了文本中的每个位置,其中由于瞬间扫描速度的可变性使该文本图象畸变。该方法包括下列诸步骤(a)对每种字体提供一个模字符高度;和(b)利用所述的模字符高度和字体比构造一个用于校正已被畸变的文本图象的校正因子。本专利技术进一步提供一个存储可执行的计算机程序的存储媒体,用该程序处理一个通过用扫描器扫描文本得到的获取的文本图象,该文本有一种或多种字体,每种字体都有一个字体比,已经在一个瞬间扫描速度上扫描了文本中的每个位置,其中由于瞬间扫描速度的可变性使该文本图象畸变,该处理包括下列诸步骤(a)对每种字体提供一个模字符高度;和(b)利用所述的模字符高度和字体比构造一个用于校正已被畸变的文本图象的校正因子。附图说明为了了解本专利技术并看它在实践中如何被实施,现在我们参照所附诸图通过不起限制作用的例子描述一个优先实施例,其中图1表示一个根据本专利技术的手持式扫描器;图2表示一个根据本专利技术执行的处理的方框图;图3表示分解成8个群集的7个字符;图4a和b每本文档来自技高网
...

【技术保护点】
一种用于扫描一个表面的扫描器,它的特征是它有一个一维光学传感器但没有用于确定扫描速度的机械移动部件。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:雷文里格弗
申请(专利权)人:托普斯坎有限公司
类型:发明
国别省市:IL[以色列]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1