尤其是用于移动无线设备的图像分析方法技术

技术编号:5433115 阅读:190 留言:0更新日期:2012-04-11 18:40
一种可靠的、需要较少计算量的OCR系统,其通过以下方式实现:首先执行学习式的像素分组优化的预处理,该预处理在图像中搜索笔划。与迄今已知的方法相比最重要的区别特征在于,现在不再直接进行图案比较,而是试图尽可能最优地描摹笔划。然后由移动顺序得出关于相应字符的结论。由于这些移动顺序能够良好地缩放并能以相对较少的开销来描述,因而这种技术特别适用于移动应用。通过移动顺序所识别出的字符被存放在一个搜索词中,从而可根据移动直接得出关于文字的结论。另外也可以采用词典/专业词典。如果借助词典/专业词典来识别词汇,则所得知的文字可以用于更为优化的书写识别。本发明专利技术的优点在于更为可靠的OCR采集,其也能通过比较小的计算量而得到。这种可靠性尤其是基于在较差条件(尤其是光照条件、叠加的干扰)下的识别能够比常规系统得到更好的效果。

【技术实现步骤摘要】
【国外来华专利技术】本专利技术涉及一种如权利要求1或2的前序部分所述的图像分析方法,尤其是用于 具有内置数码相机的移动无线设备,以进行自动光学字符识别(OCR)。有多种针对PC的C0R系统。典型的是使用平板式扫描仪读入文本。针对现代应 用,有手持式扫描仪,它将扫入的文本在显示器上显示,保存或传送到计算机。但是当原件 被不清晰地扫入时总是会出现问题,或者只能识别出片断文字(例如在风中的标有文字的 旗子)。另外,当不能直接扫入时(例如街边的路牌),这些技术会出现问题。根据目前的 现有技术,可以用很高的分辨率记录这样的图像,其能够随后被扫描。但是在相机内本身不 直接执行OCR,因为这通过常规的方法需要大量的计算。如果要识别较长的文本,往往需要记录多个图像,然后将它们组合到一起(360° 照片组合)。为了得到足够的质量,该过程通常还需要人工后续处理。用于OCR的主要方法通过纯粹的位模式比较“图案匹配”或者像在手写识别中那 样通过线和交叉点表示文字来工作。图案匹配尤其是当涉及普通文字时(例如Kfz字符) 时能够被很好地使用。在识别字符时,能识别的字符被限制在很小的数目,此外这些字符被 标准化。另外,在增强现实领域也已知有不同的应用。对此作为例子的是照片拍摄(卫星 照片)与指示各个街道名称的道路交通图叠加(www.clicktel.de)。现有技术中已知一种如DE10113880B4或与之相应的EP1371229B1所述的优先像 素分组的方法,其公开了权利要求2的前序部分所述技术特征。DE10025017A1公开了一种移动电话,其尤其适用于简单地应用和使用附加业务和 功能,如短消息业务、支付交易、身份或安全验证等。该移动电话具有集成的用于读取字符、 符号代码和/或身份特征的装置,该装置是CCD传感器形式的扫描仪、条形码读取器或指纹 读取器。由此可以方便和快速地输入和获取文本、符号或与安全相关的特征。DE202005018376U1公开了一种移动电话,其具有按键、显示屏、数据处理系统、以 及设置在外壳上的一个开口或窗口后面的光学采样系统,尤其是手持式扫描仪,还具有集 成的翻译程序。通过所述光学采样系统可以扫入另一种语言的字符和/或单词。通过选择 语言,实现了一个或多个词汇的翻译。这样,该移动电话的使用者能够阅读外文词汇和文 本。具有优点的是,其可以是菜单、警示标识、服务规定、地图以及招牌。此外,用户也可以 自己通过按键输入单词,或者从保存在数据处理系统的存储器中的辞典选择单词。通过将 数据处理系统与显示屏和按键结合在一起,通过选择语言可以对词汇进行翻译,并显示在 显示屏上。DE10163688A1公开了一种用于跟踪货物的方法和系统,在货物上带有可光学读取 的字母数字标记,还提到了为此所提供的采集装置。所述标记作为图像由采集装置所采集, 并被转换成图像数据。这些图像数据由采集装置经由无线电发送到与计算机系统相连的接 收器,由计算机系统对这些图像数据做进一步分析。作为替代,图像数据也可以在发送到接 收器之前在采集装置中进行分析。但其中并没有详细公开对图像数据的分析有多么精确。DE1020050033001A1已公开了一种用于在移动终端设备中处理图像的方法,所述4移动终端设备例如为带有照相机的移动电话,该照相机拍摄数字图像信息,这些图像信息 的一部分借助图案识别方法、如文本识别方法(OCR)而加以分析。但是在这个公开文献中 也没有说明这种文本识别方法(OCR)多么精确地工作。因此本专利技术的目的在于提供一种符合要求的方法,其用于在带有数码相机的移动 终端设备中进行图像处理,该方法能够非常精确和快速地工作。本专利技术的特征通过独立权利要求1或2所述的技术特征来表示。具有优点的改进方案是从属权利要求的主题。本专利技术的优点是能进行可靠的OCR获取,并且可选地能够进行实时(Echtzeit)翻 译,这通过比较少的计算量就能实现。所述的可靠性尤其是基于在较差条件(尤其是光照 条件、叠加的干扰)下的识别能够比常规系统得到更好的效果。这一方面通过下述方式来实现首先执行学习式的像素分组优化的预处理,该预 处理在图像中搜索笔划。与目前已知的方法相比最重要的区别特征是,现在不再直接进行 图案比较,而是试图尽可能最优地描摹笔划。然后由移动顺序得出关于相应字符的结论。由 于这些移动顺序能够良好地缩放并能以相对较少的开销来描述,因而这种技术特别适用于 移动应用。通过移动顺序所识别出的字符被存放在一个搜索词中,从而可根据移动直接得 出关于文字的结论。另外也可以采用词典/专业词典。如果借助词典/专业词典来识别词 汇,则所得知的文字可以用于更为优化的书写识别。其应用场合包括在国外旅游的游客的照相手机,以便阅读尤其是交通图、菜单、普 通指示牌。其中其内容可以被翻译成第二种语言。翻译内容在显示屏上向使用者显示,或 者通过“从文本到语音的应用(Sprchausgabe von Text)”而朗读出来。识别的可靠性首先是基于笔划宽度或者说文字大小的标准化。接着对文字进行描 摹,其中在描摹框架内识别出原本的文字。该识别方法的可靠性通过不同求解步骤的组合 而得到。通过对笔划宽度的标准化,阴影效果和较差的光照条件几乎不会对识别速度产生 影响。通过文字大小的标准化,例如对远距离标牌的影响可以得到补偿。借助描摹,人们通 过简单、开销较小、但可扩展的解树(Losungsbaume )得到了正确的文字或数字。为了 得到更为可靠的结果,还可以附带地采用词典。通过反馈已知的词汇,可以相应地对原件的 解树和笔划宽度进行优化。为了解决该问题,执行下述步骤。首先,利用图像记录单元(例如(XD照相机)将图像转换成电信号。然后按照专 利DE10113880B4所述的方法将这些信号放入一个具有优先级的阵列中。可选的是,可以附 带地在优先级中加入一个位置因子。像素组越靠近起始像素,则这个位置因子越大。在西 方语言(英语、德语、法语)中,起始像素首先位于所述阵列的左上角。与以事先确定的像素组形式工作的专利DE1013880B4不同的是,这里的像素组也 可以在识别过程期间改变。像素组的一个例子是一行水平排列的像素,其长度取决于双倍 的亮度改变。在要识别明亮背景上的深色文字的情况下,则在第一个明-暗过渡和跟在其 后的暗_明过渡之间的间距就是所设定的笔划宽度的大小。所设定的相同笔划宽度的像素 组被分别组合到一个单独的列表中。为了提高所述方法克服像素错误的可靠性,可以附带 地用一个低通滤波器来工作。在这种滤波器的情况下,分别对n个相邻的像素求和,以找到 相应的明_暗或暗_明过渡。通过求和,使得可能存在的像素错误或者由于强烈的噪声而引起的错误得以显著减少。为了识别文字,近似的像素组被分别组合到一个单独的列表中。以下述方式对每 个如此得到的列表进行排序使得Y位置较低的像素组排位下降。如果有多个近似的像素 组处于相同的Y位置,则对这些像素组生成一个新的列表。现在试图由这些列表推导出相 应的向量。其中从各个列表中找出具有最低Y值和最高Y值的像素组。现在在这些像素组 位置之间计算出一条直线。接着确定其它像素组与这条直线的偏离。如果所有的偏离都在 一个确定的阈值以下,则对于这些列表找到了一个描述向量。如果所述偏离超过了阈值,则 对本文档来自技高网...

【技术保护点】
一种用于OCR识别的方法,该方法执行下述步骤:a)通过形成面向像素组的列表识别笔划,其中所述列表分别表述单个的笔划;b)基于所生成的列表描摹文字;c)在描摹文字时将移动顺序与保存在一个解树中的标准化的参考文字进行比较。

【技术特征摘要】
【国外来华专利技术】DE 2007-11-5 102007052622.0一种用于OCR识别的方法,该方法执行下述步骤a)通过形成面向像素组的列表识别笔划,其中所述列表分别表述单个的笔划;b)基于所生成的列表描摹文字;c)在描摹文字时将移动顺序与保存在一个解树中的标准化的参考文字进行比较。2.一种用于分析图像数据的方法,所述图像数据由各个像点(像素)的阵列组成,其中 每个像素具有一个随时间变化的像素值,该像素值描述了该像素的颜色或亮度信息,其中执行下述步骤a)通过确定所使用的作为参考像素的像素,并借助该参考像素的相应的当前像素值相 对于先前确定的由相邻像素组成的像素组的当前像素值计算像素差值,从而为所述阵列中 的每个像素确定一个优先值;b)将用于计算优先值的像素组合到一个像素组中;c)借助所分配的参考像素的优先值对像素组进行排序,并放入到一个优先级阵列中;d)根据优先级阵列中像素组的优先级保存和/或传输该像素组,其中为了优化计算效 率仅使用一部分像素组来形成所述列表,其特征在于,在优先值中附带地加入一个位置因 子,像素组越靠近根据语言预先规定的起始像素,则位置因子越大。3.如权利要求2所述的方法,其特征在于,所述像素差值由像素组中所考察的像素的 像素值与数个其所考察的相邻像素的像素值之间的差得到。4.如权利要求2或3所述的方法,其特征在于,所述像素差值能够得出关于笔划宽度的 结论。5.如权利要求1至4中任一项所述的方法,其特征在于,由近似的像素组形成列表。6.如权利要求2至5中任一项所述的方法,其特征在于,在步骤la)至Id)之后执行下 述步骤首先执行学习式的像素分组优化的预处理,该预处理在图像中搜索笔划,随后试图尽 可能最优地对这些笔划进行描摹,然后通过所存储的搜索词/解树由移动顺序得出关于相 应字符的结论。7.如权利要求2至5中任一项所述的方法,其特征在于,在步骤la)至Id)之后执行下 述步骤近似的像素组被分别组合到一个单独的列表中,并以下述方式对每个如此得到的列表 进行排序使得Y位置较低的像素组排位下降,其中当有多个近似的像素组处于相同的Y位 置时,对这些像素组生成一...

【专利技术属性】
技术研发人员:G莫萨科斯基
申请(专利权)人:T移动国际股份公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1