文本增强制造技术

技术编号:2950695 阅读:183 留言:0更新日期:2012-04-11 18:40
在一种文本增强的方法中,在一幅图像检测(SW,Det)到文本,该图像进行比例缩放(Scal),以将该图像的像素/行和行/图像的第一个数值调整到像素/行和行/图像的第二个数值,其中该第二个数值适合于一个在其上显示该图像的显示器(D),而且取决于文本检测的结果对图像进行处理(Post-proc)。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
在IEEE,Proceedings of the international conference onacoustics,speech,and signal processing(ICASSP),NY,1995年第20卷(vol.20)第2395-2398页上,W.W. Cindy Jiang所写的文章“Thresholding and enhancement of text images forcharacter recognition”中,公开了一种用于字符识别、将低空间分辨率的灰色文本图像转换成较高空间分辨率的二值图像的方案。其中使用了一个可变阈值技术及形状滤波。据说,绝大多数光字符识别系统在试图识别之前执行输入的二值化,而且通常假定文本图像是二元的。在日本的Systems and Computers,1993年第24卷第2期(Vol.24,No.2,)第35-44页中,由S.Ochuchi等人所写的文章“Asegmentation method for composite text/graphics(halftoneand continuous tone photographs)documents”中,公开了当为数字复印机以及传真机处理包含文本、半色调及连续色调相片的混合物的复合文档时,理想地,文本部分能够从图形部分中分离出来,而且能够比多位像素位图表示更有效地表现出来。现今数字显示设备越来越频繁地是矩阵设备,例如液晶显示器,其中每个像素都映射到该屏幕的一个位置上,该屏幕在光栅数据和显示器点之间具有一一对应关系。这种技术隐含着对一个比例缩放系统的使用,以改变输入视频/图像信号的格式从而使它满足该设备的尺寸,即它的像素数目。该比例缩放块以一个滤波器组为基础,其中当缩放系数改变时该滤波器组执行像素插值。实际上,市场上可用的解决方案在该图形光栅上应用一个一致处理,这会导致一个具有不可避免的人工因素结果。一般低通滤波能够减少象素效应,也称为在对角线上的交替效果,而且能够防止信号由于二次采样而导致失真,但是它们也引入了其它令人讨厌的影响例如使图像变得模糊。它取决于显示信号的内容,与由于不可避免而优先考虑的、察觉到的人工因素及人工因素种类有关。特别地,本专利技术的一个目的是提供一种简易的文本增强,用于需要一个比例缩放操作的显示器。为此,本专利技术提供了如独立权利要求中定义的文本增强。在从属权利要求中定义了有益实施例。从上述观察开始,这里提供了一种新颖的方法,它能够考虑图像的内容,而且仅仅在需要的地方应用一个特别的后处理。所以,根据本专利技术,在比例缩放操作之后的文本增强以比例缩放操作之前的文本检测为基础。该处理仅仅在文本区域内有效。这个专利技术的一个可行应用范围是在LCD设备的情况下,当,而且一般都是这种情况,我们不想影响该显示信号的其它部分时,增强文本可读性。这里介绍的技术的一个显著特征是它相当低的计算复杂度。这个方面就价格/性能比而言决定了一个高效率。事实上,根据平均用户的感觉,在没有相当大地影响它的成本的情况下,在另一个实现调整矩阵显示设备输入大小所需要的全部数字处理的电路中插入该建议的算法,可能会提高显示质量。应当注意到,虽然在一个实施例中发生了二值化,但是这个二值化仅仅在已经检测到文本的区域中进行,而在现有技术中,二值化是在字符能够被识别出来之前进行的一个预备步骤。参考以下描述的这些实施例,本专利技术的这些及其它方面将会变得明显并得到阐明。在这些附图中附图说明图1-3说明了一个形状滤波器的操作;以及图4显示了根据本专利技术的一个系统的框图。本专利技术提出了一种文本检测算法的设计,它和一个后处理块一起用于文本增强。可以表明,就内容可读性而言,本专利技术显著地提高了性能,而且导致整个显示信号的良好感知结果,同时保持整个比例缩放系统的计算复杂度相当的低。这个文档剩余部分的组织结构如下。首先将简要地概述一般的比例缩放问题以及当前可用的算法。其后将介绍关于通过一个非整数系数进行格式转换的概念。接着将描述该后处理块,其特征为阈值操作和形状滤波,并且将描述它的特征。最后将介绍文本搜索策略,并且将阐明该检测算法以及它与先前介绍的后处理块的协作。总的框架将图片调整大小为一个不同比例需要格式转换。这个操作涉及公知的、当前用于完成它的再采样理论和经典的滤波过程。滤波避免了频率上的失真问题,为由在原始范围中的采样操作所引入的循环释放空间。在插值滤波器系列当中,通常使用一阶多项式插值器,其中重建的像素是最邻近像素值的一个加权平均值。这种滤波器也被称作有限脉冲响应滤波器。在标准显示设备内部,格式转换问题通常也面临着线性滤波。一类特别简单的F.I.R.滤波器在两个可用像素之间重建像素,其值位于这两个相邻点的连线上。还存在许多其他可能的技术。例如具有更复杂加权函数的像素再现或者多项式插值。利用这些不同解决方案处理的图象的质量感觉实际上通常是不高的,这里存在不能够完全避免的减损和人工因素。这个考虑隐含着,为了到达一个可接受的或是最好的、令人满意的价格/性能比,应进行一些折衷。在过去,最简单的解决方案通过使用像素再现解决了该问题。一个最近的解决方案,参见Philips换算器PS6721,仍然运用线性滤波,但是具有一个稍微不同形状的脉冲响应,以提高该变换斜率。测量阶跃响应的上升时间是一种评估插值器在一个边缘面前性能的经典方法。事实上低通滤波器改变了边沿斜率,并且作为一个模糊效应会察觉到一个平滑斜率。此外,这个惹人讨厌的人工因素的实际影响取决于被显示信号的种类。实际上在自然图像的情况下,一个模糊效应在某个测量中是可以容许的。然而就仿真图形来说,只有当其内容需要接近一种逼真效果时(这是虚拟现实和3D游戏的情况),一种稍微光滑的效果是可取的。在这种情况下,滤波被用作一个防失真处理过程。为了同样的理由,这类滤波器被用在文本/字符上以避免象素效应影响,也称为在对角线上的交替影响。插值滤波器也是防失真滤波器,因为它们减少了该输入信号的最高频率。此外,倘若在一个白色背景上有一个黑色文本,由这类滤波器引入的灰度级数值应该是该黑色引文的一个较小百分数。如果不是这种情况的话,我们将具有一个人工效应而不是一个图片增强,而且感知的图像会变得模糊。例如,当双线性插值以及更复杂的滤波如双三次滤波被用在小字符(一般使用的大小为10~12点)及细线条上时,它们看起来会散焦。在所有这些情况中,看起来最好就根本不使用滤波器,至少不使用实际上使用的低通滤波器。从上述考虑开始,我们能够得出结论因为格式转换需要再取样,所以滤波过程是不可避免的,为解决上述的问题,我们不得不找出其它的解决方案。在文本情况下,一种简单的想法是在该换算器之后应用一个后处理模块,以在发现字符的地方清除所有的灰度级。由于比例变化,这个操作不能仅仅使用一个简单的阈值块来执行。事实上阈值是一个非线性的运算符,当它把灰度级字符转换为二元值时,会引入不均匀的图形,这是值得高度注意的另一个人工因素。形状滤波是一种有趣类型的运算符,它能够把没有规则的图形转变成更有规则的图形。将在下一节中对它们进行介绍。用一个合理系数进行格式转换在当今的数字显示设备中,图像频繁地用一个像素矩阵表示出来,所以一个固定的图片格式是必需的。当具有一个本文档来自技高网...

【技术保护点】
一种文本增强的方法,包含如下步骤:在一幅图像中检测(SW,Det)文本;将该图像进行比例缩放(Scal),以把该图像的像素/行和行/图像的第一个数值调整为像素/行和行/图像的第二个数值,该第二个数值适合于在其上显示该图像的一个显示器 (D);以及取决于文本检测步骤的结果,处理(Post-proc)该图像。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:P卡赖P瓦勒A萨蒂S图巴罗
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1