用于从图像中提取文本笔划图像的方法和装置制造方法及图纸

技术编号:8047022 阅读:306 留言:0更新日期:2012-12-06 17:17
本发明专利技术提供一种用于从图像中提取文本笔划图像的方法和装置。根据本发明专利技术的一个方面,提供了一种用于从图像中提取文本笔划图像的方法,包括:获取图像的边缘信息和梯度信息;对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化图像中与文本有关的边缘信息和梯度信息;以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,更具体地涉及用于从图像中提取文本笔划图像的方法和装置
技术介绍
在当今的信息处理领域中存在大量的视频文件。存在对这些视频文件进行有效地检索的需要。对于视频标注、视频搜索等,视频中的文本信息是准确又简单的线索。因此,如何准确地提取并且识别视频中所包含的文本信息,对后续的视频标注、视频检索非常重要。已知的一些提取文笔笔划的技术,存在速度慢、噪声大、对笔划尺度不敏感等缺点。 需要能够解决上述问题的用于从图像中提取文本笔划图像的方法和装置。
技术实现思路
在下文中给出关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的目的在于,提供一种用于从图像中提取文本笔划图像的方法和装置。根据本专利技术的一个方面,提供了一种用于从图像中提取文本笔划图像的方法,包括获取图像的边缘信息和梯度信息;对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化图像中与文本有关的边缘信息和梯度信息;以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。根据本专利技术的另一个方面,提供了一种用于从图像中提取文本笔划图像的装置,包括信息获取单元,用于获取图像的边缘信息和梯度信息;强化单元,用于对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化图像中与文本有关的边缘信息和梯度信息;以及笔划图像获得单元,用于获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。另外,本专利技术的实施例还提供了用于实现上述方法的计算机程序。此外,本专利技术的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。通过以下结合附图对本专利技术的最佳实施例的详细说明,本专利技术的这些以及其他优点将更加明显。附图说明参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。图I是示出根据本专利技术实施例的用于从图像中提取文本笔划图像的方法的流程图;图IA是示意性地示出阶跃信号、脉冲信号、与索贝尔算子对应的信号、利用索贝尔算子提取阶跃信号的提取结果、利用索贝尔算子提取脉冲信号的提取结果、对阶跃信号的提取结果取绝对值后得到的信号、对脉冲信号的提取结果取绝对值后得到的信号、以及相应的经偏移的信号的示意图;图2是示出根据本专利技术实施例的通过利用索贝尔算子从图像中提取文本笔划图像的方法的流程图;图3是示出待处理的原始图像;图4A-图4H是示出用索贝尔算子卷积后得到的图像; 图5A-图是示出通过对经索贝尔算子处理后的图像向相对方向偏移并合成偏移后的图像所得到的四张图像;图6A-图6D是示出通过对经索贝尔算子处理后的图像向相反方向偏移并合成偏移后的图像所得到的四张图像;图7是示出整合后所得到的细笔划图像;图8是示出整合后所得到的粗笔划图像;图9是示出通过过滤处理得到的粗笔划图像;图10是示出根据本专利技术实施例的用于从图像中提取文本笔划图像的装置的框图;图11是示出根据本专利技术实施例的通过利用索贝尔算子从图像中提取文本笔划图像的装置的框图;以及图12示出了可以用于实施本专利技术的用于从图像中提取文本笔划图像的方法和装置的计算设备的举例的结构图。具体实施例方式下面参照附图来说明本专利技术的实施例。在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本专利技术无关的、本领域普通技术人员已知的部件和处理的表示和描述。以下参照图I来描述根据本专利技术实施例的用于从图像中提取文本笔划图像的方法。图I是示出根据本专利技术实施例的用于从图像中提取文本笔划图像的方法的流程图。如图I所示,在步骤S102中,可以获取图像的边缘信息和梯度信息。优选地,可以对代表图像的边缘信息和梯度信息的阶跃信号或脉冲信号进行分析,并根据分析结果来提取边缘信息和梯度信息。在图像中,细笔划的图像数据可以呈现为脉冲信号,粗笔划的图像数据和类似于粗笔划的大尺度对象可以呈现为阶跃信号。可以对脉冲信号进行分析,并根据其分析结果来提取细笔划的边缘信息和梯度信息。此外,可以对阶跃信号进行分析,并根据其分析结果来提取粗笔划的边缘信息和梯度信息,并提取类似于粗笔划的大尺度对象的边缘信息和梯度 目息。以下参照图IA来描述利用索贝尔算子提取阶跃信号的过程和利用索贝尔算子提取脉冲信号的过程,以及通过偏移处理和合成处理执行加强处理的过程。图i示出了阶跃信号,图ii示出脉冲信号,图iii和图iv示出与索贝尔算子对应的信号,图V示出利用索贝尔算子提取阶跃信号的提取结果,图Vi示出利用索贝尔算子提取脉冲信号的提取结果,图Vii示出对阶跃信号的提取结果取绝对值后得到的信号,图Viii示出对脉冲信号的提取结果取绝对值后得到的信号,以及图ix和图X相应的经偏移的信号的示意图。应理解,图IA中的坐标及大小仅是示意性的而非限制性的,并且仅旨在示出相关信号处理的原理。 如图IA所示,通过利用索贝尔算子(如图iii所示)提取阶跃信号(如图i所示),可以获得单一的谷状信号(如图V所示),而通过利用索贝尔算子(如图iv所示)提取脉冲信号(如图ii所示),可以获得谷状信号和峰状信号结合的信号(如图Vi所示)。可见,通过利用索贝尔算子来提取阶跃信号和脉冲信号,可以相应获得差异较大的两种信号(如图V和图vi所示)。然后,通过稍后描述的强化处理(例如,包括偏移处理和合成处理)可以强化阶跃信号和脉冲信号,从而提取与脉冲信号对应的细笔划的图像数据以及与阶跃信号对应的粗笔划的图像数据。例如,可以对利用索贝尔算子提取出的脉冲信号中的谷状信号(如图Vi所示)取绝对值(即,取谷状信号的大小),得到另一峰状信号(如图Viii所示)。然后将该另一峰状信号和原峰状信号部分(即,利用索贝尔算子提取到的峰状信号)向相对方向偏移,并将偏移后的该另一峰状信号和原峰状信号相叠加(如图X所示),从而可以再次加强与该脉冲信号对应的细笔划的图像数据。此外,可以对利用索贝尔算子提取出的阶跃信号中的谷状信号(如图V所示)取绝对值,得到又一峰状信号(如图Vii所示)。然后偏移该又一峰状信号(如图ix所示)。可选地,可以基于预定的过滤条件过滤掉类似于粗笔划的大尺度对象的边缘信息和梯度信息,而只留下粗笔划的边缘信息和梯度信息。具体的过滤处理将稍后描述。可选地,可以根据图像的清晰程度或在需要的情况下,对如图3所示的原始图像进行滤波。例如,可以利用低通滤波器对原始图像进行滤波,以抑制图像中的噪声。低通滤波器例如可以是高斯滤波器,但是低通滤波器不限于此,而可以是本领域技术人员已知的任何适当的低通滤波器。在步骤S104中,可以对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化图像中与文本有关的边缘信息和梯度信息。可以基于各种方法来对边缘信息和梯度信息进行加强处理。优选地,可以通过二值化处理和整合处理来对边缘信息和梯度信息进行加强。此处的整合本文档来自技高网...

【技术保护点】
一种用于从图像中提取文本笔划图像的方法,包括:获取所述图像的边缘信息和梯度信息;对所获取的边缘信息和梯度信息进行预定的加强处理,从而强化所述图像中与文本有关的边缘信息和梯度信息;以及获得与经强化的边缘信息和梯度信息相对应的文本笔划图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:桂天宜皆川明洋胜山裕孙俊堀田悦伸直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1