文本增强方法及装置、文本提取方法及装置制造方法及图纸

技术编号:8106169 阅读:162 留言:0更新日期:2012-12-21 05:20
本发明专利技术实施例公开了文本增强方法及装置、文本提取方法及装置,所述文本增强方法包括:获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到原始图像的滤波后的更新亮度值或/和颜色值,邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与原始图像对应的文本增强图像。通过本发明专利技术实施例,可以增强原始图像中包括的文本,以使后续针对该文本增强图像进行的文本提取更为精确和准确。

【技术实现步骤摘要】

本专利技术一般地涉及图像处理
,尤其是文本增强方法及装置、文本提取方法及装置
技术介绍
在播放视频的过程中,或者在欣赏图像时,视频或者图像中往往会包含文本说明,例如,是对一段视频的发生时间和地点的说明,或者对于图像的解说等。而这些文本内容因为与视频或图像密切相关,所以提取视频或图像中的文本就成为至关重要的技术。现有技术中进行视频或图像的文本提取方法,可以以二值化、边缘颜色聚类和检测技术为基础,针对图像或视频中的文本进行提取。 但是,现有技术在进行文本提取时,由于视频或图像中可能会存在过多的噪音,图像或视频模糊,甚至如果一段视频中存在光照变化,都会使得图像或视频中的文本与背景边界模糊,或者文本内容本身不够清楚,从而影响文本提取的效果。因此,如何能对原始图像或视频中的文本进行增强处理,以增强图像或视频中的文本,进一步的优化文本提取的效果,已成为现有技术中亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例提供了文本增强方法及装置、文本提取方法及装置,能够对包括一行文本的原始图像中的文本进行增强处理,使得原始图像中的文本更加明显,进一步还可以优化文本提取的效果。根据本专利技术实施例的一个方面,提供一种文本增强方法,包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像。根据本专利技术实施例的另一个方面,提供一种文本增强装置,包括获取模块,用于获取包括一行文本的原始图像;滤波模块,用于依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;替换模块,用于将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像。根据本专利技术实施例的再一方面,提供一种文本提取方法,包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值;所述邻域集的范围为以原始像素点为中心且边长为W的正方形;所述W小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像;提取所述文本增强图像中的文本。根据本专利技术实施例的再一方面,提供一种文本提取装置,包括获取模块,用于获取包括一行文本的原始图像;滤波模块,用于依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为W的正方形,所述W小于所述原始图像的高度;替换模块,用于将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像;提取模块,用于提取所述文本增强图像中的文本。另外,根据本专利技术的另一方面,还提供了一种存储介质。所述存储介质包括机器可 读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本专利技术的上述文本增强方法及文本提取方法。此外,根据本专利技术的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本专利技术的上述文本增强方法及文本提取方法。根据本专利技术实施例的上述一种文本增强方法,得到的文本增强图像中的像素点中的文本笔画进行了增强,增强了笔画内部像素的一致性且加深文本与背景差异度,即增强了原始图像中包括的文本,从而可以使后续针对该文本增强图像进行的文本提取更为精确和准确。根据本专利技术实施例的上述一种文本提取方法,基于得到的文本增强图像进行文本提取,不仅使得文本提取的结果更为精确和准确,也因为降低了文本提取的复杂度,所以提升了文本提取的效率。在下面的说明书部分中给出本专利技术实施例的其他方面,其中,详细说明用于充分地公开本专利技术实施例的优选实施例,而不对其施加限定。附图说明下面结合具体的实施例,并参照附图,对本专利技术实施例的上述和其它目的和优点做进一步的描述。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。图I是示出作为本专利技术实施例提供的第一种文本增强方法的流程图;图2是示出作为第一种文本增强方法中步骤S102的流程图;图3是示出作为本专利技术实施例提供的第二种文本增强方法的流程图;图4是示出作为第二种文本增强方法中步骤S302的一种流程图;图5是示出作为第二种文本增强方法中步骤S302的另一种流程图;图6是示出作为第二种文本增强方法中步骤S302的再一种流程图7是示出作为第二种文本增强方法中步骤S302的又一种流程图;图8是示出作为第二种文本增强方法中步骤S304的流程图;图9是示出作为本专利技术实施例提供的第一种文本增强装置的示意图;图10是示出作为第一种文本增强装置中滤波模块902的示意图;图11是示出作为本专利技术实施例提供的第二种文本增强装置的示意图;图12是示出作为第二种文本增强装置中笔画极性估计模块1101的示意图;图13是示出作为第二种文本增强装置中笔画极性估计模块1101的另一示意图;图14是示出作为第二种文本增强装置中笔画极性估计模块1101的再一示意图; 图15是示出作为第二种文本增强装置中笔画极性估计模块1101的又一示意图;图16是示出作为第二种文本增强装置中判断模块1102的示意图;图17是示出作为本专利技术实施例提供的文本提取方法的流程图;图18是示出作为本专利技术实施例提供的文本提取装置的示意图;图19是示出作为本专利技术的实施例中所采用的信息处理设备的个人计算机的示例性结构的框图。具体实施例方式下面参照附图来说明本专利技术的实施例。具体的,参见图1,本专利技术实施例提供了第一种文本增强方法,具体可以包括SlOl :获取包括一行文本的原始图像。在本专利技术实施例中,所述的文本增强是指对包括一行文本的原始图像中的文本进行增强处理。这里的增强可以理解为,加深文本的边缘,或者突出文本与背景的区别等。本专利技术实施例在应用时,考虑了文本的笔画表象(例如亮度或颜色等)和其形状(例如文本呈现条纹状)信息,以期达到增强笔画内部像素的一致性且加深文本与背景差异度的效果OS102:依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以本文档来自技高网...

【技术保护点】
一种文本增强方法,包括:获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像。

【技术特征摘要】
1.ー种文本增强方法,包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画ニ维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为W的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和顔色值,以生成与所述原始图像对应的文本增强图像。2.根据权利要求I所述的方法,其中,所述对所述各个原始像素点的原始亮度值或/和颜色值进行笔画ニ维滤波的步骤,包括将所述原始像素点与各个邻域像素点的原始亮度值或/和顔色值进行代数相减以获取所述直接差异度;依据所述原始像素点到其邻域集的各个邻域像素点的梯度模值,获取所述间接差异度;根据所述直接差异度和间接差异度计算各个邻域像素点对于所述原始像素点的亮度值或/和颜色值的权重值;采用如下笔画ニ维滤波公式计算所述原始像素点的更新亮度值;3.根据权利要求I所述的方法,其中,所述获取包括一行文本的原始图像之后,还包括估计所述原始图像中文本的笔画极性,所述极性表示位于笔画区域内部像素点与笔画区域外部像素点之间的亮度值或/和颜色值的大小关系;以及所述得到所述原始图像的滤波后的更新亮度值或/和颜色值之后,还包括判断所述滤波后的更新亮度值或/和颜色值与所述笔画极性是否匹配,如果是,则执行所述替换所述原始亮度值或/和颜色值的步骤。4.根据权利要求3所述的方法,其中,在所述极性表示笔画区域内部像素点与笔画区域外部像素点之间的亮度值大小关系的情况下,所述估计原始图像中文本的笔画极性的步骤,包括在水平方向、竖直方向以及两个对角线方向上分別采用如下公式计算笔画响应强度5.根据权利要求3所述的方法,其中,在所述极性表示笔画区域内部像素点与笔画区域外部像素点之间的颜色值大小关系的情况下,所述估计原始图像中文本的笔画极性的步骤,包括在水平方向、竖直方向以及两个对角线方向上分別采用如下...

【专利技术属性】
技术研发人员:潘屹峰胜山裕孙俊直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1