【技术实现步骤摘要】
本专利技术一般地涉及图像处理。具体而言,本专利技术涉及一种能够对图像中的文本区域进行定位的方法和装置。
技术介绍
在对图像进行编制索引、检索、 分类等各种应用中,需要从图像中提取关于图像内容的信息。图像中通常具有文本信息,这些文本信息与图像的内容具有较高的相关性。因此,获取这些文本信息对图像的应用来说是重要的。通常,首先对图像中的文本区域进行定位,然后对文本区域所在的图像块进行提取及光学字符识别(OCR)处理,以获得文本信息。图像可分为自然场景图像和人工添加文本图像。人工添加文本的图像由于有人工参与,故从中定位文本区域相对简单。自然场景图像由于以像素为单位,难以区分文本区域的像素与非文本区域的像素,故从中定位文本区域难度很大。本专利技术着眼于对图像中的文本区域进行定位,能够处理包括自然场景图像在内的较为复杂的图像。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出 ...
【技术保护点】
一种图像中文本区域定位方法,包括如下步骤:估计输入图像中每个像素周围可能存在的文本大小;根据所述文本大小和区域差异度从所述输入图像中提取候选笔划区域;从所述候选笔划区域中确定真实笔划区域;以及合并所述真实笔划区域以形成文本区域。
【技术特征摘要】
【专利技术属性】
技术研发人员:潘屹峰,朱远平,孙俊,直井聪,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。