文本检测方法和设备技术

技术编号:16176068 阅读:25 留言:0更新日期:2017-09-09 03:20
本发明专利技术涉及文本检测方法和设备,能够支持多语言,且能够以高精度识别文本。根据本发明专利技术的文本检测方法包括:对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;对提取的连通域进行组合,以检测水平行和垂直行;以及针对检测到的结果进行滤波,以消除噪声。

【技术实现步骤摘要】
文本检测方法和设备
本专利技术涉及文本检测技术,更具体地,涉及一种从自然场景图像中检测文本的方法和设备,能够支持多语言,且能够检测水平行和垂直行。
技术介绍
随着信息技术的发展,电子设备(例如,个人数字助理、手持电脑、手机)等的使用在人们的生活中越来越普及。配备有摄像装置的电子设备的使用也越来越普及。当人们通过摄像装置拍摄自然场景图像时,可能需要对所拍摄的图像中的文本行进行识别。中国专利申请201410334436.4提出了一种中文文本定位设备,其可以从自然场景图像中提取文本。其中,通过最大稳定极值区域MSER方法对图像进行二值化,并根据中文字符的特征来检测文本。但是,所提取的文本局限于中文字符。现有的文本检测方法局限于一种或某几种特定语言,而无法普适于所有语言。当在图像中出现未知语言时,得到的结果非常差。此外,现有的文本检测方法通常仅能够处理水平行,而无法同时处理水平行和垂直行。以高精度来检测自然场景图像中的文本非常困难。一方面,在图像中可能存在非常多的非文本内容,而这些内容可能导致大量噪声并降低检测精度。另一方面,真实世界中的文本具有各种各样的布局和大小,这种复杂的情况非常难以处理。因此,需要一种能够支持多语言且能够检测水平行和垂直行的文本检测机制。
技术实现思路
本公开提出了一种文本检测方法和设备,能够支持多语言,且能够检测水平行和垂直行。根据本专利技术的一个方面,提出了一种文本检测方法,包括:对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;对提取的连通域进行组合,以检测水平行和垂直行;以及针对检测到的结果进行滤波,以消除噪声。优选地,通过最大稳定极值区域MSER方法对待检测的图像进行二值化。优选地,所述连通域的特征至少包括以下之一:外界矩形;前景面积;前景面积与外界矩形的面积之比;笔画粗细;以及连通域的颜色。优选地,在提取连通域之后,所述方法还包括:从提取的连通域中移除具有明显不属于文本的特征的连通域。优选地,检测水平行和垂直行包括:先检测水平行,然后检测垂直行。优选地,检测水平行包括:根据连通域的特征,将水平相距小于第一阈值的相邻的连通域组合为一个候选水平子行;根据第二阈值,将水平相距小于第二阈值的相邻的候选水平子行组合为一个候选水平行;将候选水平行中连通域的数量大于2的行作为水平行,并将剩余的行作为垂直行候选项。优选地,检测垂直行包括:将垂直距离小于第三阈值的相邻的垂直行候选项组合为一个候选垂直子行;根据第四阈值,将垂直距离小于第四阈值的相邻的候选垂直子行组合为一个候选垂直行;将候选垂直行中连通域的数量大于或等于3的行作为垂直行。优选地,针对检测到的结果进行滤波,以消除噪声包括:根据预设的噪声特征,识别检测到的结果中存在的具有预设的噪声特征的行,并从结果中移除所识别的行。根据本专利技术的另一方面,提出了一种文本检测设备,包括:文本提取模块,被配置为对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;行检测模块,被配置为对提取的连通域进行组合,以检测水平行和垂直行;以及后处理模块,被配置为针对检测到的结果进行滤波,以消除噪声。与现有技术不同,根据本专利技术实施例的文本检测方法和设备在多个方面改善了文本检测的性能,至少包括:1.不局限于某种或某些特定语言,而可以识别任何语言的文本行;2.能够同时检测存在的水平行和垂直行;3.可以以高精度定位文本行。附图说明通过下面结合附图说明本专利技术的优选实施例,将使本专利技术的上述及其它目的、特征和优点更加清楚,其中:图1是示出了根据本专利技术实施例的文本检测设备的示意框图。图2示出了一个示例的待检测的图像。图3示出了图2所示的待检测的图像的二值化结果和连通域。图4示出了图3所示的二值化结果中移除了明显不属于文本的特征的连通域后的结果。图5示出了图2所示的待检测的图像的行检测结果。图6示出了另一个示例的待检测的图像和行检测结果。图7示出了根据本专利技术实施例的文本检测方法的流程图。图8示出了利用根据本专利技术实施例的文本检测方法的一个应用示例。具体实施方式以下参照附图,对本专利技术的示例实施例进行详细描述。在以下描述中,一些具体实施例仅用于描述目的,而不应该理解为对本专利技术有任何限制,而只是本专利技术的示例。在可能导致对本专利技术的理解造成混淆时,将省略常规结构或构造。图1是示出了根据本专利技术实施例的文本检测设备100的示意框图。该文本检测设备100包括:输入模块110,被配置为输入待检测的图像;文本提取模块120,被配置为对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;行检测模块130,被配置为对提取的连通域进行组合,以检测水平行和垂直行;以及后处理模块140,被配置为针对检测到的结果进行滤波,以消除噪声。根据本实施例的文本检测设备100可以在诸如智能电话、写字板、笔记本或其他手持电子设备上实现。输入模块110用于输入待检测的图像。例如,输入模块110可以是智能电话上的摄像机,用于拍摄自然场景图像,作为待检测的图像。又例如,输入模块110可以是笔记本上的通信模块,用于从外部接收待检测的图像。图2示出了一个示例的待检测的图像。文本提取模块120被配置为通过从待检测的图像中提取连通域,来进行文本提取。根据一个实施例,文本提取模块120被配置为通过最大稳定极值区域MSER方法对待检测的图像进行二值化,得到二值化的图像。然后从图像中提取连通域,并得到连通域的特征。图3示出了图2所示的待检测的图像的二值化结果和连通域。连通域的特征至少包括以下之一:外界矩形;前景面积;前景面积与外界矩形的面积之比;笔画粗细;以及连通域的颜色。外界矩形是能够将一个连通域包围起来的最小矩形区域。前景面积是一个连通域的面积。笔画粗细表示连通域中的笔画的粗细。连通域的颜色表示该连通域在原始图像中的颜色。这些特征并不与特定的语言类型相关,因此文本检测设备100可以普适于多种语言。这些连通域的特征可用于进行行的检测和噪声消除。文本检测模块120还被配置为:从提取的连通域中移除具有明显不属于文本的特征的连通域。例如,当检测到一条直线时,其高宽比明显与其它的连通域的宽高比不同。因此,可以将其从提取的连通域中删除。再例如,当检测到一个噪声点时,其所占像素数目明显小于其他的连通域所占的像素数目。因此,可以将其从提取的连通域中删除。移除这些连通域以提高检测精度。图4示出了图3所示的二值化结果中移除了明显不属于文本的特征的连通域后的结果。可以预先设置文本的特征,以便在提取到连通域之后对提取的连通域进行过滤。当然,例如作为输入模块的摄像机可以输入所拍摄的图像的信息,文本检测模块可以根据图像的信息对提取的连通域进行过滤。图像的信息包括例如图像的像素数目、图像的宽度、高度等。行检测模块130被配置为对提取的连通域进行组合,以检测水平行和垂直行。可以分别处理水平行和垂直行。在现实世界中,水平行出现的概率远高于垂直行出现的概率。因此,可以首先检测水平行以确保水平行检测相比于垂直行检测具有较高的优先级。针对水平行检测,其算法如下。根据连通域的特征,将水平距离小于第一阈值的相邻的连通域组合为一个候选水平子行;根据第二阈值,将水平距离小于第二阈值的相邻的候选水平子行组合为一本文档来自技高网...
文本检测方法和设备

【技术保护点】
一种文本检测方法,包括:对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;对提取的连通域进行组合,以检测水平行和垂直行;以及针对检测到的结果进行滤波,以消除噪声。

【技术特征摘要】
1.一种文本检测方法,包括:对待检测的图像进行二值化,以得到二值化图像并提取连通域,得到连通域的特征;对提取的连通域进行组合,以检测水平行和垂直行;以及针对检测到的结果进行滤波,以消除噪声。2.根据权利要求1所述的文本检测方法,其中,通过最大稳定极值区域MSER方法对待检测的图像进行二值化。3.根据权利要求1所述的文本检测方法,其中,所述连通域的特征至少包括以下之一:外界矩形;前景面积;前景面积与外界矩形的面积之比;笔画粗细;以及连通域的颜色。4.根据权利要求1所述的文本检测方法,其中,在提取连通域之后,所述方法还包括:从提取的连通域中移除具有明显不属于文本的特征的连通域。5.根据权利要求1所述的文本检测方法,其中,检测水平行和垂直行包括:先检测水平行,然后检测垂直行。6.根据权利要求5所述的文本检测方法,其中,检测水平行包括:根据连通域的特征,将水平相距小于第一阈值的相邻的连通域组合为一个候选水平子行;根据第二阈值,将水平相距小于第二阈值的相邻的候选水平子行组合为一个候选水平行;将候选水平行中连通域的数量大于2的行作为水平行,并将剩余的行作为垂直行候选项。7.根据权利要求6所述的文本检测方法,其中,检测垂直行包括:将垂直距离小于第三阈值的相邻的垂直行候选项组合为一个候选垂直子行;根据第四阈值,将垂直距离小于第四阈值的相邻的候选垂直子行组合为一个候选垂直行;将候选垂直行中连通域的数量大于或等于3的行作为垂直行。8.根据权利要求1所述的文本检测方法,其中,针对检测到的结果进行滤波,以消除噪声包括:根据预设的噪声特征,识别检测到的结果中存在的具有预设的噪声特征的行,并从结果中移除所识别的行。9.一种文本检测设备,包括:文本提取模块,被配置为对待检测的图像进行二值化,以得到二值化图像并提取连通域,得...

【专利技术属性】
技术研发人员:张庆久乐宁吴波江淑红
申请(专利权)人:夏普株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1