The present invention provides a method and device for text detection. The method is used for locating the text region in the natural scene image. Its public content involves text detection methods and devices, and text information extraction methods and systems. The method for text detection in images includes: according to the input image generation component; feature similarity between any two components based on the value of generation, connect the two components of the component connection; according to the component of each component is connected to the connecting direction for distribution by the component connection and connection components to determine the main direction as the main direction, the various components of the main components; based on the direction of connection and component connecting components in the direction of the poor, will be connected components grouping of components connected to at least one component group; and on the basis of at least one component group generated text area. Compared with the existing techniques, the present method can precisely locate the text region in the image, and the detection result can be further used for text recognition.
【技术实现步骤摘要】
用于文本检测的方法和装置
本专利技术涉及计算机视觉、图像处理并理解,尤其涉及一种多方向文本检测方法和装置。
技术介绍
在自然场景图像或视频帧中的文本携带有用于视觉内容理解和检索的重要信息。在图像中,特别是在自然图像或视频帧中提取文本信息或者检测文本,对许多计算机视觉应用(例如,对视觉障碍人士或外国人的计算机化援助、对图像或视频的自动检索以及城市环境中的机器人导航等)来说是至关重要的。不过,在自然场景中的文本检索是一个难题,主要的挑战在于具有不同的字体、大小、倾斜角或失真等的多样化的文本。像不均匀的照度和反射、照明不足条件以及复杂的背景等环境因素增加更多的复杂性。用于在自然场景中进行文本区域检测的常用方法一般遵循如下的主要步骤:根据图像生成分离的组件,并基于某些规则将组件分组以生成组件组,然后验证组件组以移除非文本组,并通过使用剩余的文本组来恢复文本区域(例如文本行、文字等)。为了更好的性能,利用一组特征对所生成的组件进行过滤,以排除非文本组件。通常,从组件中提取几何特征和纹理特征,并把它们馈送到用于估算组件的文本可能性的分类器。当对剩余的组件一起分组以生成组件组时,通常是基于不同组件之间的相似度测量或者空间距离。此外,组件分组步骤对于文本检测是必须的也是至关重要的,其中,对于将组件归类为文本部分,组件与其他邻近组件相关是最重要的。所以,确定哪些组件属于同一文本部分是很大的挑战。同时,文本的布局通常保持着复杂的布局,并且在自然场景中一般存在多方向文本,因此,如何正确地对文本组件进行分组,对于文本区域检测性能是至关重要的。在相关文献中,公开了多种组件分组方法。 ...
【技术保护点】
一种文本检测方法,其用于检测输入图像中的文本区域,所述文本检测方法包括:组件生成步骤,用于根据所述输入图像生成组件;组件连接生成步骤,用于基于任意两个组件的特征值之间的相似度,生成连接这两个组件的组件连接;组件主方向确定步骤,用于根据连接到各组件的组件连接的方向分布,针对由所述组件连接而连接的各组件确定主方向,作为各组件的主方向;组件分组步骤,用于基于所述组件的主方向与连接所述组件的组件连接的方向之间的差,将由所述组件连接而连接的组件分组为至少一个组件组;以及文本区域生成步骤,用于基于所述至少一个组件组,生成文本区域。
【技术特征摘要】
1.一种文本检测方法,其用于检测输入图像中的文本区域,所述文本检测方法包括:组件生成步骤,用于根据所述输入图像生成组件;组件连接生成步骤,用于基于任意两个组件的特征值之间的相似度,生成连接这两个组件的组件连接;组件主方向确定步骤,用于根据连接到各组件的组件连接的方向分布,针对由所述组件连接而连接的各组件确定主方向,作为各组件的主方向;组件分组步骤,用于基于所述组件的主方向与连接所述组件的组件连接的方向之间的差,将由所述组件连接而连接的组件分组为至少一个组件组;以及文本区域生成步骤,用于基于所述至少一个组件组,生成文本区域。2.根据权利要求1所述的文本检测方法,其中所述组件主方向确定步骤还包括:移除步骤,用于基于至少一个组件连接的方向与由所述至少一个组件连接而连接的组件的主方向之间的差,移除所述至少一个组件连接;重新确定步骤,用于针对由剩余的组件连接而连接的各组件重新确定主方向。3.根据权利要求1或2所述的文本检测方法,其中,所述组件连接生成步骤还包括基于所述两个组件之间的空间距离来生成所述组件连接。4.根据权利要求1或2所述的文本检测方法,其中,所述组件主方向确定步骤基于组件连接的方向分布的方向直方图,所述组件主方向确定步骤还包括:将组件连接的方向的角度归一化到预定义的范围;生成组件连接的方向的归一化角度的直方图;以及将具有最高直方图柱中的方向角的方向分配为组件主方向。5.根据权利要求4所述的文本检测方法,其中,基于组件连接的特征,对组件连接的方向的角度进行加权。6.根据权利要求1或2所述的文本检测方法,其中,所述组件主方向确定步骤基于扫描窗口,所述组件主方向确定步骤还包括:定义组件连接的扫描窗口和冲突函数;确定使组件连接的所述冲突函数最小化的所述扫描窗口的位置;以及将具有最小冲突函数值的扫描窗口的位置分配为组件主方向。7.根据权利要求6所述的文本检测方法,其中,所述扫描窗口是在方向空间中的滑动窗口,并通过下述形状参数中的至少一个来描述:1)子窗口的数量;2)不同子窗口之间的距离;3)各子窗口的大小;4)用来评估所述扫描窗口内或所述扫描窗口外部的方向之间的差的距离函数。8.根据权利要求2所述的文本检测方法,其中,所述移除步骤还包括:评估组件连接方向与组件主方向之间的冲突;以及移除满足移除条件的组件连接。9.根据权利要求8所述的文本检测方法,所述文本检测方法还包括基于各组件连接的方向和组件主方向,针对各组件连接计算冲突因子。10.根据权利要求9所述的文本检测方法,其中,所述移除条件是下述条件中的至少一个:1)所述冲突因子大于预定义阈值;2)组件连接的所述冲突因子是所有组件连接的冲突因子中最大的。11.根据权利要求9所述的文本检测方法,所述文本检测方法还包括判断是否终止组件连接移除,其中,终止条件是下述条件中的至少一个:1)基于所述移除条件,没有移除组件连接;2)所有组件连接的所述冲突因子都小于预定义阈值;3)算法达到预定义迭代次数。12.一种文本检测装置,其用于检测输入图像中的文本区域,所述文本检测装置包括:组件生成单元,其被构造为根据所述输入图像生成组件;组件连接生成单元,其被构造为基于任意两个组件的特征值之间的相似度,生成连接这两个组件的组件...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。