The invention provides a text detection method and device as well as a text recognition system. An aspect of the present invention discloses a text detection method. Including the text detection method: the image acquisition of the text component; similarity measure based on the obtained for each candidate text connection component; the distribution of text component connection candidate based on the direction of the main direction for each calculation of text components; the main direction of seed text based on component, by the text component determine at least one seed text component; through the main direction of the text based on components will be added to the text component corresponding to the seed text component, to generate at least one text component; and based on the text component, the text area in the image generation. According to the invention, the accuracy of text detection is improved.
【技术实现步骤摘要】
文本检测方法和装置以及文本识别系统
本专利技术涉及图像处理,尤其涉及例如文本检测方法和装置以及文本识别系统。
技术介绍
自然场景图像和视频帧中的文本(例如布告牌中的文本、海报中的文本)通常携带用于视觉内容理解应用(诸如智能翻译、人机交互等等)的重要信息。文本检测技术是用于视觉内容理解应用的关键技术。然而,因为自然场景图像中的文本几乎没有任何固定的布局模式,所以在自然场景图像中的文本的布局复杂(例如在自然场景图像中,文本具有任意或多个方向)的情况下,容易得到错误的文本检测结果(即,属于不同文本的文本组件(component)将容易被检测为属于一个相同文本)。在“RobustTextDetectioninNaturalSceneImages”(Yin,X.-C.;Yin,X.;Huang,K.&Hao,H.-W.,IEEETransactionsonPatternAnalysisandMachineIntelligence,2013,36,970-983)(下文中简称为文档1)以及中国专利申请CN201210506072.4(下文中简称为文档2)中,公开了为解决上述多方向文本检测问题的两个示例性技术。文档1和文档2中公开的主要操作包括:首先,通过使用两个或三个种子文本组件,初始化文本组件组,其中,基于文本组件之间的特征相似性测度(例如空间距离)和/或线性对准关系,来确定种子文本组件;第二,针对不在当前文本组件组内的一个文本组件,基于该文本组件与当前文本组件组中的末端文本组件之间的特征相似性测度,并且基于当前文本组件组的方向(例如当前文本组件组中的最后两 ...
【技术保护点】
一种文本检测方法,所述文本检测方法包括:文本组件获得步骤,获得获取的图像中的文本组件;连接候选获得步骤,针对各个文本组件,基于该文本组件与该文本组件周围的文本组件之间的特征相似性测度,从该文本组件到该文本组件周围的文本组件的连接中,获得连接候选;主方向计算步骤,针对各个文本组件,基于该文本组件的连接候选的方向分布,计算该文本组件的主方向;种子文本组件确定步骤,基于种子文本组件的主方向和所述种子文本组件的连接候选的方向,由所述文本组件确定至少一个种子文本组件;文本组件组生成步骤,针对至少一个种子文本组件,通过基于所述文本组件的主方向,将对应的文本组件附加到所述种子文本组件,生成至少一个文本组件组;以及文本区域生成步骤,基于所述文本组件组,生成所述获取的图像中的文本区域。
【技术特征摘要】
1.一种文本检测方法,所述文本检测方法包括:文本组件获得步骤,获得获取的图像中的文本组件;连接候选获得步骤,针对各个文本组件,基于该文本组件与该文本组件周围的文本组件之间的特征相似性测度,从该文本组件到该文本组件周围的文本组件的连接中,获得连接候选;主方向计算步骤,针对各个文本组件,基于该文本组件的连接候选的方向分布,计算该文本组件的主方向;种子文本组件确定步骤,基于种子文本组件的主方向和所述种子文本组件的连接候选的方向,由所述文本组件确定至少一个种子文本组件;文本组件组生成步骤,针对至少一个种子文本组件,通过基于所述文本组件的主方向,将对应的文本组件附加到所述种子文本组件,生成至少一个文本组件组;以及文本区域生成步骤,基于所述文本组件组,生成所述获取的图像中的文本区域。2.根据权利要求1所述的文本检测方法,其中,针对各个文本组件,所述连接候选获得步骤包括:第一特征相似性测度计算步骤,计算该文本组件与该文本组件周围的文本组件之间的特征相似性测度;以及连接候选确定步骤,确定该文本组件到计算出的特征相似性测度大于或等于第一阈值的文本组件的连接,作为连接候选。3.根据权利要求1所述的文本检测方法,其中,所述主方向计算步骤包括:将所述连接候选的方向的角度值归一化到预定范围;基于所归一化的角度值和所述连接候选的数量,生成直方图;分配与最高的直方图柱相对应的角度值,作为该文本组件的第一主方向的角度值;以及分配与该文本组件的第一主方向相反的方向的角度值,作为该文本组件的第二主方向的角度值。4.根据权利要求3所述的文本检测方法,其中,通过由该连接候选连接的两个文本组件之间的特征相似性测度,对各个连接候选的数量进行加权。5.根据权利要求3所述的文本检测方法,其中,所述种子文本组件确定步骤包括:方向一致性测度计算步骤,针对各个文本组件,基于该文本组件的主方向,计算该文本组件的连接候选的方向的方向一致性测度;以及种子文本组件选择步骤,选择具有最大的方向一致性测度的文本组件,作为所述种子文本组件;其中,一个文本组件的方向一致性测度表示该文本组件的连接候选的方向的一致性。6.根据权利要求5所述的文本检测方法,其中,所述方向一致性测度计算步骤包括:确定该文本组件的第一主方向或第二主方向的角度值、与所述连接候选的方向的角度值之间的差值;将所确定的差值小于或等于第二阈值的连接候选分类为第一类连接,并且将其他连接候选分类为第二类连接;以及基于所述第一类连接的尺寸测度和所述第二类连接的尺寸测度,计算所述方向一致性测度。7.根据权利要求6所述的文本检测方法,其中,针对一个连接候选,差值的确定步骤包括:计算该文本组件的第一主方向的角度值与该连接候选的方向的角度值之间的第一差值;计算该文本组件的第二主方向的角度值与该连接候选的方向的角度值之间的第二差值;以及选择所述第一差值与所述第二差值之间较小的一个,作为所确定的差值。8.根据权利要求6所述的文本检测方法,其中,所述第一类连接的尺寸测度和所述第二类连接的尺寸测度至少包括:所述第一类连接的数量和所述第二类连接的数量;或该文本组件与对应于所述第一类连接的文本组件之间的特征相似性测度,以及该文本组件与对应于所述第二类连接的文本组件之间的特征相似性测度。9.根据权利要求8所述的文本检测方法,其中,所述方向一致性测度是第一和与第二和的比,其中,所述第一和是该文本组件与对应于所述第一类连接的文本组件之间的特征相似性测度的和,所述第二和是该文本组件与对应于所述第一类连接的文本组件之间的特征相似性测度、与该文本组件与对应于所述第二类连接的文本组件之间的特征相似性测度的和。10.根据权利要求3所述的文本检测方法,其中,针对一个文本组件组,所述文本组件组生成步骤包括:第一生成步骤,通过基于所述文本组件的主方向,将沿所述种子文本组件的第一主方向的区域内的对应的文本组件附加入该文本组件组,生成该文本组件组;和/或第二生成步骤,通过基于所述文本组件的主方向,将沿所述种子文本组件的第二主方向的区域内的对应的文本组件附加入该文本组件组,生成该文本组件组。11.根据权利要求10所述的文本检测方法,其中,针对沿所述种子文本组件的第一主方向的区域内的当前文本组件组的末端文本组件,所述第一生成步骤包括:第一距离计算步骤,计算所述末端文本组件、与所述末端文本组件周围且未被附加到任何文本组件组的文本组件之间的距离;第一文本组件候选确定步骤,确定具有最小距离的文本组件,作为所述文本组件候选;第一附加步骤,在所述末端文本组件的第一主方向的角度值与所述文本组件候选的第一主方向的角度值之间的差值小于第三阈值的情况下,将所述文本组件候选附加到所述当前文本组件组;否则,终止所述第一生成步骤。12.根据权利要求11所述的文本检测方法,其中,所述第一生成步骤还包括:区域确定步骤,基于所述末...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。