文本行检测方法、装置及系统制造方法及图纸

技术编号:19426422 阅读:39 留言:0更新日期:2018-11-14 10:49
本发明专利技术提供了一种文本行检测方法、装置及系统,涉及文字检测技术领域,该方法包括:获取待检测图像;获取待检测图像中每个像素的属性信息;属性信息包括:区域属性信息、中心线属性信息、半径属性信息和斜率属性信息;根据每个像素的属性信息,在待检测图像中标记出文本行所在区域。本发明专利技术实施例可以确定待检测图像中每个像素的区域属性信息、中心线属性信息、半径属性信息和斜率属性信息,可以准确表示任意形状的文本行;在得到上述属性信息后,可以根据各属性信息在待检测图像中标记出文本行所在区域,从而可以有效检测不规则形状的文本行,并提高标记文本行所在区域的准确度。

【技术实现步骤摘要】
文本行检测方法、装置及系统
本专利技术文字检测
,尤其是涉及一种文本行检测方法、装置及系统。
技术介绍
文字检测,作为文字信息识别的必要前提,随着神经网络和图像大数据的发展,其检测效率也得到了进一步改进。现有自然场景的文字检测方法往往假设图片中的文本以直线形式存在,检测结果以矩形框或四边形框来表示文字所在位置。事实上,不规则形状的文字是普遍存在于现实场景中,例如弯曲的文本行。由于上述方法是在假设文本直线形式存在的前提下,确定文本在图片中的具体位置,会导致其确定的具体位置与文本的实际位置有较明显偏差,最终导致其无法有效识别出图片中的不规则形状的文本。针对上述文字检测方法不能准确检测文本在图片中区域的问题,还未提出有效解决方案。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种文本行检测方法、装置及系统,可以有效检测图片中不规则形状的文本行,准确确定文本行所在区域。第一方面,本专利技术实施例提供了一种文本行检测方法,包括:获取待检测图像;获取所述待检测图像中每个像素的属性信息;所述属性信息包括:区域属性信息、中心线属性信息、半径属性信息和斜率属性信息;根据每个所述像素的属性信息,在本文档来自技高网...

【技术保护点】
1.一种文本行检测方法,其特征在于,包括:获取待检测图像;获取所述待检测图像中每个像素的属性信息;所述属性信息包括:区域属性信息、中心线属性信息、半径属性信息和斜率属性信息;根据每个所述像素的属性信息,在所述待检测图像中标记出文本行所在区域。

【技术特征摘要】
1.一种文本行检测方法,其特征在于,包括:获取待检测图像;获取所述待检测图像中每个像素的属性信息;所述属性信息包括:区域属性信息、中心线属性信息、半径属性信息和斜率属性信息;根据每个所述像素的属性信息,在所述待检测图像中标记出文本行所在区域。2.根据权利要求1所述的方法,其特征在于,所述获取所述待检测图像中每个像素的属性信息的步骤,包括:将所述待检测图像输入全卷积神经网络;通过所述全卷积神经网络对所述待检测图像的每个像素进行预测,得到多个预测特征向量;所述多个预测特征向量分别表征:所述像素在文字区域内的概率、所述像素在中心线上的概率、所述像素的文字区域半径、所述中心线在所述像素处的切线与水平线夹角的正弦值和余弦值;根据所述多个预测特征向量确定每个所述像素的属性信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述预测特征向量确定每个所述像素的属性信息的步骤,包括:当所述像素在文字区域内的概率大于预设区域阈值时,确定所述区域属性信息为在文字区域内;当所述像素在中心线上的概率大于预设中心线阈值时,确定所述中心线属性信息为在中心线上;根据所述正弦值和所述余弦值计算所述夹角的正切值,确定为所述斜率属性信息。4.根据权利要求2或3所述的方法,其特征在于,所述全卷积神经网络包括:n个依次连接的卷积模块、m个依次连接的反卷积模块和输出模块;第n个所述卷积模块与第1个所述反卷积模块连接;第m个所述反卷积模块与所述输出模块连接;第a个所述反卷积输出的特征图与第m-a个所述卷积模块输出的特征图融合后,输入到第a+1个所述反卷积模块中;其中n、m、a为正整数,且a<m。5.根据权利要求4所述的方法,其特征在于,在相邻的所述反卷积模块之间设置有卷积层;第a个所述反卷积输出的特征图经过所述卷积层提取特征后,再与第m-a个所述卷积模块输出的特征图融合。6.根据权利要求1-3任一项所述的方法,...

【专利技术属性】
技术研发人员:贺欣姚聪
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1