当前位置: 首页 > 专利查询>温州大学专利>正文

一种机器人检测自然场景中文字的方法及电子设备技术

技术编号:28675190 阅读:41 留言:0更新日期:2021-06-02 02:51
本发明专利技术涉及机器人检测自然场景中文字的技术领域,具体涉及一种机器人检测自然场景中文字的方法及电子设备,包括以下步骤:S1获取待检测图片,去除图像噪声并计算图像边缘及边缘上的梯度方向;S2对连通的边缘按像素数量降序排列,排除边缘最小外接矩形大于阈值W

【技术实现步骤摘要】
一种机器人检测自然场景中文字的方法及电子设备
本专利技术涉及文字检测
,具体涉及一种机器人检测自然场景中文字的方法及电子设备。
技术介绍
场景中的文字检测具有重要意义,比如让机器人理解场景中的文字就有助于机器人理解场景。目前主流的文字检测方法主要有二类,一是基于深度学习,例如CTPN、SegLink、EAST等网络;二是基于传统方法,典型的如基于像素点SWT(笔划宽度变换)方法,基于的区域MSER方法(最大稳定极值区域)。微软BorisEpshtein认为每个字符的笔划宽度大致相同,所以从Canny边缘点顺着梯度方向出发,找到梯度方向正好相反、距离相近的Canny边缘点,则两点之间就是笔划,这就是SWT算法。经典的SWT算法分成以下几步:(1)将原图做Canny边缘检测;(2)Canny边缘点Oi顺着梯度方向出发,能够找到梯度方向正好相反的点Ri,且该点也是Canny边缘点,将Oi-Ri路径上的所有点宽度设为Oi-Ri间的距离|Oi-Ri|;(3)检测完所有的Canny点时,有效的笔划宽度就构成了输出图,即文字检测图;(4)将相邻本文档来自技高网...

【技术保护点】
1.一种机器人检测自然场景中文字的方法,其特征在于,所述方法包括以下步骤:/nS1获取待检测图片,去除图像噪声并计算图像边缘及边缘上的梯度方向;/nS2对连通的边缘按像素数量降序排列,排除边缘最小外接矩形大于阈值W

【技术特征摘要】
1.一种机器人检测自然场景中文字的方法,其特征在于,所述方法包括以下步骤:
S1获取待检测图片,去除图像噪声并计算图像边缘及边缘上的梯度方向;
S2对连通的边缘按像素数量降序排列,排除边缘最小外接矩形大于阈值Wf及平滑程度少于边缘平滑程阈值Ss的边缘;
S3按像素从多到少的顺序对经过筛选的边缘求取对偶边缘,并补充对偶边缘,构成连续的笔画;
S4利用局部分水岭算法形成候选字符,并去除候选字符噪声;
S5基于方向矢量将候选字符形成文字行,最后输出文字行及字符。


2.根据权利要求1所述的一种文字检测方法,其特征在于,所述方法中,去除图像噪声,计算图像边缘,然后计算边缘的平滑程度S,排除平滑程度少于边缘平滑程阈值Ss的边缘,边缘的平滑程度S为边缘上每个像素点一阶梯度D1i方差δ1和二阶导数D2i方差δ2的加权和
S=λ1δ1+λ2δ2
每条边缘的边缘平滑程阈值Ss与边缘长度自适应,即与像素数量Np成反比
Ss=f(Np)。


3.根据权利要求1所述的一种机器人检测自然场景中文字的方法,其特征在于,所述方法中,对经过筛选的边缘,按像素从多到少的顺序对每条边缘采用对偶像素法求取对偶边缘,具体如下:
对边缘从头到尾,按相邻顺序,对每个像素,假设pi,沿梯度方向D1pi按以下公式在2-Ws范围内找到不多于NC个候选对偶像素qij
qij=pi+D1pi×n(Ws≥n≥2)(1)
D1qij为像素点qij的梯度方向,D1pi和D1qij方向相反
|D1qij-D1pi|<π/6
pi和qij两者距离为dij
dij=|qij-pi|。


4.根据权利要求3所述的一种机器人检测自然场景中文字的方法,其特征在于,所述方法中,对整个边缘从头到尾将其候选对偶像素qij排成列,其中Ne≥i≥0,Ne边缘像素点数,NC≥j≥1,NC边缘对偶像素候选点数,没有候选对偶像素的点其候选对偶像素设为V(∞,∞),仅一个,增加虚拟的头h和尾e,并对邻接的像素偶像素列间进行全连接,构成候选对偶像素图Ge,候选对偶像素图Ge中的节点为候选对偶像素,相邻列的节点间的边,其权为边两端候选对偶像素(qin,q(i+1)m)间的距离dqinq(i+1)m、一阶梯度差δD1和二阶梯度差δD2加权和Wqinq(i+1)m
Wqinq(i+1)m=λddqinq(i+1)m+λD1δD1+λD2δD2
dqinq(i+1)m=|qin-q(i+1)m|
δD1=D1qin-D1q(i+1)m
δD2=D2qin-D2q(i+1)m
相邻像素笔划宽度相近,在图Ge中找到一条宽度最稳定、边缘最光滑的边,即从虚拟起点h到虚拟终点e间图的最短路径。


5.根据权利要求1所述的一种机器人检测自然场景中文字的方法,其特征在于,所述方法中,对边缘上没有连续对偶像素的边缘段补充对偶边缘,具体包括,以两个相邻有对偶像素边缘段的端点为起点和终点,用起点和终点的对偶像素的邻域找到候选对偶像素,同样生成候选对偶像素图Ge,补足边缘段上不连续的连续对偶像素段。


6.根据权利要求5所述的一种机器人检测自然场景中文字的方法,其特征在于,所述方法中,对没有连续对偶像素的边缘段,以相邻两个有对偶像素的边缘段的端点为起点ph和终点pe,按如下步骤定位其对偶像素:
起点ph到其对偶像素p′h的距离为X,对偶像素p′h8邻域内像素灰度与对偶像素p′h的灰度差构成灰度差序列a1a2a3a4a5a6a7a8;终点pe到其对偶像素p′e的距离为Y,p′e8邻域内像素灰度与p′e的灰度差构成灰度差序列b1b2b3b4b5b6b7b8;
对起点ph后的每个边缘点px,沿px梯度方向D1px在min(2/3X,2/3Y)-max(4/3X,4/3Y)的范围内找到1/2NC个候选对偶像素qxj,候选对偶像素qxj其8邻域内像素灰度与候选对偶像素qxj的灰度差序列c1c2c3c4c5c6c7c8与灰度差序列a1a2a3a4a5a6a7a...

【专利技术属性】
技术研发人员:罗胜黄长城曾麟
申请(专利权)人:温州大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1