基于相邻边缘点距离统计的文字图象分割方法技术

技术编号:2949422 阅读:197 留言:0更新日期:2012-04-11 18:40
一种基于相邻边缘点距离统计的文字图象分割方法,其特征在于,方法如下:先将摄像头拍摄的灰度图象用Canny算子检测边缘,检测相邻边缘点的水平方向距离,统计可能为文字的边缘点距离,然后设定阈值,检测出可能的文字图象行,经合并后形成文字图象行区域,在各个文字图象行区域内,统计各行的边缘点数量,求得各区域相应的最小值后进行行边界调整,检测到精确的文字图象区域,并计算各个行区域的文字图象高度,再在各个文字图象行区域内,统计每一列图象像素的边缘点数量,设定可能文字图象列的阈值,据此检测出可能的文字图象列,可能的文字图象列合并形成文字图象列区域,并进行列边界调整得到精确的文字图象列区域,经行和列的位置检测后,得到文字图象的区域范围,最终准确分割出文字图象。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及的是一种文字图象分割方法,特别是一种。属于图象处理领域。
技术介绍
经文献检索发现,Hua Yang等人在《International Journal of PatternRecognition and Artificial Intelligence》(2000,14(7),963-978.)(《模式识别和人工智能的国际期刊》)上发表的“Extraction of Bibliography Information Basedon Image of Book Cover”(“从图书封面的图象中提取书目信息”),该文中所提出的方法,先将图象的RGB(红、绿、蓝)彩色空间转换到HSI(色度、饱和度、强度)的彩色空间,然后进行彩色分割和连通域分析,从图书封面图象中分割出文字。该文涉及的技术主要存在以下缺陷和不足(1)算法只限于从精装书本封面的文字图象分割;(2)算法执行时间很长,完整执行一次算法共大约需要320秒;(3)同一幅图象中文字尺寸大小不同,文字笔划宽度差别也不同,run-length的直方图统计难以准确检测出文字的笔划宽度;(4)算法虽然用几个实验验证,但是有待于进一步采用书库的图书进行验证;(5)上述文件中未提及图象的分辨率,或图象的大小。在解决以上的问题时,主要存在以下困难(1)文字尺寸大小变化范围很大,最大文字是60×48像素点,最小文字10×8像素点。(2)文字颜色的种类繁多,某些文字颜色与背景颜色相近,颜色分割难以有效地进行。(3)不同结构特点的文字共存于一幅图象中,而不同结构的文字笔划数目差别很大,如汉字和英文。(4)算法应具有较快的速度。
技术实现思路
本专利技术的目的在于克服现有技术中的不足,提供一种,使其能够从自然场景图象中,准确、快速、可靠地分割出目标文字图象。本专利技术是通过以下技术方案实现的,本专利技术方法如下先将摄像头拍摄的灰度图象用Canny算子检测边缘,检测相邻边缘点的水平方向距离。统计可能为文字的边缘点距离,设定阈值,检测出可能的文字图象行,经合并后形成文字图象行区域。在各个文字图象行区域内,统计各行的边缘点数量,求得各区域相应的最小值后进行行边界调整,检测到精确的文字图象区域,并计算各个行区域的文字图象高度。在各个文字图象行区域内,统计每一列图象像素的边缘点数量,设定可能文字图象列的阈值,据此检测出可能的文字图象列,可能的文字图象列合并形成文字图象列区域,并进行列边界调整得到精确的文字图象列区域。经行和列的位置检测后,得到文字图象的区域范围,最终准确分割出文字图象。虽然图象中的文字颜色,尺寸大小,结构等差别很大,但是属于同一类的文字具有如下特点(1)文字的尺寸大小一致,相邻边缘点的距离近似相等。因此,对不同文字图象区域,分块进行相邻边缘点的距离统计。(2)文字的结构相同。因此,在同一文字图象区域内,每一行的近似相等的相邻边缘点距离统计数量相接近。(3)文字图象的纹理特征相同。因此,在同一文字图象区域内,在水平和垂直方向的必然存在相邻边缘点距离相等或接近相等的边缘像素点。(4)根据上述特点,利用相邻边缘点距离统计,进行文字图象区域的检测。以下对本专利技术方法作进一步的说明,方法步骤如下(1)边缘检测对数码相机拍摄的灰度图象采用Canny算子检测边缘。对于同一幅图象,梯度阈值可以在一个比较大的范围内,能正确分割出文字图象。但必须满足以下两个条件首先,必须能检测出目标文字图象的边缘,这限定了梯度阈值的上限;其次,目标文字的背景区域内不许检测出“假边缘”或者尽可能少,这粗略地限定了梯度阈值的下限值。通过实验分析,设定一个较为合理的阈值。在图书封面文字图象分割中,Canny算子边缘检测的梯度阈值范围优选为大于等于0.2,小于等于0.4。(2)水平方向相邻边缘点距离检测设一幅矩阵大小M1×N1数字图象为f,f(i,j)为图像中象元。分割出的文字边缘图象表示为集合E,定义函数s(i,j), 为获取边缘点的图象像素点坐标位置,定义函数P(s), (i,j)=P(s(i,j)),其中s(i,j)=1 (2)或者分为X列的行位置PY(s),Y行的列位置PX(s)j=PX=i(s(i,j)),其中s(i,j)=1 (3)i=PY=j(s(i,j)),其中s(i,j)=1 (4)水平方向相邻边缘点的距离定义为D(i,j)D(i,j)=PX=i(s(i,j))-PX=i(s(i,k)) (5)且,s,如果k<PX=i(s)<j成立,则s(i,PX=i(s))=0。利用(5)式检测水平方向相邻边缘点的距离。(3)相邻边缘点距离统计设文字图象区域的相邻边缘点距离范围为,图书封面文字图象分割中,文字图象区域相邻边缘点距离的范围为。同一文字图象区域内,文字水平方向相邻边缘点距离接近相等,则每行统计满足下列条件的相邻边缘点距离的数量。(i)W1≤D(i,j)≤W2,i∈,j∈(ii)存在m,n,满足1≤m≤m0,1≤n≤n0,使得下式成立D(i+m,j+n)∈其中,m,n决定邻域的大小,Δ相邻边缘点距离的波动。通过实验分析,确定上述参数的大小。(4)文字图象行区域检测根据每一行字符的最少个数,可以确定相邻边缘点距离统计数量的阈值T,检测文字图象可能行。相邻的可能文字图象行进行合并,形成可能的文字图象区域。根据所要检测文字的最小高度,设定阈值H,检测得到文字图象的行区域。由于距离统计中,邻域约束条件的限制,H值可以取比文字实际高度略小更为合适。根据分割要求,通过实验分析,确定相邻边缘点距离统计的数量阈值T和文字图象的高度阈值H。(5)行区域边界调整在分割出各个文字图象行区域内,分别统计每一行的边缘点数量。NY=Σj=1N1s(Y,j)--(6)]]> 在文字图象区域内,边缘点数量相对比较多。在每一个文字图象行区域内,找出最小的边缘点数量统计值N0b=min(NYb),Y1b≤Y≤Y2b--(7)]]>其中,b表示第b个文字图象行区域,Y1b和Y2b是b文字图象行区域的起始行和末尾行。在文字图象行区域的上下两个边界附近,统计各行的边缘点数量NY,如果NY≥N0b--(8)]]>则将该行并入b文字图象区域内。(6)各行区域文字图象高度检测经行区域边界调整后,检测到完整的完整文字图象行区域,在各行区域内,分别检测各文字图象区域的高度CHb=Yendb-Ystartb--(9)]]>其中,Yendb和Ystartb分别表示b文字图象行区域经边界调整后的区域末尾行和起始行。(7)行区域内列方向边缘点数量统计在分割出的文字行区域图象中,统计每一列的边缘点数量,NXb=Σi=YstartbYendbs(i,X)--(10)]]>(8)文字图象列区域检测设定文字图象区域内列边缘点的数量阈值TN,其中可能文字图象列检测的边缘点数量梯度阈值TN范围为。利用(11)式在文字图象行区域内检测可能的文字图象列,NXb≥TN--(11)]]>可能的文字图象列进行合并,形成可能的文字列区域。由于文字图象大小不同,其字符的间隔也不相同,但是本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:胡小锋叶庆泰
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利