The invention discloses a method of cutting text lines by local dynamic planning, in which the continuous question unit is taken as the question area and l question unit u is taken as the question unit
【技术实现步骤摘要】
一种局部动态规划切割文字行的方法
本专利技术涉及文字识别
,具体涉及一种局部动态规划切割文字行的方法。
技术介绍
对于图像中切割出的一行或者一列文字,想要定位行中的文字,一般采用投影法。例如图1(a)所示的一行文字,沿纵向累加所有行,投影成为一维数据,如图1(b)所示。在一维数据里,往往用最小值把数组序列切割为分离的单元,将每个单元当作一个字符。但事实上,汉字有左右结构、左中右等结构。在这种简单的投影法里,一个左右结构汉字可能会被分割成两个单元,例如“印”、“的”、“行”、“经”、“项”、“汇”等字;双引号‘”’可能会处理成两个‘”单引号;左中右结构的汉字甚至可能会被分割成三个单元,例如“做”、“树”、“湖”、“衍”等字。如果以单元间距离来判断多个单元是否属于同一个汉字,距离选择得太小,那么竖排的“二”、“三”容易被分成两个或者三个“一”字,“办”字右边的“、”容易割成标点符号。如果距离阈值选择得太大,“11”也容易被处理成一个字,图中小一号的数字容易就被合并一个字,图中句号“。”也容易被合并到前一个字。因此依 ...
【技术保护点】
1.一种局部动态规划切割文字行的方法,其特征在于:包括如下步骤:/nS1、采用Ostu方法计算行/列图像的二分阈值,将图像转变为二值图像,白色为前景中的字,黑色为背景;/nS2、将长宽比、大小在文字可能范围内的前景区域作为候选的文字,统计文字平均宽度W
【技术特征摘要】
1.一种局部动态规划切割文字行的方法,其特征在于:包括如下步骤:
S1、采用Ostu方法计算行/列图像的二分阈值,将图像转变为二值图像,白色为前景中的字,黑色为背景;
S2、将长宽比、大小在文字可能范围内的前景区域作为候选的文字,统计文字平均宽度Wc;
S3、将行文字,沿纵向累加各行投影成为一维数据;如果是列文字,沿横向累加各列投影也成为一维数据;
S4、排除一维数据左右两端为0的数据,找到数据中间有字符部分的投影的最小值;
S5、找到一维数据排除左右两端为0的数据后,有字符部分的投影的所有最小值;
S6、将每个最小值所在的区域设置为低洼区域,找到低洼区域的左右边界,低洼区域间的区域为峰值区域,判断低洼区域为字间间隙、峰值区域为文字单元的可能性,将可能性超过经验阈值的峰值区域存入文字单元数组、低洼区域存入字间间隙数组,将可能性低于经验阈值的峰值区域合并到左右低洼区域;
S7、将每个文字单元的宽度除以步骤S2统计出的文字平均宽度,将大于文字平均宽度预设倍数的文字单元以及字间间隙大于最大文字宽度的单元直接作为检测出的文字,将其它单元作为存疑单元,并将连续多个、中间无存疑单元的检出文字作为文字区域,计算每个文字区域的平均字宽度Wc和平均字间隙Wb;
S8、将连续存疑单元作为存疑区域,以L个存疑单元Ui,包括存疑区域前一个检出文字和存疑区域后一个检出文字,共L+2个单元,构成存疑单元集U;用此L+2个单元构造一个(L+2)×(L+2)的矩阵,矩阵中的点(Uh,Ue)(Uh<=Ue,e-h<=4)表示从单元Uh左边开始,在单元Ue右边结束的范围内构成一个字符,点(Uh,Ue)的值Phe表示此范围构成一个字符的成字成本;
Phe=λ1(Whe-Wc)/(Whe+Wc)+λ2(Whb-Wb)/(Whb+Wb)+λ3(Web-Wb)/(Whe+Wb);...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。