中英文混排文字图像的切割方法及装置制造方法及图纸

技术编号:8533452 阅读:175 留言:0更新日期:2013-04-04 16:52
本发明专利技术涉及一种中英文混排文字图像的切割方法,包括:获取文本行图像区域,获取所述文本行图像区域的行高;通过投影法对所述文本行图像区域进行切分获取字符块;获取所述字符块的块高及块宽;根据所述行高、块高及块宽提取中文字符区域。此外,还包括一种中英文混排文字图像的切割装置。上述中英文混排文字图像的切割方法及装置可以提高识别的准确率。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,特别是涉及一种中英文混排文字图像的切割方法及装置
技术介绍
文本行图像即图像内容为文本行内容的矩形图像,例如,名片识别软件采集的名片图像中的包含文本信息的图像区域。传统技术中,在对具有中英文混杂字符的文本图像的进行识别时,通常会因为中文字符的偏旁部首部分而造成中文字符的误读。例如,中文字符“引”,若直接由OCR识别软件进行识别,有很大几率被错误识别为中文字符“弓”和英文字符“I”。因此,传统技术中,文本行图像中的中文字符的识别准确率较低。
技术实现思路
基于此,有必要提供一种能提高识别准确率的中英文混排文字图像的切割方法。一种中英文混排文字图像的切割方法,包括获取文本行图像区域,获取所述文本行图像区域的行高;通过投影法对所述文本行图像区域进行切分获取字符块;获取字符块的块高及块宽;根据所述行高、块高及块宽在所述切分得到的字符块中定位中文字符块。在其中一个实施例中,所述根据所述行高、块高及块宽在所述切分得到的字符块中定位中文字符块的步骤包括获取所述块高与块宽的长度最接近的基准字符块;判断所述基准字符块是否为中文字符,若是,则获取所述块高的长度等于所述行高的字符块的个数比例,根据所述个数比例在所述切分得到的字符块中定位中文字符块。在其中一个实施例中,所述根据所述个数比例在所述切分得到的字符块中定位中文字符块的步骤为若所述个数比例大于第一阈值,则通过将所述字符块合并定位中文字符块。在其中一个实施例中,所述通过将所述字符块合并定位中文字符块的步骤为获取所述块宽的长度小于所述基准字符块的块宽的偏旁字符块;获取所述偏旁字符块的邻接字符块;判断所述偏旁字符块与其邻接字符块对应的的块高是否均与所述行高相同,且所述偏旁字符块与其邻接字符块的块宽之和与所述基准字符块的宽度之差是否小于第二阈值,若是,则将所述偏旁字符块与其邻接字符块合并;获取合并后的字符块的位置信息。在其中一个实施例中,所述获取所述块高与块宽的长度最接近的基准字符块的步骤之后还包括获取所述块宽的长度大于所述基准字符块的块宽且块高等于所述行高的粘接字符块;通过图像腐蚀拆分所述粘接字符块。此外,还有必要提供一种能提高识别准确率的中英文混排文字图像的切割装置。一种中英文混排文字图像的切割装置,包括文本行获取模块,用于获取文本行图像区域,获取所述文本行图像区域的行高;字符块切分模块,用于通过投影法对所述文本行图像区域进行切分获取字符块;长度获取模块,获取字符块的块高及块宽;中文字符定位模块,用于根据所述行高、块高及块宽在所述切分得到的字符块中定位中文字符块。在其中一个实施例中,所述中文字符定位模块用于获取所述块高与块宽的长度最接近的基准字符块,判断所述基准字符块是否为中文字符,若是,则获取所述块高的长度等于所述行高的字符块的个数比例,根据所述个数比例在所述切分得到的字符块中定位中文字符块。在其中一个实施例中,所述中文字符定位模块还用于在所述个数比例大于第一阈值时,通过将所述字符块合并定位中文字符块。在其中一个实施例中,所述中文字符定位模块还用于获取所述块宽的长度小于所述基准字符块的块宽的偏旁字符块,获取所述偏旁字符块的邻接字符块,判断所述偏旁字符块与其邻接字符块对应的的块高是否均与所述行高相同,且所述偏旁字符块与其邻接字符块的块宽之和与所述基准字符块的宽度之差是否小于第二阈值,若是,则将所述偏旁字符块与其邻接字符块合并,获取合并后的字符块的位置信息。在其中一个实施例中,所述装置还包括腐蚀拆分模块,用于获取所述块宽的长度大于所述基准字符块的块宽且块高等于行高的粘接字符块,通过图像腐蚀拆分所述粘接字符块。上述中英文混排文字图像的切割方法及装置,预先对文本行图像区域进行了切分,并根据切分后得到的字符块的块高、块宽亦即文本行图像区域的行高将文本行图像区域中的包含中文字符的字符块区分出来,使得后期在进行图像文字识别时,可减少对左右结构偏旁部首中文字符的误读,从而提高识别准确率。附图说明图1为一个实施例中中英文混排文字图像的切割方法的流程图;图2为一个实施例中文本行图像区域的效果图;图3为一个实施例中切分得到的字符块的效果图;图4为一个实施例中中英文混排文字图像的切割装置的结构示意图;图5为另一个实施例中中英文混排文字图像的切割装置的结构示意图。具体实施例方式在一个实施例中,如图1所示,一种中英文混排文字图像的切割方法,包括步骤S102,获取文本行图像区域,获取文本行图像区域的行高。文本行图像区域即二值图像中单行文本的连通域。在对名片照片、文本扫描图等图像进行OCR (Optical character recognition,光字符识别)之前,通常会先将二值化后的图像中的文本行图像区域提取出来,然后对每个文本行图像区域进行进一步的识别。提取出来的文本行图像区域的行高为该文本行图像区域的连通域的高度,亦即该文本行图像区域中高度最高的字符的高度。例如,文本行图像区域“Access”的行高即为字符“A”的高度。步骤S104,通过投影法对文本行图像区域进行切分获取字符块。文本行图像区域为矩形框,其文字书写方向的边即为该矩形框的长边。可将文本行图像区域中的像素点投影到该长边上,并根据长边上的投影结果将文本行图像区域切分,生成字符块。也就是说,若经过长边上某点且垂直于长边的直线对应的文本行图像区域中的像素点均为O (即与二值化后的字符的像素点的灰度值相反),则以该直线将文本行图像区域切分成字符块。如图2和图3所示,图2中的文本行图像区域为名片上的文本行。图3即为该文本行图像区域被切分成多个字符块的效果示意图。步骤S106,获取字符块的块高及块宽。在本实施例中,可获取切分得到的每个字符块的块高和块宽。块高的方向垂直于前述的文字书写方向,块宽的方向平行于前述的文字书写方向。在本实施例中,还可对获取得到的块高及块宽进行筛选,去除包含标点符号等字符的字符块。可遍历获取到的字符块,将块高与行高进行比较,若块高与行高之差小于预设值,且块宽与块高之差小于预设值,则移除该字符块。例如,字符块均可移除。步骤S108,根据行高、块高及块宽在切分得到的字符块中定位中文字符块。在本实施例中,根据行高、块高及块宽在切分得到的字符块中定位中文字符块的步骤可包括获取块高与块宽的长度最接近的基准字符块,判断基准字符块是否为中文字符,若是,则获取块高的长度等于行高的字符块的个数比例,根据个数比例在切分得到的字符块中定位中文字符块。本实施例中,判断基准字符块是否为中文字符的方法可通过OCR工具进行识别。且中文字符与英文大写字符混杂时,中文字符的字符块的块高与块宽更加接近,因此,若基准字符块为英文或阿拉伯数字,则该文本行图像区域必然不包含中文字符。进一步地,在本实施例中,根据个数比例在切分得到的字符块中定位中文字符块的步骤可具体为若个数比例大于第一阈值,则通过将字符块合并定位中文字符块。若个数比例为100%,则该文字行图像区域中的字符全为中文字符。若个数比例小于100%但大于第一阈值,则该文字行图像区域中的字符为中英文混杂字符。进一步地,在本实施例中,通过将字符块合并定位中文字符块的步骤可具体为获取块宽的长度小于基准字符块的块宽的偏旁字符块,获取偏旁字符块的邻接字符块,判断偏旁字符块与本文档来自技高网...

【技术保护点】
一种中英文混排文字图像的切割方法,包括:获取文本行图像区域,获取所述文本行图像区域的行高;通过投影法对所述文本行图像区域进行切分获取字符块;获取所述字符块的块高及块宽;根据所述行高、块高及块宽在所述切分得到的字符块中定位中文字符块。

【技术特征摘要】
1.一种中英文混排文字图像的切割方法,包括 获取文本行图像区域,获取所述文本行图像区域的行高; 通过投影法对所述文本行图像区域进行切分获取字符块; 获取所述字符块的块高及块宽; 根据所述行高、块高及块宽在所述切分得到的字符块中定位中文字符块。2.根据权利要求1所述的中英文混排文字图像的切割方法,其特征在于,所述根据所述行高、块高及块宽在所述切分得到的字符块中定位中文字符块的步骤包括 获取所述块高与块宽的长度最接近的基准字符块; 判断所述基准字符块是否为中文字符,若是,则获取所述块高的长度等于所述行高的字符块的个数比例,根据所述个数比例在所述切分得到的字符块中定位中文字符块。3.根据权利要求2所述的中英文混排文字图像的切割方法,其特征在于,所述根据所述个数比例在所述切分得到的字符块中定位中文字符块的步骤为 若所述个数比例大于第一阈值,则通过将所述字符块合并定位中文字符块。4.根据权利要求3所述的中英文混排文字图像的切割方法,其特征在于,所述通过将所述字符块合并定位中文字符块的步骤为 获取所述块宽的长度小于所述基准字符块的块宽的偏旁字符块; 获取所述偏旁字符块的邻接字符块; 判断所述偏旁字符块与其邻接字符块对应的的块高是否均与所述行高相同,且所述偏旁字符块与其邻接字符块的块宽之和与所述基准字符块的宽度之差是否小于第二阈值,若是,则将所述偏旁字符块与其邻接字符块合并; 获取合并后的字符块的位置信息。5.根据权利要求2至4所述的中英文混排文字图像的切割方法,其特征在于,所述获取所述块高与块宽的长度最接近的基准字符块的步骤之后还包括 获取所述块宽的长度大于所述基准字符块的块宽且块高等于所述行高的粘接字...

【专利技术属性】
技术研发人员:李冰陈小平肖方明汪利
申请(专利权)人:深圳深讯和科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1