识别图像块中文字的方向的方法和装置制造方法及图纸

技术编号:8241635 阅读:174 留言:0更新日期:2013-01-24 22:35
本发明专利技术公开了一种识别图像块中文字的方向的方法和装置。所述方法包括:分别以不同的方向作为假设文字方向对图像块进行光学字符识别处理,以得到各个假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;搜索最小匹配对;最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;当最小匹配对中仅包含两个子图像块,且这两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将两个子图像块对应的正确性度量调整为同一数值;基于调整后的子图像块计算各个假设文字方向上的累积正确性度量;以及根据累积正确性度量识别图像块中文字的方向。

【技术实现步骤摘要】

本专利技术一般地涉及文档图像处理。具体而言,本专利技术涉及一种识别图像块中文字的方向的方法和装置
技术介绍
当用户使用扫描仪等设备对一叠文档进行扫描时,理想的输入是每个文档的每一页都以正向放置。以正向放置文档时,用户能够轻松阅读该文档,扫描出的文档图像也无需用户调整方向即可阅读。然而,实际使用中,用户要扫描的文档往往是以正向0°、反向180°、横向90°和270°交叠放置。如果用户需要在扫描时对文档的放置方向进行逐页的检查和调整,工作是繁重而耗时的。因此,扫描仪设计有自动文档图像方向判别的功能。基于自动文档图像方向判别功能,扫描得到的文档图像可以被调整为正向,从而减轻了用户的负担,提高了用户的使用效率。 传统的文档图像自动判别方法是找到文档图像中的文本行,在4个可能的方向上分别做光学字符识别OCR (Optical Character Recognition)处理,得到4个可能方向上的识别字符及对应的置信度或识别距离,并计算文本行的平均置信度或平均识别距离。平均置信度最大或平均识别距离最小的方向被判别为文本行的方向。进而根据文本行的方向判断文档图像的方向。文本行的方向是指文本行的本文档来自技高网...

【技术保护点】
一种识别图像块中文字的方向的方法,包括:分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;在互相为180°关系的假设文字方向上的子图像块中,搜索子图像块的最小匹配对;所述最小匹配对是在互相为180°关系的假设文字方向上位置对应、大小相同、包含最小个数的子图像块的两个子图像块集合;当最小匹配对中的两个假设文字方向上各有一个子图像块,且属于该最小匹配对的两个子图像块对应的识别字符是同一旋转不变字符或属于同一旋转不变字符对时,将所述两个子图像块对应的正确性度量调整为同一数值;基于调整后的子图像块计算各个所...

【技术特征摘要】

【专利技术属性】
技术研发人员:孙俊直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1