【技术实现步骤摘要】
本专利技术一般地涉及文档图像处理。具体而言,本专利技术涉及一种识别图像块中文字的方向的方法和装置。
技术介绍
当用户使用扫描仪等设备对一叠文档进行扫描时,理想的输入是每个文档的每一页都以正向放置。以正向放置文档时,用户能够轻松阅读该文档,扫描出的文档图像也无需用户调整方向即可阅读。然而,实际使用中,用户要扫描的文档往往是以正向0°、反向180°、横向90°和270°交叠放置。如果用户需要在扫描时对文档的放置方向进行逐页的检查和调整,工作是繁重而耗时的。因此,扫描仪设计有自动文档图像方向判别的功能。基于自动文档图像方向判别功能,扫描得到的文档图像可以被调整为正向,从而减轻了用户的负担,提高了用户的使用效率。传统的文档图像自动判别方法是找到文档图像中的文本行,在4个可能的方向上分别做光学字符识别OCR (Optical Character Recognition)处理,得到4个可能方向上的识别字符及对应的置信度或识别距离,并计算文本行的平均置信度或平均识别距离。平均置信度最大或平均识别距离最小的方向被判别为文本行的方向。进而根据文本行的方向判断文档图像的方向。文本行 ...
【技术保护点】
一种识别图像块中文字的方向的方法,包括:分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;判断图像块中文字所属的语言组;调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量;基于调整后的正确性度量计算各个所述假设文字方向上的累积正确性度量;以及根据所述累积正确性度量识别图像块中文字的方向。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。