图像处理方法和装置制造方法及图纸

技术编号：9312354 阅读：98 留言：0更新日期：2013-11-06 18:46

提供了一种图像处理方法和装置。该图像处理方法包括步骤：生成图像的第一尺度的二值图，其中第一尺度小于图像的原始尺度；基于第一尺度的二值图，检测图像中的至少一个文本行；生成图像的第二尺度的二值图，其中第二尺度大于第一尺度；针对每个文本行，计算第一尺度的二值图中的相应部分与第二尺度的二值图中的相应部分之间的相似度，并将相似度低于预定水平的文本行作为噪声去除；针对未被去除的文本行中的一个或更多个，对第二尺度的二值图中的相应部分进行光学字符识别以确定相应文本行的文字取向；以及根据所确定的文字取向确定图像的取向。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般涉及图像处理，更具体地，涉及用于识别文档图像的取向的方法和装置。
技术介绍
在对文档图像（诸如扫描页面）进行处理时，由于例如通过扫描仪、照相机等图像输入设备获取的文档图像有可能相对于其实际取向发生了旋转（例如，旋转了90°、180°、270°），因此需要对文档图像进行取向识别。下列文献提供了文档图像取向识别的方法的示例：Ranjith Unnikrishnan,“Combined Script and Page OrientationEstimation using the Tesseract OCR engine”,ICDAR2009；万鑫，“文本图像的校正方法”，CN 101833648A；Zhigang Fan,“Page orientation detection based on selective character recognition”，US 2009/0274392 A1。
技术实现思路
传统的方法所针对的对象主要是比较标准的文档图像，但如果待处理的文档图像是图文混杂，或者以图像为主的话，上面所列举的这些方法的处理效果就不佳了。本专利技术提供一种对文档图像进行取向识别方法和装置，其能够快速地以高准确度判断整个文档图像的取向。根据本专利技术的一个实施例，一种图像处理方法包括步骤：生成图像的第一尺度的二值图，其中第一尺度小于图像的原始尺度；基于第一尺度的二值图，检...
<a href="http://www.xjishu.com/zhuanli/55/201210137925.html" title="图像处理方法和装置原文来自X技术">图像处理方法和装置</a>

【技术保护点】
一种图像处理方法，包括步骤：生成图像的第一尺度的二值图，其中所述第一尺度小于所述图像的原始尺度；基于所述第一尺度的二值图，检测所述图像中的至少一个文本行；生成所述图像的第二尺度的二值图，其中所述第二尺度大于所述第一尺度；针对每个所述文本行，计算所述第一尺度的二值图中的相应部分与所述第二尺度的二值图中的相应部分之间的相似度，并将所述相似度低于预定水平的文本行作为噪声去除；针对未被去除的所述文本行中的一个或更多个，对所述第二尺度的二值图中的相应部分进行光学字符识别以确定相应文本行的文字取向；以及根据所述文字取向确定所述图像的取向。

【技术特征摘要】
1.一种图像处理方法，包括步骤：
生成图像的第一尺度的二值图，其中所述第一尺度小于所述图像的原
始尺度；
基于所述第一尺度的二值图，检测所述图像中的至少一个文本行；
生成所述图像的第二尺度的二值图，其中所述第二尺度大于所述第一
尺度；
针对每个所述文本行，计算所述第一尺度的二值图中的相应部分与所
述第二尺度的二值图中的相应部分之间的相似度，并将所述相似度低于预
定水平的文本行作为噪声去除；
针对未被去除的所述文本行中的一个或更多个，对所述第二尺度的二
值图中的相应部分进行光学字符识别以确定相应文本行的文字取向；以及
根据所述文字取向确定所述图像的取向。
2.如权利要求1所述的方法，在确定所述文字取向的步骤之前还包
括步骤：基于所述第二尺度的二值图，根据以下因素中的一个或更多个确
定所述文本行的优先级：
文本行的尺寸；
基于纹理确定的文本行置信度；以及
文本行的灰度方差，并且
在确定所述文字取向的步骤中，按照所述优先级的顺序依次确定所述
文本行的文字取向。
3.如权利要求2所述的方法，在根据所述文字取向确定所述图像的
取向的步骤中，通过以下方式确定所述图像的取向：
根据按照所述优先级的顺序依次确定的所述文字取向进行投票，并且
当得票最多的取向的票数与得票第二多的取向的票数之差达到预定
阈值时，将所述图像的取向确定为所述得票最多的取向，如果投票过程中
未检测到所述票数之差达到所述预定阈值，则将所述图像的取向确定为最
终得票最多的取向。
4.如权利要求1所述的方法，其中，基于所述第一尺度的二值图检
测文本行的步骤还包括：基于所述第一尺度的二值图，利用基于纹理的方
法和/或二值投影方法估计所述文本行的置信度，并将置信度低于预定水
平的文本行作为噪声去除。
5.如权利要求1所述的方法，在生成所述第二尺度的二值图的步骤
之后还包括步骤：
基于所述第二尺度的二值图，利用二值投影方法估计所述文本行的置
信度，并将置信度低于预定水平的文本行作为噪声去除。
6.如权利要求1-5中任一项所述的方法，其中，仅针对长宽比大于
预定阈值的文本行中尺寸最大的N个文本行执行基...

【专利技术属性】
技术研发人员：孙俊，潘屹峰，直井聪，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人