用于检测文档边界的方法技术

技术编号:12882403 阅读:70 留言:0更新日期:2016-02-17 15:07
本发明专利技术提供了一种用于检测描绘背景上的硬拷贝文档的采集数字图像中的文档边界的方法。分析所述采集数字图像的每一彩色通道以确定表示图像数据的复杂度的对应繁忙度指标。选择及分析具有最低繁忙度的所述彩色通道以检测所述所描绘的硬拷贝文档的文档边界。可使用所述受检测文档边界来执行视角校正过程以确定经校正数字图像,其中所述所描绘的文档具有实质上矩形边界。

【技术实现步骤摘要】
【国外来华专利技术】用于检测文档边界的方法现有申请案的交叉参考本申请案主张2014年4月28日提交的标题为用于检测文档边界的方法(METHODFORDETECTINGADOCUMENTBOUNDARY)的第14/263,181号美国专利申请案的优先权,所述申请案是2013年6月12日提交的标题为用于检测文档边界的方法(METHODFORDETECTINGADOCUMENTBOUNDARY)的第61/833,952号美国临时专利申请案的非临时申请案。
本专利技术涉及数字成像的领域,且更确切地说涉及用于将文档定位于采集数字图像内的方法。
技术介绍
数码相机提供优于用于采集文档图像和其它图像的扫描仪的显著优点。例如,数码相机通常比扫描仪更具便携性。此外,因为扫描仪要求必须将要数字化的文档置于扫描仪压板上,所以与扫描仪相比,数码相机能够采集更多样的文档类型(例如,较大文档或安装在框架中的文档)的图像。然而,数码相机的使用造成了使用扫描仪时并不存在的难题。举例来说,当使用数码相机时照明条件是变化的,而照明条件对于扫描仪来说通常受到控制。此外,数码相机的使用可引入几何失真,这可取决于各种因素,例如数码相机相对于文档的角度及距离、数码相机所使用的透镜,及文档是否位于平坦表面或曲面上。因为扫描仪通常利用移动扫描头,所以在相距在压板上保持平坦的文档的固定距离处,此类失真通常不会发生在扫描仪中。利用数码相机采集文档图像的另一难题是多样的不同可能的背景形状、图案及颜色。授予Nepomniachtchi的标题为“用于文档的移动图像采集及处理的方法(Methodsformobileimagecaptureandprocessingofdocuments)”的美国专利8,326,015揭示了用于使用移动装置进行文档图像采集及处理的方法。金融文档的图像是使用移动通信装置采集且经处理以进行数据提取。处理包含自动地检测图像内的文档、用几何学校正图像、对图像进行二值化、校正图像的定向及校正图像的大小。将文档定位在采集图像内的过程使用降色(转换为灰阶)及形态学运算以抑制噪音。识别“表决”点,其表示文档的边沿且所述点逼近直线。通过寻找直线的交叉点确定文档拐角。授予Nepomniachtchi等人的标题为“用于移动图像采集及检查处理的方法(Methodsformobileimagecaptureandprocessingofchecks)”的美国专利8,000,514揭示了用于使用移动装置进行文档图像采集及处理的方法。使用移动通信装置采集检查图像且处理所述图像以进行数据提取。此专利以与前述美国专利8,326,015相同的方式教示文档位置。使用视角校正基于已确定的文档位置对所采集的检查图像进行二值化及处理。授予Nepomniachtchi等人的标题为“用于移动图像采集及检查处理的系统(Systemsformobileimagecaptureandprocessingofchecks)”的美国专利7,978,900揭示了用于使用移动装置进行自动文档处理的方法。优化并增强采集图像以进行数据提取。处理操作包含自动地检测图像内的文档、用几何学校正图像、对图像进行二值化、校正图像的定向及校正图像的大小。授予Nepomniachtch的标题为“用于移动图像采集及文档处理的方法(Methodsformobileimagecaptureandprocessingofdocuments)”的美国专利7,953,268中描述了类似过程。授予Abràmoff等人的标题为“用于确定用于分类图像中的图案或对象的最优特征的方法及系统(Methodsandsystemsfordeterminingoptimalfeaturesforclassifyingpatternsorobjectsinimages)”的美国专利8,340,437揭示了用于确定用于分类图案或对象的特征的方法。所描述方法包含分离彩色通道及使用独立分量分析来进行对象检测以用于医学成像。授予Zhang的标题为“用于处理数字化采集图像的系统及方法(Systemsandmethodsforprocessingadigitallycapturedimage)”的第2003/0156201号美国专利申请案揭示了用于处理文档的数字化采集图像的方法。所述方法包含将数字化采集图像变换为灰阶图像及施加自适性阈值以确定二进制图像。二进制图像是使用迭代像素级数进行搜索以检测多个边沿。分析所检测的多个边沿以确定与成像文档相关联的拐角使得已识别的拐角可用于视角校正。授予Heaney,Jr.等人的标题为“照相文档成像系统(Photographicdocumentimagingsystem)”的美国专利7,835,589描述了用于处理包含文档的采集图像的方法。所述方法包含区分成像文档与其背景、调整采集图像以减少失真及适当地定向文档。使用边沿检测算法识别成像文档的边沿且将线的交叉点确定为潜在拐角。授予Konishi的标题为“图像处理方法、图像处理设备、图像读取设备及图像形成设备(Imageprocessingmethod,imageprocessingapparatus,imagereadingapparatus,andimageformingapparatus)”的美国专利8,320,683描述了用于比较所获得文档图像与一组参考图像的且确定哪个参考图像最像所获得参考图像的方法。仍然需要改善用于处理文档的采集图像的方法以识别可用于执行视角校正的文档边界。
技术实现思路
本专利技术表示一种用于检测文档的采集数字图像中的文档边界的方法,所述方法至少部分由数据处理系统实施且包括:接收使用描绘背景上的硬拷贝文档的数字成像系统采集的彩色数字图像,其中所述彩色数字图像包含用于多个彩色通道的图像数据;对于所述彩色通道中的每一者,分析所述图像数据以确定对应的繁忙度指标,所述繁忙度指标表示所述图像数据的复杂度;选择具有最低繁忙度的所述彩色通道;针对所述选定彩色通道分析所述图像数据以检测所述描述的硬拷贝文档的所述文档边界;以及将所述受检测文档边界的指示存储在处理器可存取存储器中。本专利技术具有以下优点:基于已确定繁忙度来确定其中可最稳定地检测文档边界的彩色通道。它具有额外优点:可使用受检测文档边界来校正所采集的彩色数字图像的视角失真以提供视角校正文档图像。这缓解了使用数码相机作为便捷的便携式文档扫描仪的主要缺点中的一者。附图说明图1是根据本专利技术的实施例的示出用于处理采集数字图像的系统的组件的高层次图;图2是根据示范性实施例的示出处理采集数字图像的方法的流程图;以及图3示出描绘根据图2的方法处理采集数字图像的一系列图。应理解,附图是为了说明本专利技术的概念且不一定按比例绘制。具体实施方式在以下描述中,将就通常将被实施为软件程序来描述本专利技术的一些实施例。所属领域技术人员将容易认识到,此软件的等效物也可在硬件中构造。因为图像操控算法及系统是众所周知的,所以本描述将尤其针对形成根据本专利技术的方法的部分或更直接与所述方法协作的算法及系统。此类算法及系统的其它方面连同用于产生及以其它方式处理其中所涉及的图像信号的硬件及软件(本文中没有具体示出或描述)可选自所属领域中已知的此类系统、算法、组件及元件本文档来自技高网
...
用于检测文档边界的方法

【技术保护点】
一种用于检测文档的采集数字图像中的文档边界的方法,所述方法至少部分由数据处理系统实施且包括:接收使用描绘背景上的硬拷贝文档的数字成像系统采集的彩色数字图像,其中所述彩色数字图像包含用于多个彩色通道的图像数据;对于所述彩色通道中的每一者,分析所述图像数据以确定对应的繁忙度指标,所述繁忙度指标表示所述图像数据的复杂度;选择具有最低繁忙度的所述彩色通道;针对所述选定彩色通道分析所述图像数据以检测所述所描绘的硬拷贝文档的所述文档边界;以及将所述受检测文档边界的指示存储在处理器可存取存储器中。

【技术特征摘要】
【国外来华专利技术】2013.06.12 US 61/833,952;2014.04.28 US 14/263,1811.一种用于检测文档的采集数字图像中的文档边界的方法,所述方法至少部分由数据处理系统实施且包括:接收使用描绘背景上的硬拷贝文档的数字成像系统采集的彩色数字图像,其中所述彩色数字图像包含用于多个彩色通道的图像数据;对于所述彩色通道中的每一者,分析所述图像数据以确定对应的繁忙度指标,所述繁忙度指标表示所述图像数据的复杂度,其中所述繁忙度指标的所述确定包含确定所述图像数据的可压缩性指标;选择具有最低繁忙度的所述彩色通道;针对所述选定彩色通道分析所述图像数据以检测所述所描绘的硬拷贝文档的所述文档边界;以及将受检测的所述文档边界的指示存储在处理器可存取存储器中。2.根据权利要求1所述的方法,其进一步包含在计算所述繁忙度指标之前对所述彩色通道中的每一者设置所述图像数据的阈值。3.根据权利要求2所述的方法,其中所述图像数据的所述阈值设置包含:分析所述图像数据以确定自适性阈值;以及使用所述自适性阈值以设置所述图像数据的阈值。4.根据权利要求3所述的方法,其中基于所述图像数据的统计性质确定所述自适性阈值。5.根据权利要求2所述的方法,其中所述繁忙度指标的所述确定包含对沿通过经阈值设置的所述图像数据的一组路径的转变的次数进行计数。6.根据权利要求2所述的方法,其中所述繁忙度指标的所述确定包含对经阈值设置的所述图像数据执行连接分量分析。7.一种用于检测文档的采集数字图像中的文档边界的方法,所述方法至少部分由数据处理系统实施且包括:接收使用描绘背景上的硬拷贝文档的数字成像系统采集的彩色数字图像,其中所述彩色数字图像包含用于多个彩色通道的图像数据;对于所述彩色通道中的每一者,分析所述图像数据以确定对应的繁忙度指标,所述繁忙度指标表示所述图像数据的复杂度;选择具有最低繁忙度的所述彩色通道;针对所述选定彩色通道分析所述图像数据以检测所述所描绘的硬拷贝文档的所述文档边界;以及将受检测的所述文档边界的指示存储在处理器可存取存储器中;以及基于受检测的所述文档边界施加视角校正过程于所述采集的彩色数字图像以确定经校正数字图像,其中所述所描绘的文档具有实质上矩形的边界。8.根据权利要求1所述的方法,其中所述繁忙度指标的所述确定包含确定所述图像数据的图像熵指标。9.根据权利要求1所述的方法,其中所述繁忙度指标的所述确定包含确定所述图像数据的频率内容指标。10.根据权利要求1所述的方法,其中所述文档边界的...

【专利技术属性】
技术研发人员:路易斯·詹姆斯·贝亚托约翰·J·阿莱希奥
申请(专利权)人:柯达阿拉里斯股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1