基于模型的去扭曲方法和设备技术

技术编号:2912391 阅读:314 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及基于模型的去扭曲方法和设备。提供了一种用于对获取的图像进行处理的设备和方法,更具体地讲,涉及一种用于对包括文档的获取的图像进行处理的设备和方法。在一个实施例中,描述了一种包括用于拍摄文档的相机的设备。在另一个实施例中,描述了一种用于对包括文档的获取的图像进行处理的方法,该方法包括如下步骤:将成像文档从其背景中区分出来;对获取的图像进行调整以减小由于利用相机所导致的畸变并且恰当地对文档进行定向。

【技术实现步骤摘要】
【国外来华专利技术】本申请是于2006年3月2日提交的第11/368,260号的美国申请的部分继续申请。本申请要求于2006年3月2日提交的第11/368,260号美国申请的优先权,通过引用将其公开并入于此。
本专利技术涉及一种用于对获取的图像进行处理的设备和方法,更具体地讲,涉及一种对包括文档的获取的图像进行处理的设备和方法。
技术介绍
由于诸如CD-ROM的存储介质变得越来越便宜,所以越来越多的文档不再以ASCII码进行存储而是以图像或像素格式进行存储。这些成像文档能够用于进行参考、搜索或发行。通常,通过诸如扫描仪或数字相机的输入装置来获取文档的存储图像。然而,当通过扫描仪或者在更坏的情况下通过数字相机获取图像中的文档内容时,会产生图像畸变的问题。图1A是示出了扫描仪的典型组件的框图。扫描仪通常用于获取文档110的图像。文档110被放置在扫描仪板112上。扫描头120在移动越过文档110,该扫描头120通常包括光学子系统122和电荷耦合器件(“CCD”)124。尽管图IA仅仅示出了二维视图,但是扫描头120既可以在由箭头114指示的方向上跨越文档进行移动,也可以在与箭头114垂直的方向上跨越文档进行移动。光学子系统122将从文档110反射的光聚焦到CCD 124上。通常,CCD 124被实现为光敏电容性元件的二维阵列。当光入射到CCD 124的光敏元件上时,电荷被俘获在半导体元件的耗尽区中。与这些光敏电容性元件相关联的电荷量与在一个取样周期内接收到的入射到各个元件上的光的强度-->有关。因此,通过经由对各个光敏电容性元件进行取样确定这些光敏电容性元件处的入射光的强度来获取图像。由光敏电容性元件产生的模拟信息经由模拟-数字(A/D)转换器130被转换成数字信息。A/D转换器130可将从CCD 124接收到的模拟信息按照串行方式或者并行方式进行转换。转换后的数字信息可以被存储在存储器140中。然后,根据存储在ROM 180中的控制软件,由处理器150对该数字信息进行处理。用户可以经由用户接口170控制扫描参数,并且经扫描的图像经由输出端口160被输出。图1B示出了数字相机的框图。与扫描仪几乎一样,可以利用数字相机的光学子系统122将从文档110反射的光聚焦到CCD 124上。在其它数字相机中,利用与CCD不同的诸如CMOS传感器的器件来获取从图像反射的光。在数字相机的情况下,与扫描仪相对,光学子系统122不像在扫描仪中那样沿着文档的表面移动。相反,在数字相机中,通常,光学系统122相对于诸如文档的待成像物体是静止的。除了数字相机以外,也可以将从胶片式相机获取的照片进行数字化。针对获取文档图像和其它图像,相机提供了超过扫描仪的显著优点。例如,与扫描仪相比,相机通常是更加便携的。此外,由于扫描仪需要将获取的图像放置于扫描仪板上,所以与扫描仪相比,相机能够获取更大批的图像。然而,利用相机获取图像会产生利用扫描仪时不存在的困难。例如,当利用相机时光环境会发生改变,而在扫描仪中光环境通常是受到控制的。此外,利用相机会引入图像畸变,这取决于各种变量,诸如相机相对于图像的角度、相机使用的透镜及其到图像的距离、包括文档的图像是位于平坦表面上还是位于弯曲表面上、以及其它因素。由于扫描仪利用位于距待成像文档的固定距离处的移动扫描仪头,所以在扫描仪中通常不会发生这些畸变。已经进行了关于解决图像畸变的问题的许多研究。Brown和Seales提出了一种基于3D图像的针对任意扭曲文档的通用去歪斜(de-skewing)算法("Image Restoration Arbitrarily Warped-->Documents,"IEEE Transactions on Pattern Analysis and MachineIntelligence,Vol.26,No.10,(2004).)。Zhang等人开发了一种用于对由平板扫描仪获取的文档图像进行处理的阴影深度(depth-from-shading)算法。("Restoration of curved Document Image Through3D Shape Modeling,"Pro.of the 6th International Conference onDocument Analysis and Recognition,pp.10-15(2004).)。但是,这种技术高度依赖于照明条件,因此不适于用数字相机获取的图像。认识到数字相机与扫描仪相比较而言是更加方便的输入装置,研究人员已经开发出了用于减小由数字相机获取的图像中的图像畸变问题的模型。例如,Cao等人开发了一种用于估计打开的书籍的柱面形状的参变模型("Rectifying the Bound Document Image Captured bythe Camera:A Model Based Approach,"Proc.of InternationalConference on Document Analysis and Recognition,pp.71-75(2003))。利用这种技术的主要限制在于:仅当相机透镜的透镜平面与成像书籍的表面平行时,该模型才起作用。Liang等人已经开发了一种用于对书籍的页表面进行建模并且利用页面上的印刷文本内容的属性(平行和相等的行间距)来恢复表面形状的可展表面("Flattening Curved Documents in Images,"InternationalConference on Computer Vision and Pattern Recognition,pp.338-345(2005年6月))。通过利用这种技术,相机透镜的透镜平面不再需要与书籍的表面平行。然而,被Cao和Liang用来校正成像文档上的畸变的模型基于文本行信息。换言之,这些模型高度依赖于成像书籍中的文本行的存在。如果书籍的一页具有许多照片或等式而非文本行,则该Cao和Liang模型将不会良好工作。因此,仍然需要一种用于获取文档的图像的改进设备和方法,该改进设备和方法可以利用相机相对于扫描仪的优点,还能减小经由相机而非扫描仪获取文档图像通常会出现的畸变。优选的是,该设备和方法应该能够不管在成像文档上是否存在文本行都可以减小获取的图像中的畸变,从而使得可以对具有照片和等式的文档的获取的图像中-->的畸变进行校正。此外,优选的是,该设备和方法不应该受限于当相机透镜的透镜平面与书籍的表面平行时产生的图像。
技术实现思路
本专利技术描述了一种用于对包括成像文档的获取的图像进行处理的设备和方法。在一个实施例中,该设备包括用于获取成像文档的静止相机。在另一个实施例中,利用非静止相机获取成像文档。在另一个实施例中,用于对包括文档的获取的图像进行处理的方法包括如下步骤:将成像文档与其背景进行区分;对获取的图像进行调整以减小由于利用相机而导致的畸变并且恰当地对文档进行定向。在另一个实施例中,提供了一种用于对获取的弯曲文档的图像进行去扭曲的设备和方法。附图说明图1A示出了现有技术的文档扫描仪。图1B示出了现有技术的数字相机。图2示出了用于对获取的图像进行处理的优选方法的总体流程图。图3示出了用于对获取的图像进行处理的方本文档来自技高网
...

【技术保护点】
一种用于对包括成像文档的获取的图像进行处理的方法,所述方法包括: 检测所述获取的图像中的与所述成像文档和所述获取的图像的剩余部分之间的过渡有关的图形信息; 从所述图形信息中选择与所述成像文档的边缘对应的一条或多条线; 基于 与所述成像文档的边缘对应的一条或多条线的交点,计算所述成像文档的角; 基于与所述成像文档的边缘对应的一条或多条线,将所述成像文档从所述获取的图像的背景隔离; 在所述成像文档上设置弯曲坐标网; 将所述弯曲坐标网拉伸为矩形坐标 网;以及 将所述矩形坐标网调整为比例恰当的矩形坐标网。

【技术特征摘要】
【国外来华专利技术】US 2006-3-2 11/368,2601.一种用于对包括成像文档的获取的图像进行处理的方法,所述方法包括:检测所述获取的图像中的与所述成像文档和所述获取的图像的剩余部分之间的过渡有关的图形信息;从所述图形信息中选择与所述成像文档的边缘对应的一条或多条线;基于与所述成像文档的边缘对应的一条或多条线的交点,计算所述成像文档的角;基于与所述成像文档的边缘对应的一条或多条线,将所述成像文档从所述获取的图像的背景隔离;在所述成像文档上设置弯曲坐标网;将所述弯曲坐标网拉伸为矩形坐标网;以及将所述矩形坐标网调整为比例恰当的矩形坐标网。2.如权利要求1所述的方法,还包括如下步骤:基于所述计算出的偏差,将所述成像文档的像素的坐标映射到与所述成像文档的非畸变透视图对应的坐标。3.如权利要求2所述的方法,还包括如下步骤:根据对所述非畸变成像文档的格式的所述确定,旋转所述非畸变成像文档。4.一种用于对获取的图像进行处理的系统,所述获取的图像包括成像文档,所述系统包括:用于从所述图形信息中选择与所述成像文档的边缘对应的一条或多条线的装置;用于基于与所述成像文档的边缘对应的一条或多条线的交点计算所述成像文档的角的装置;用于基于与所述成像文档的边缘对应的一条或多条线将所述成像文档从所述获取的图像的背景隔离的装置;用于在所述成像文档上设置弯曲坐标网的装置;用于将所述弯曲坐标网拉伸为矩形坐标网的装置;用于将所述矩形坐标网调整为比例恰当的矩形坐标网的装置。5.一种用于对获取的图像进行处理的计算机可读介质,该计算机可读介质携载有一个或更多个指令的一个或更多个序列,当所述一个或更多个指令的一个或更多个序列被一个或多个处理器执行时使得所述一个或更多个处理...

【专利技术属性】
技术研发人员:吴明辉李荣锋李文新小爱德华P希尼卡尔钱库尔特A雷佩尔杰
申请(专利权)人:计算机连接管理中心公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1