一种连续视频图像处理的纸质文档扫描仪及扫描方法,由工作台、视频摄像机及处理机组成,工作台面上铺设特定颜色和标识的衬垫,视频摄像机与处理机连接,纸质文档放置在工作台衬垫指定位置,视频摄像机安装在工作台上方,视频摄像头向下拍摄工作台场景,视频摄像机输出拍摄视频连接至处理机,处理机对视频图像进行连续处理,输出数字化文件,并将处理结果连接显示在显示器上。本发明专利技术高效准确的对纸质文档特别是已经装订好的纸质文档进行数字化扫描,将纸质文档快速转化为方便网络利用和共享的数字信息资源。
【技术实现步骤摘要】
本专利技术涉及射频图像处理
,具体涉及一种,快速将纸质文档转化为数字化文件。
技术介绍
随着人类社会进入信息时代,传统保存的纸质文档,包括纸质档案、纸质文件、书籍等需要进行数字化工作,转化为数字文件,利用计算机进行管理,才能够有效的进行利用和共享。现有的纸质文档数字化扫描方法还存在一些问题,主要有以下方式: 1.利用传统扫描仪数字化:传统扫描仪基于光电线扫方式将一张张纸质档案扫描成数字文件,需要人工手动将一张张文档翻阅好,固定到规定位置进行扫描,才能够完成一张纸质文档的数字化工作。2.利用照相机数字化:很多系统和专利利用照相机拍照实现纸质文档的数字化,将纸质文档放置在平台上,人工翻阅一页后,控制照相机拍摄,得到纸质文档的一幅图像,连续工作时,则需要人工翻阅与相机拍摄的配合,严重降低了数字化的速度。现有的两种数字化方法,都需要页面切换与页面扫描在每一张文档扫描时进行配合,这种方式严重影响了纸质文档的数字化速度。特别是对于装订好的纸质文档,在不拆页时,这两种数字化扫描系统工作效率都很低,数字化速度极慢,严重限制了现有传统文档的信息化进程。因此急需开发一种高效的纸质文档扫描系统与方法,实现纸质文档特别是已经装订好的纸质文档的高效扫描问题,尽快将传统纸质文档转化为数字信息资源。
技术实现思路
本专利技术所要解决的技术问题是:解决上述传统纸质文档扫描系统与方法存在的问题,而提供一种,能够高效准确的对纸质文档特别是已经装订好的纸质文档进行数字化扫描,将纸质文档快速转化为方便网络利用和共享的数字信息资源。本专利技术采用的技术方案是:这种连续视频图像处理的纸质文档扫描仪,由工作台、视频摄像机及处理机组成,工作台面上铺设特定颜色和标识的衬垫,视频摄像机与处理机连接,纸质文档放置在工作台衬垫指定位置,视频摄像机安装在工作台上方,视频摄像头向下拍摄工作台场景,视频摄像机输出拍摄的视频信号连接至处理机,处理机对视频图像进行连续处理,输出数字化文件,并将处理结果连接显示在显示器上。上述技术方案中,所述的处理机采用PC机、DSP或工控机。上述技术方案中,所述的特定颜色和标识的衬垫,指衬垫采用不透明材料,能更换,材料颜色采用与纸质文档反差较大的颜色,一般采用黑色不反光材料,并在衬垫上标识出各种规范的页面框,以指示纸质文档的放置位置。上述技术方案中,所述的处理机包括有依次连接的单帧图像提取模块、文档区域提取模块、页面区域分割模块、变形校正模块、数字文档组织模块;视频摄像机采集的连续视频通过这些模块的连续处理就可以得到较高质量的数字文件,还可以与OCR模块连接,实现数字文件的字符识别。本专利技术的连续视频图像处理的纸质文档扫描方法为,在工作台上方安装摄像机,由摄像机拍摄工作台视频,将视频传输到处理机进行处理,输出数字文件;具体处理步骤为: (1)通过视频摄像头采集拍摄工作台上包含纸质文档页面的连续视频; (2)单帧图像提取:从连续视频中自动提取出具有最佳质量的纸质文档图像; (3)文档区域分割:从纸质文档图像中自动提取出纸质文档对应的区域,去除工作台背景影响; (4)单页文档分割:从纸质文档区域中自动分割出纸质文档单页区域; (5)变形校正模块:对单页图像进行变形校正,校正拍摄过程文档页面的变形; (6)连续工作得到文档每页对应的高质量图像,进行组织后输出数字化文档,并可以与OCR系统连接,得到字符识别后的数字文件。上述的单帧图像提取步骤是:从视频中提取对应翻阅一次翻书动作的最佳质量图像,去除连续视频中对应同一文档页面的重复视频帧,其输出结果为包含文档页面和工作台背景信息的一幅图像,称之为文档图像,保证得到的文档图像包含纸质文档所有的页面信息,并且不重复;基本方法是通过连续视频帧间差异以及纸质文档区域质量评价函数,自动取出一帧质量最好的作为纸质文档页的输出结果图像。上述的文档区域分割步骤是:从文档图像中分割出纸质文档页面对应的图像区域,包含有纸质文档两页的信息,称之为页面图像,页面图像去除了工作台背景影响,只包含纸质文档对应图像;基本方法是利用纸质文档页面区域和衬垫区域在图像亮度和颜色上的差异,设置自适应阈值,对文档图像进行图像分割,从而提取出页面图像。上述的单页文档分割步骤是:从页面图像中将纸质文档双页区域分割成两个包含纸质文档一个页面的图像,称之为单页图像,单页图像只包含了文档一页的信息;基本方法是在获得的页面图像中,利用垂直方向投影方法,利用投影曲线的波峰波谷特性将页面图像分割成两幅单页图像。上述的变形校正步骤是:校正因为纸质文档厚度带来的扫描图像存在的扭曲现象,基本方法是首先对单页图像进行垂直方向像素差累加投影,找出图像文字部分的左边缘,用以确定每行文字的标准坐标;按照这些坐标范围确定数条行基准线作为文字矫正参照线,再提取出每个文字的位置,按照校正参照线进行调整,实现变形校正。本专利技术成功的研制了一种高效率、高质量、自动化程度高的新型纸质文档数字化扫描系统与方法,能够对纸质文档,特别是已经装订好的纸质文档进行快速扫描,通过连续视频采集的方式,不需要人工与页面扫描的配合,通过机器的智能、自动处理,从连续视频中自动提取出每一页文档对应图像,并进行校正等质量提升工作,能够实现高速的数字化扫描处理,提高纸质文档的扫描速度和精度。附图说明: 图1为本专利技术系统实施例1结构 图2为本专利技术系统实施例2结构图; 图3为本专利技术系统模块 图4为处理机处理流程图。图中,1-工作台,2-视频摄像机,3-处理机,4-显示器,5-支架。具体实施方式: 参见图1、图2、图3,本专利技术的基于连续采集与处理的纸质文档扫描仪,系统由工作台1、视频摄像机2及处理机3构成,工作台面上铺设特定颜色和标识的衬垫,视频摄像机与PC机或者DSP连接,拍摄工作台上视频,由PC机或者DSP对拍摄视频进行处理。工作过程中,纸质文档放置在工作台衬垫指定位置,已经装订好的文档由人工或者机械逐页翻阅,单张未装订文档则由人工或者机械逐页放置。视频摄像头安装在工作台上方,并向下拍摄工作台场景,从而获得包含有纸质文档页面内容的连续视频,为后续视频图像处理提供原始素材。采集的视频传输到PC机或者DSP,由PC机或者DSP进行连续处理,从视频中提取出纸质文档页面对应图像,从而完成纸质档案扫描任务。上述技术方案中,视频摄像机安装在工作台上方合适高度,安装高度可调节,摄像机垂直向下拍摄,拍摄工作台面上的视频,工作台面放置与待扫描纸质文档反差较大的衬垫。参见图1、图2,其信号流程及信号处理过程如下: 1、视频摄像机采集工作台面上视频信息,如果采用模拟摄像机,经过视频采集卡将图像的模拟信号转换为可编程处理的数字信号并经过压缩编码传输到到PC机,如果采用数字摄像机,则通过网络接口将摄像机输出数字视频传输到PC机。2、PC机对输入的视频进行显示、存储和处理: (1)显示:将工作台面上的视频信号显示到相应的视频窗口,以便对扫描工作进行实时监控; (2)存储:将工作台面视频信号进行缓存,以便像处理程序调用; (3)处理:通过处理输入的工作台面视频,实现对视频中纸质文档页面图像区域的自动提取与校正,处理步骤如图3所示,并将处理结果显示输出到输出窗口。3、PC机提供用户界面可以对扫描过程本文档来自技高网...
【技术保护点】
一种连续视频图像处理的纸质文档扫描仪,其特征在于:由工作台、视频摄像机及处理机组成,工作台面上铺设特定颜色和标识的衬垫,视频摄像机与处理机连接,纸质文档放置在工作台衬垫指定位置,视频摄像机安装在工作台上方,视频摄像头向下拍摄工作台场景,视频摄像机输出拍摄的视频信号连接至处理机,处理机对视频图像进行连续处理,输出数字化文件,并将处理结果连接显示在显示器上。
【技术特征摘要】
1.一种连续视频图像处理的纸质文档扫描仪,其特征在于:由工作台、视频摄像机及处理机组成,工作台面上铺设特定颜色和标识的衬垫,视频摄像机与处理机连接,纸质文档放置在工作台衬垫指定位置,视频摄像机安装在工作台上方,视频摄像头向下拍摄工作台场景,视频摄像机输出拍摄的视频信号连接至处理机,处理机对视频图像进行连续处理,输出数字化文件,并将处理结果连接显示在显示器上。2.根据权利要求1所述的连续视频图像处理的纸质文档扫描仪,其特征在于:所述的处理机采用PC机、DSP或工控机。3.根据权利要求1所述的连续视频图像处理的纸质文档扫描仪,其特征在于:所述的特定颜色和标识的衬垫指衬垫采用不透明材料,能更换,材料颜色采用与纸质文档反差较大的颜色,并在衬垫上标识出各种规范的页面框。4.根据权利要求1所述的连续视频图像处理的纸质文档扫描仪,其特征在于:所述的处理机包括有依次连接的单帧图像提取模块、文档区域提取模块、页面区域分割模块、变形校正模块、数字文档组织模块。5.一种连续视频图像处理的纸质文档扫描方法,其特征在于:在工作台上方安装摄像机,由摄像机拍摄工作台视频,将视频传输到处理机进行处理,输出数字文件;具体处理步骤为: (1)通过视频摄像头采集拍摄工作台上包含纸质文档页面的连续视频; (2)单帧图像提取:从连续视频中自动提取出具有最佳质量的纸质文档图像; (3)文档区域分割:从纸质文档图像中自动提取出纸质文档对应的区域,去除工作台背景影响; (4)单页文档分割:从纸质文档区域中自动分割出纸质文档单页区域; (5)变形校正模块:对单页图像进行变形校正,校正拍摄过程文档页面的变形; (6)连续工作得到文档每页对应的高质量图像,进行组织后输出数字化文档,并可以与OCR系统连接,得到字符识...
【专利技术属性】
技术研发人员:刘植林,文艺,黄瑜,
申请(专利权)人:长沙鹏阳信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。