The present invention discloses a method and apparatus for fluoroscopic correction of document images. The method includes: determining the document image in Arabia on the part of the digital and the long string of Arabia digital content; according to the Arabia long digital string content, create a reference image; according to the Arabia part of the digit string and the reference image, and calculate the correction function; according to the correction function, the document image perspective correction.
【技术实现步骤摘要】
本专利技术一般地涉及图像处理领域。具体而言,本专利技术涉及一种能够对包含长阿拉伯数字串的文档图像进行透视校正的方法和设备。
技术介绍
在现代社会中,存在有各种各样的证件、卡片、文档等,例如身份证,名片,银行卡,户口本,驾驶证,护照、派出所的户籍管理文档等。某些单位或者个人需要频繁的收集或存档这些信息,需要将这些证件、卡片、文档等留存电子件。除了一些特殊的读取工具以外,通常的电子化方法就是拍照,然后存储图像或者对图像进行识别后存储所识别的信息。在拍照留存的过程中,往往需要解决透视变换的问题。这是因为:由于环境或设备的限制,对这些证件、卡片、文档等进行拍摄时,有可能不是正对着拍摄对象的表面拍摄,而是与拍摄对象的表面的法线方向之间存在一定的角度,造成拍照结果受到倾斜的影响,这种倾斜通常被称为透视变换。为了下一步的识别和存储,必须对图像进行透视校正,然后才能进行版面分析、识别等后续处理。传统的方法是分析拍摄的图像,找出其边缘和角点,或者直接识别图像的内容,根据上述信息与标准模板进行比对,根据透视变换模型建立变换公式,进行透视投影变换。因此,传统的方法在每次校正之前,都需要建立特定于证件、卡片、文档等的标准模板,根据拍摄图像和标准模板图像之间的匹配进行校正。建立标准模板通常是非常繁琐的事情,需要用尺子测量所有要用到的角点之间的相对距离。如果需要电子化的证件、卡片、文档等的种类比较多,或者同一种电子化对象的信息位置不固定,那么这些方法就不太适用。另外,如果用户手持身份证进行拍摄的话,手容易挡住身份证的四个角点,无法基于角点进行处理。也就是说,传统的进 ...
【技术保护点】
一种对包含长阿拉伯数字串的文档图像进行透视校正的方法,包括:确定所述文档图像中所述长阿拉伯数字串所在的部分以及所述长阿拉伯数字串的内容;根据所述长阿拉伯数字串的内容,创建参考图像;根据所述长阿拉伯数字串所在的部分与所述参考图像,计算校正函数;以及根据所述校正函数,对所述文档图像进行透视校正。
【技术特征摘要】
1.一种对包含长阿拉伯数字串的文档图像进行透视校正的方法,包括:确定所述文档图像中所述长阿拉伯数字串所在的部分以及所述长阿拉伯数字串的内容;根据所述长阿拉伯数字串的内容,创建参考图像;根据所述长阿拉伯数字串所在的部分与所述参考图像,计算校正函数;以及根据所述校正函数,对所述文档图像进行透视校正。2.如权利要求1所述的方法,其中,确定所述文档图像中所述长阿拉伯数字串所在的部分以及所述长阿拉伯数字串的内容包括:对所述文档图像进行二值化处理,以得到二值化图像;提取所述二值化图像中的所有连通域;利用数字OCR引擎,对所提取的连通域进行OCR识别;在OCR结果中,搜索置信度高、彼此接近、形成一个最长串的一组连通域;将所述一组连通域的外接矩形所包围的区域,确定为所述文档图像中所述长阿拉伯数字串所在的部分。3.如权利要求2所述的方法,其中,确定所述文档图像中所述长阿拉伯数字串所在的部分以及所述长阿拉伯数字串的内容还包括:将所述OCR结果中与所述长阿拉伯数字串所在的部分对应的识别结果中置信度最高的一组识别结果,确定为所述长阿拉伯数字串的内容。4.如权利要求2所述的方法,其中,对所述文档图像进行二值化处理,以得到二值化图像包括:针对所述文档图像中的每个像素,将该像素的R、G、B中的最大值作为灰度图像中对应位置的像素值,以得到灰度图像;利用二值化阈值,对所述灰度图像进行二值化,以得到二值化图像。5.如权利要求2所述的方法,其中,对所述文档图像进行二值化处理,以得到二值化图像包括:针对所述文档图像中的每个像素,取该像素的R、G、B中的最大值与大于1的预定常数之积、以及255中的较小者,作为灰度图像中对应位置的像素值,以得到灰度图像;利用二值化阈值,对所述灰度图像进行二值化,以得到二值化图像。6.如权利要求4或5所述的方法,其中,在进行二值化之前,还对灰度图像中的每个灰度值pi,进行如下公式所示的黑色像素增强处理:pi=255/(1+(αpi)β...
【专利技术属性】
技术研发人员:李鑫,刘伟,范伟,孙俊,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。