用于文档图像的畸变校正方法和设备技术

技术编号：12670160 阅读：91 留言：0更新日期：2016-01-07 14:46

本发明专利技术涉及用于文档图像的畸变校正方法和设备。一种用于文档图像的畸变校正方法包括基线提取步骤，用于提取文档图像中包含的文本区域中的文本行的基线，其中各文本行对应于一条基线；基线延伸步骤，用于基于所提取的基线中包含的长基线延伸所提取的基线中包含的短基线；以及校正步骤，用于基于所提取的长基线和经延伸的短基线来校正文档图像的畸变。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及用于校正文档图像的崎变的方法和设备。更具体而言，本专利技术涉及用于至少通过延伸文档图像中包含的短文本行来校正文档图像的崎变的方法和设备。
技术介绍
近年来，信息技术已经在诸如计算机视觉、图像处理和理解等的多个领域快速发展，并且尤其电子文档处理领域获得日益广泛的关注并且得到广泛应用。在电子文档处理中，文档图像识别（诸如OCR)已经被应用于并且有助于多种应用 W及多种设备，该多种设备从具有图像拾取装置（诸如扫描仪等）的用于文档处理的专业办公设备到具有用于拾取文档图像的装置（诸如照相机等）的、可拾取并处理文档图像W 清楚识别送样的文档的内容的个人设备（诸如PC计算机、PDA、手持设备）。随着配备有照相机的手持设备的发展，在各种环境（诸如文档的办公室外数字化、外语路标的识别、W及视力障碍人员的文本语音输入）中迫切需要移动（基于照相机的）OCR应用。然而，由于扫描仪和照相机之间的差别，移动OCR成为新的挑战。在基于扫描仪的文档捕获中，文档通常被压板按压，因此基本是平的，并且由于文档的物理状态导致的崎变几乎没有。而在基于照相机的文档捕获中，要被捕获的文档通常是不受约束的并且可能是不平的，因此物理扭曲文档所导致的崎变是常见的现象。崎变将大大降低OCR准确度，送是因为不平的文档形状使得针对被捕获图像的典型文本处理（诸如，分割（文本行分割和字符分割）和识别）即使在局部旋转之后仍变得困难。因此，用于照相机捕获的文档图像的崎变校正是必要的用于移动OCR的处理。现有技术中存在关于文档图像的崎变校正的多种研究。 -种研究是基...

【技术保护点】
一种用于文档图像的畸变校正设备，包括：基线提取单元，被配置用于提取文档图像中包含的文本区域中的文本行的基线，其中各文本行对应于一条基线；基线延伸单元，被配置用于基于所提取的基线中包含的长基线延伸所提取的基线中包含的短基线；以及校正单元，被配置用于基于所提取的长基线和经延伸的短基线来校正文档图像的畸变。

【技术特征摘要】

【专利技术属性】
技术研发人员：魏晓明，
申请(专利权)人：佳能株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人