【技术实现步骤摘要】
本申请总地涉及计算机视觉和图像处理领域,特别涉及可以在严重透视畸变情况下提供准确的基线计算结果的字符识别后处理方法、字符识别后处理设备。本申请还涉及包括该字符识别后处理设备的图像拾取设备。
技术介绍
随着配有照相机的手持设备的发展,基于照相机的移动OCR(光学字符识别)应用在多种环境中存在迫切的需要,这些环境如文档的室外数字化、外文街头符号识别、以及针对弱视者的字音输入等。传统的字符识别过程大致可包括文字区域检测步骤、预处理步骤、字符切割步骤、字符识别步骤和后处理步骤。在OCR中基于字符尺寸和位置进行的后处理步骤是非常重要的,其旨在校正不同尺寸的字符(拉丁字符的大小写字符,平假名和片假名的大小字符等),标点与字符混淆等。后处理步骤通常利用基线信息,这是因为准确的基线信息可以准确地描述每个字符的位置和尺寸。但是在基于照相机的图像捕获中,由视角变化引起的透视畸变是常见现象,透视畸变可以包括由于被拍摄的字符相对于照相机的光轴存在各种角 ...
【技术保护点】
一种字符识别后处理方法,包括:组件识别步骤,从字符行区域图像中提取组件并获得组件的识别结果;顶点和底点获取步骤,获取各组件的与字符方向线的距离最大的顶点与底点;消失点确定步骤,使用顶线和底线的交叉点来确定消失点,其中顶线是基于连接各组件的任两个顶点的线段中具有彼此相一致的斜率和截距的线段的顶点组而确定的,并且底线是与顶线类似地基于连接各组件的任两个底点的线段中具有彼此相一致的斜率和截距的线段的底点组确定的;基线确定步骤,基于所确定的消失点来确定至少两条基线;以及字符校正步骤,基于所确定的基线来校正所述识别结果。
【技术特征摘要】
1.一种字符识别后处理方法,包括:
组件识别步骤,从字符行区域图像中提取组件并获得组件的识别
结果;
顶点和底点获取步骤,获取各组件的与字符方向线的距离最大的
顶点与底点;
消失点确定步骤,使用顶线和底线的交叉点来确定消失点,其中
顶线是基于连接各组件的任两个顶点的线段中具有彼此相一致的斜率
和截距的线段的顶点组而确定的,并且底线是与顶线类似地基于连接
各组件的任两个底点的线段中具有彼此相一致的斜率和截距的线段的
底点组确定的;
基线确定步骤,基于所确定的消失点来确定至少两条基线;以及
字符校正步骤,基于所确定的基线来校正所述识别结果。
2.根据权利要求1所述的方法,其中,顶点和底点获取步骤还
包括:
中心点确定步骤,确定所有组件的中心点;以及
字符方向线获取步骤,使用所确定的中心点通过线性拟合方法获
取字符方向线。
3.根据权利要求1所述的方法,其中,顶点和底点获取步骤还
包括:
属性设置步骤,基于识别结果来针对每个组件设置与基线级别有
关的属性;
组件选择步骤,选择具有相同属性的至少两个组件;以及
字符方向线获取步骤,使用所选组件的中心点通过线性拟合方法
获取字符方向线。
4.根据权利要求1-3之一所述的方法,其中,消失点确定步骤还
包括:
主角度确定步骤,计算连接任两个顶点的线段的角度并选择包含
\t最大线段数量的角度范围作为主角度范围;
顶点组确定步骤,根据主角度范围来确定所述顶点组;以及
顶线获取步骤,基于所述顶点组通过线性拟合方法来获取顶线。
5.根据权利要求4所述的方法,其中,顶点组确定步骤还包括:
顶点记录步骤,选择其角度在主角度范围内的线段的顶点及这些
顶点在这些线段中的出现次数;
第一分割线获取步骤,通过使用所记录的顶点并把出现次数作为
权重进行线性拟合来获取第一分割线;以及
顶点组选择步骤,从第一分割线将所记录的顶点划分出的第一组
和第二组中选择总顶点出现次数较大的组作为所述顶点组。
6.根据权利要求5所述的方法,其中,在顶线获取步骤中把出
现次数作为权重进行线性拟合来获取顶线。
7.根据权利要求4所述的方法,其中,顶点组确定步骤还包括:
构图步骤,以连接任何两个顶点的线段为边并且以这些线段的角
度与主角度范围之间的差为权重来构图;<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。