行方向判定方法以及装置制造方法及图纸

技术编号:2924779 阅读:139 留言:0更新日期:2012-04-11 18:40
一种行方向判定方法包含:算出对纵写或横写文字组读取结果的纵方向文字识别结果的第1平均确信度、和横方向文字识别结果的第2平均确信度的步骤;以及根据第1平均确信度和第2平均确信度的大小判定纵写或横写的步骤。这样,通过使用上述判定方法,能指定正确的行方向,从而提高了行方向判定的准确率。

【技术实现步骤摘要】

本专利技术涉及OCR (Optical Character Recognition:光学字符识别) 技术,更详细地说,涉及用于判定是纵写还是横写的技术。
技术介绍
OCR技术是以由扫描仪等所读入的文件图像数据为对象,识别布局, 对文本区域实施文字识别的技术。近年来,为了进行票单等的文件图像 数据的保管、检索、再利用,使用了OCR技术的文件管理系统受到注目。 在该文件管理系统中,在对文本区域实施文字识别时,首先根据文字配 置求出行,然而有时由于文本区域内的文字配置而误判定行方向。以往,判定行方向的技术有以下技术。例如,在日本特开平08-263587号公报中揭示了使用语言信息的文 字串方向推断技术。具体地说,生成在纵方向和横方向投影的图像的直 方图,根据该直方图检测图像与图像的间隔窄的方向来判定为行方向。 在所有的方向上文字间隔都大致相同的情况下,在2个方向上进行文字 识别,使用单词词典把识别结果的文字串分解为词节。将此时的词节数 按纵方向和横方向进行比较,输出词节数少的方向。例如,在包含 銀行 振込的图像中,在横方向,"銀行"和"振込"构成词节,词节数为2个。在 纵方向,为"銀"、"振"、"行"和"込"4个,横方向被选择为行方向。另外,在日本特开平08-63545号公报中揭示了以下技术。即,抽出 被指定为处理对象的文字区域的外接行,针对各外接行生成文字方向。 针对各外接行和各文字方向进行文字识别处理来生成文字点阵,针对各 文字点阵进行语言处理,求出各文字点阵的构成单词率或者独立词含有 率。根据针对各文字点阵所求出的构成单词率或者独立词含有率,决定 指定区域的文字方向和行方向。而且,在日本特开平07-220027号公报中揭示了以下技术。即,抽 出被指定为处理对象的文字区域的外接行,针对各外接行生成文字方向。 针对各外接行和各文字方向进行文字识别处理来生成文字点阵,针对各 文字点阵进行语言处理,求出各文字点阵的构成单词数或者书写长度是1 的独立词数。根据针对各文字点阵所求出的构成单词数或者书写长度是1 的独立词数,决定指定区域的文字方向和行方向。而且,在日本特开2000-20638号公报中揭示了能可靠判别纵写/横 写的文字串方向判别方法。具体地说,进行图像读取处理,把记载有 文字串的文件分解为像素,作为图像数据来读取;第l文字串抽出处理, 假定文件的文字串是纵写,从由图像读取处理所读取的图像数据中抽出 纵方向的开头部的文字串;第l文字识别处理,从由第l文字串抽出处 理所抽出的文字串中切出构成该文字串的多个文字进行识别;第1单词 检索处理,参照单词词典,对使用由第1文字识别处理所识别的多个文 字所拼写的单词进行检索;第2文字串抽出处理,假定文件的文字串是 横写,从由图像读取处理所读取的图像数据中抽出横方向的开头部的文 字串;第2文字识别处理,从由第2文字串抽出处理所抽出的文字串中 切出构成该文字串的多个文字进行识别;第2单词检索处理,参照单词 词典,对使用由第2文字识别处理所识别的多个文字所拼写的单词进行 检索;以及纵橫判定处理,根据第1和第2单词检索处理的检索结果, 判定记载在文件内的文字串的方向是纵写还是横写。并且,在日本特开平08-194773号公报中揭示了以下技术。B卩,具 有第l横写/纵写判定步骤,从所输入的文件图像中针对各文字抽出外 接矩形,针对该文件图像的行方向和列方向各方算出各外接矩形之间的重复度,对行方向和列方向的重复度进行比较,判定文件图像是横写还是纵写;以及第2横写/纵写判定步骤,求出在文件图像的行方向和列方 向上邻接的各个外接矩形的中心间距,以行方向和列方向的中心间距的 平均值为基础,判定文件图像是横写还是纵写,其中,根据处理对象文 字数,选择第1和第2判定步骤来进行是横写还是纵写的判定。之后, 进行外接矩形的坐标转换,并检测文件图像的倾斜,在进行了倾斜校正 后,进行文字切出和文字识别。而且,在日本特开昭62-54380号公报中揭示了以下技术。即,在纵方向和横方向上扫描输入图像内的伪正方形的区域,针对形成文字部的 像素求出直方图,通过对根据该直方图所求出的文字间隔长度的平均值 进行比较,使用简易方法抽出输入图像的行方向。并且,在日本特开昭61-235990号公报中揭示了以下技术。即,在 纵方向和横方向上扫描输入图像,求出形成文字部的像素的直方图,通 过对根据直方图所求出的纵方向和横方向各自的文字间隔长度的平均值 进行比较,简易地抽出文件的行方向,对识别候选文字进行编辑。艮口, 把所切出的识别对象文字的矩形顺次输入到识别部,针对所切出的文字 的各像素,调查是否在箭头所示的方向上包含注目像素并连成M个以上, 设定方向码。针对各方向码调査各像素的连结性,抽出笔划,并抽出笔 划数、位置、长度等的特征量。把所抽出的特征量与登记在词典内的文 字的特征量进行比较,把最相似的文字作为识别候选文字。而且,在美国专利公开公报2004/0179733中揭示了进行包含文字信 息的图像的读取的图像读取装置。具体地说,该装置具有标示 (labeling)处理单元,对所读入的黑白2种灰度的单色图像内所包含 的构成文字的连续黑像素区域进行分组,抽出分组后的黑像素连续区域 的组外接矩形信息;行抽出处理单元,从由标示处理单元所抽出的分组 后的黑像素连续区域的组外接矩形的位置信息中抽出行矩形信息;标点 识别单元,根据由标示处理单元所分组的黑像素连续区域的位置和尺寸, 识别标点、句号、逗号;以及行方向判定单元,根据标点、句号、逗号 相对于图像内所包含的文字的行矩形的位置关系,判定行方向。并且,在美国专利6959121号公报中揭示了以下技术。g卩,在纵和 横的两个方向上抽出成为文件图像背景的白像素列,针对大于等于预先 给定的阈值的白像素列,对邻接的白像素列之间进行合并,在纵和横的 两个方向上生成白像素区域的矩形框,抽出矩形框中在纵和横的两个方 向上大于等于规定宽度的矩形框,把所抽出的纵方向和横方向的矩形框 中数量多的决定为该文件的文字串方向。白像素列是实质上与间距相关 联的信息。专利文献1日本特开平08-263587号公报专利文献2日本特开平08-63545号公报专利文献3日本特开平07-220027号公报专利文献4日本特开2000-20638号公报专利文献5日本特开平08-194773号公报专利文献6日本特开昭62-54380号公报专利文献7日本特开昭61-235990号公报专利文献8美国专利公开公报2004/017973专利文献9美国专利6959121号公报在上述技术中,有揭示了在判定行方向时使用单词信息作为语言信 息的处理的技术。然而,在对不存在单词的部分进行处理的情况下,有 时会误判断。并且,在使用间距判定行方向的情况下,不能使用纵横全 都相同的间距对所记载的文字区域进行准确判断。而且,在根据标点、 句号、逗号的位置关系判定行方向的情况下,对于不存在这些关系的部 分,不能进行判断。这样,在现有技术中,行方向判定的准确率不高。
技术实现思路
因此,本专利技术的目的是提供提高行方向判定的准确率的新技术。 根据本专利技术的第1方式的行方向判定方法包含算出对纵写或横写 文字组读取结果的纵方向文字识别结果的第1平均确信度、和横方本文档来自技高网
...

【技术保护点】
一种行方向判定方法,由计算机执行,该方法包含: 计算步骤,算出对纵写或横写文字组读取结果的纵方向文字识别结果的第1平均确信度、和横方向文字识别结果的第2平均确信度;以及 判定步骤,根据前述第1平均确信度和前述第2平均确信度的大小判定纵写或横写。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:胜山裕小泽宪秋
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利