【技术实现步骤摘要】
本专利技术涉及OCR (Optical Character Recognition:光学字符识别) 技术,更详细地说,涉及用于判定是纵写还是横写的技术。
技术介绍
OCR技术是以由扫描仪等所读入的文件图像数据为对象,识别布局, 对文本区域实施文字识别的技术。近年来,为了进行票单等的文件图像 数据的保管、检索、再利用,使用了OCR技术的文件管理系统受到注目。 在该文件管理系统中,在对文本区域实施文字识别时,首先根据文字配 置求出行,然而有时由于文本区域内的文字配置而误判定行方向。以往,判定行方向的技术有以下技术。例如,在日本特开平08-263587号公报中揭示了使用语言信息的文 字串方向推断技术。具体地说,生成在纵方向和横方向投影的图像的直 方图,根据该直方图检测图像与图像的间隔窄的方向来判定为行方向。 在所有的方向上文字间隔都大致相同的情况下,在2个方向上进行文字 识别,使用单词词典把识别结果的文字串分解为词节。将此时的词节数 按纵方向和横方向进行比较,输出词节数少的方向。例如,在包含 銀行 振込的图像中,在横方向,"銀行"和"振込"构成词节,词节数为2个。在 ...
【技术保护点】
一种行方向判定方法,由计算机执行,该方法包含: 计算步骤,算出对纵写或横写文字组读取结果的纵方向文字识别结果的第1平均确信度、和横方向文字识别结果的第2平均确信度;以及 判定步骤,根据前述第1平均确信度和前述第2平均确信度的大小判定纵写或横写。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:胜山裕,小泽宪秋,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。