【技术实现步骤摘要】
文字识别方法和文字识别装置
本公开涉及文字识别方法装置,尤其涉及对包括手写文字的文档的扫描图像中的文字的识别。
技术介绍
OCR(OpticalCharacterRecognition)是利用光学技术对文字和字符进行扫描识别的技术。包括图像输入、图像预处理例如二值化、版面分析例如将所要识别的文档进行分段分行处理、字符切割、最后对分割出的进行字符识别。现有的OCR技术在对印刷体文字或者带有噪声的印刷体文字进行识别时具有较好的分割效果,因为印刷体文字具有常规的排版格式,并且即使对于印刷体的纸质文档经扫描而采集到的图像来说,虽然这样的图像在扫描过程中可能引入噪声,但也不会明显地降低OCR的识别准确度。然而,现有的OCR方法并不能很好地解决由于某些特殊的字体或特殊的排版格式例如潦草的手写体等所导致的识别准确度下降的问题,而这样的识别准确度下降主要由字符分割阶段的对字符的错误分割而造成的。手写体文字因手写者的书写特性的不同存在较大差异,并且不同语系的语言构造字的过程也有较大差异,这更加加剧了字符正确分割的难度。 ...
【技术保护点】
1.一种文字识别方法,包括:/n获取图像;/n将所述图像划分成各自包含文字的笔划的多个矩形区域;/n对于所述多个矩形区域中的相互邻近的第一区域和第二区域,其中所述第二区域的水平方向的宽度小于所述第一区域的水平方向的宽度并且所述第一区域与所述第二区域部分重叠,如果所述第一区域和所述第二区域重叠的区域的水平方向的宽度与所述第二区域的水平方向的宽度的比值大于或等于第一预设阈值,则将所述第一区域与所述第二区域合并为一个区域;以及/n基于改变后的矩形区域划分进行文字识别。/n
【技术特征摘要】
1.一种文字识别方法,包括:
获取图像;
将所述图像划分成各自包含文字的笔划的多个矩形区域;
对于所述多个矩形区域中的相互邻近的第一区域和第二区域,其中所述第二区域的水平方向的宽度小于所述第一区域的水平方向的宽度并且所述第一区域与所述第二区域部分重叠,如果所述第一区域和所述第二区域重叠的区域的水平方向的宽度与所述第二区域的水平方向的宽度的比值大于或等于第一预设阈值,则将所述第一区域与所述第二区域合并为一个区域;以及
基于改变后的矩形区域划分进行文字识别。
2.根据权利要求1所述的方法,所述多个矩形区域还包括与所述第二区域邻近且不与所述第二区域重叠的第三区域,如果进一步地,所述第三区域与所述第二区域的水平方向的距离与所述第二区域的水平方向的宽度的比值大于或等于第二预设阈值,则将所述第一区域与所述第二区域合并为一个区域。
3.根据权利要求1或2所述的方法,如果所述第一区域和所述第二区域不属于相同的连通域,则不将所述第一区域与所述第二区域合并为一个区域。
4.根据...
【专利技术属性】
技术研发人员:张春燕,孙俊,于小亿,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。