文字行提取方法和装置制造方法及图纸

技术编号：5342045 阅读：249 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种文字行提取方法和装置，属于光学字符识别领域。包括：对全景二值图像的各连通域统计，得到字符宽度和字符高度，根据字符宽度和字符高度对各连通域合并；将得到各第一尺度块间的参考水平间距，根据参考水平间距将各第一尺度块合并；将得到各第二尺度块间的第二参考水平间距，根据第二参考水平间距将各第二尺度块合并；将得到的第三尺度块排序后将第三尺度块左右两端既定数目的第一尺度块作延长线，根据延长线将各第三尺度块合并为文字行。本发明专利技术分别对应字符、单词和词段进行多尺度合并，再以得到的文字行为基础自顶向下将被排除的尺度块添加回文字行中，减少了不完整字符对文字行提取的干扰，保证了得到的文字行的有效性和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于光学字符识别领域，特别涉及一种文字行提取方法和装置。
技术介绍
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的技术原理为首先，光学摄像头按照一定频率对被扫描资料进行连续拍照，获取被扫资料的图像序列，然后将图像序列拼接成一幅全景二值图像，最后在得到的全景图像中提取待识别文字行并进行OCR 识别。文字行提取有多种方法，大体分为自顶向下、自底向上以及自顶向下自底向上两者相结合三种，但这些方法多是针对印刷体文档或者手写文本的，对于扫描笔获取的全景二值图像处理效果不好。这是因为扫描笔获取的全景二值图像具有其自身的不同于印刷体文档及手写文本的特点(1)图像内的文字行很少，图像内的字符存在不完整的情况，故得到的图像不利于信息统计，使部分自底向上的方法失效；(2)图像的文字行形状多变，有可能是倾斜的，甚至是弯曲的，使部分自顶向下的方法失效。为此，需要一种专门针对扫描笔获取的全景二值图像的文字行提取方法。
技术实现思路
本专利技术所要解决的问题为提供一种文字行提取方法和装置，利用全景二值图像的特点去除图像中的不完整字符，有效减小了不完整字符...

【技术保护点】
一种文字行提取方法，其特征在于，包括如下步骤：步骤一：对全景二值图像中的各连通域进行统计，得到字符宽度和字符高度，根据字符宽度和字符高度对各连通域进行合并，得到第一尺度块；步骤二：将得到的第一尺度块进行排序，得到各第一尺度块间的参考水平间距，根据参考水平间距将各第一尺度块进行合并得到第二尺度块；步骤三：将得到的第二尺度块进行排序，得到各第二尺度块间的第二参考水平间距，根据第二参考水平间距将各第二尺度块进行合并得到第三尺度块；步骤四：将得到的第三尺度块进行排序，排序后将第三尺度块左右两端既定数目的第一尺度块作延长线，根据延长线将各第三尺度块合并为文字行。

【技术特征摘要】

【专利技术属性】
技术研发人员：李永彬，
申请(专利权)人：汉王科技股份有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人