一种实现逐行扫描的方法及系统技术方案

技术编号:13200934 阅读:36 留言:0更新日期:2016-05-12 10:18
本发明专利技术公开了一种实现逐行扫描的方法及系统。该方法,包括:逐行扫描文本得到图片,获取所述图片的横向中心线;识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;把所述最近的文字行作为逐行扫描结果。本发明专利技术通过获取图片的横向中心线,把距离所述横向中心线最近的文字行作为逐行扫描的结果,实现逐行扫描,提高文字识别和搜索的准确度。

【技术实现步骤摘要】

本专利技术涉及图片处理
,尤其涉及一种实现逐行扫描的方法及系统
技术介绍
因为扫描笔的笔尖开口固定,而书本、试卷等书籍的字体和行距是不同的,扫描的图片可能包含多行的文本,利用扫描笔扫描时很容易把多余的数据扫描进去,从而影响文字识别和搜索的准确度。因此如何实现逐行扫描,以提高文字识别和搜索的准确度是目前亟需解决的问题。
技术实现思路
本专利技术提供了一种实现逐行扫描的方法及系统,通过获取图片的横向中心线,把距离所述横向中心线最近的文字行作为逐行扫描的结果,实现逐行扫描,提高文字识别和搜索的准确度。为实现上述设计,本专利技术采用以下技术方案:—方面,提供了一种实现逐行扫描的方法,该方法,包括:逐行扫描文本得到图片,获取所述图片的横向中心线;识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;把所述最近的文字行作为逐行扫描结果。优选地:所述逐行扫描文本得到图片,获取所述图片的横向中心线,包括:逐行扫描文本得到图片,将所述图片进行灰度化处理得到灰度化图片;将所述灰度化图片进行二值化处理得到二值化图片;获取所述二值化图片的横向中心线;所述识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行,包括:确定所述二值化图片中的连续白色像素行形成的空白分隔行;根据所述空白分隔行识别出二值化图片中的黑色像素行形成的文字行;确定距离所述二值化图片的横向中心线最近的文字行。优选地,所述把所述最近的文字行作为逐行扫描结果,包括:从所述二值化图片中,截取所述最近的文字行作为逐行扫描结果。优选地,所述把所述最近的文字行作为逐行扫描结果,包括:从所述二值化图片中,抹掉除所述最近的文字行之外的文字行作为逐行扫描结果。优选地,所述从所述二值化图片中,抹掉除所述最近的文字行之外的文字行,包括:确定所述最近的文字行的高度方向的上边缘线和下边缘线;从二值化图片中把上边缘线往上的黑色像素点转变成白色像素点;把下边缘线往下的黑色像素点转变成白色像素点。优选地,所述从所述二值化图片中,抹掉除所述最近的文字行之外的文字行,包括:确定所述最近的文字行的上方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;或确定所述最近的文字行的下方的空白分隔行,从所述二值化图片中把下方的空白分隔行往下的黑色像素点转变成白色像素点;或确定所述最近的文字行的上方的空白分隔行和下方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;把下方的空白分隔行往下的黑色像素点转变成白色像素点。另一方面,提供了一种实现逐行扫描的系统,该系统,包括:获取模块,用于逐行扫描文本得到图片,获取所述图片的横向中心线;文字行识别模块,用于识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;逐行扫描模块,用于把所述最近的文字行作为逐行扫描结果。优选地:所述获取模块,包括:灰度化单元,用于逐行扫描文本得到图片,将所述图片进行灰度化处理得到灰度化图片;二值化单元,用于将所述灰度化图片进行二值化处理得到二值化图片;获取单元,用于获取所述二值化图片的横向中心线;所述文字行识别模块,包括:空白分隔行确定单元,用于确定所述二值化图片中的连续白色像素行形成的空白分隔行;文字行识别单元,用于根据所述空白分隔行识别出二值化图片中的黑色像素行形成的文字行;文字行确定单元,用于确定距离所述二值化图片的横向中心线最近的文字行。优选地,所述逐行扫描模块包括:截取单元,用于从所述二值化图片中,截取所述最近的文字行作为逐行扫描结果。优选地,所述逐行扫描模块包括:抹掉单元,用于从所述二值化图片中,抹掉除所述最近的文字行之外的文字行作为逐行扫描结果。优选地,所述抹掉单元,包括:边缘确定单元,用于确定所述最近的文字行的高度方向的上边缘线和下边缘线;转变单元,用于从二值化图片中把上边缘线往上的黑色像素点转变成白色像素点;把下边缘线往下的黑色像素点转变成白色像素点。优选地,所述抹掉单元用于:确定所述最近的文字行的上方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;或确定所述最近的文字行的下方的空白分隔行,从所述二值化图片中把下方的空白分隔行往下的黑色像素点转变成白色像素点;或确定所述最近的文字行的上方的空白分隔行和下方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;把下方的空白分隔行往下的黑色像素点转变成白色像素点。与现有技术相比,本专利技术的有益效果为:逐行扫描文本得到图片,获取所述图片的横向中心线;识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;把所述最近的文字行作为逐行扫描结果。本专利技术通过获取图片的横向中心线,把距离所述横向中心线最近的文字行作为逐行扫描的结果,实现逐行扫描,提高文字识别和搜索的准确度。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术【具体实施方式】中提供的一种实现逐行扫描的方法的第一实施例的方法流程图一。图2是本专利技术【具体实施方式】中提供的一种实现逐行扫描的方法的第二实施例的方法流程图一。图3是本专利技术【具体实施方式】中提供的一种实现逐行扫描的方法的第二实施例的方法流程图二。图4是本专利技术【具体实施方式】中提供的一种实现逐行扫描的系统的第一实施例的结构方框图。图5是本专利技术【具体实施方式】中提供的一种实现逐行扫描的系统的第二实施例的结构方框图一。图6是本专利技术【具体实施方式】中提供的一种实现逐行扫描的系统的第二实施例的结构方框图二。【具体实施方式】为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其是本专利技术【具体实施方式】中提当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种实现逐行扫描的方法,其特征在于,包括:逐行扫描文本得到图片,获取所述图片的横向中心线;识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;把所述最近的文字行作为逐行扫描结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:张春雷龙安忠
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1