一种自动识别并分割文本图像的方法、系统及装置制造方法及图纸

技术编号:14984240 阅读:124 留言:0更新日期:2017-04-03 15:21
本发明专利技术公开了一种自动识别并分割文本图像的方法,包括步骤:S1、获取输入文本图像并进行预处理;S2、对文本图像进行分割以确定第一目标区域;S3、在第一目标区域内运行标号检测器,若标号检测器检测成功,则将检测结果输出至判别器以进行确认,并执行步骤S4,若标号检测器检测失败,则执行步骤S5;S4、基于判别器最终判定的标号位置以及第一目标区域信息,拟合出第二目标区域并截取;S5、使用图像处理技术处理以拟合出第三目标区域并截取。还公开了一种自动识别并分割文本图像的系统及装置。用户只需将屏幕中心准星对准文本图像中希望搜索的试题,按下拍照键,程序即可自动分割指定试题区域并上传,从而实现完整流畅的用户体验。

【技术实现步骤摘要】

本专利技术涉及图像识别领域,特别是涉及一种自动识别并分割文本图像的方法、系统及装置
技术介绍
传统教育中关于习题的辅导往往依赖于教师的参与,这在夜间或休息日会对学生的学习造成极大的困扰。随着移动设备的普及,网络搜题技术受到学生群体的广泛欢迎。其技术概括来讲就是通过终端设备(如手机、平板电脑等)采集试题信息,上传至云端服务器。服务器对输入信息进行分析处理,经过和数据库中海量的习题资料比对后将匹配度高的结果返回至终端。现有的搜题系统在终端采集方面主要分为两大路线:1、通过特殊设备采集试题信息,如点读笔就是通过读取事先印刷在纸张上的隐形编码记号来识别当前指向位置的内容;2、通过移动设备自带的摄像头,以照片的形式获取试题图片,再通过模式识别技术转换成对应的试题信息。其中方案1大多用在早教机、学习机等特殊设备中,因为它的技术实现需要硬件上的配合。方案2则多以软件的形式实现,主要应用在手机、平板等一般的移动便携式终端上。目前用户较多的拍照搜题类应用有:北京贞观雨科技有限公司开发的小猿搜题、北京东方皆冠科技有限公司开发的学习宝等产品。这些产品在终端采集时都应用了一种半自动的方法:首先将拍摄区域人为划分成若干固定栅格,用户按下拍照键后,程序会自动识别判断出包含试题的部分栅格,并将这些栅格组成的矩形区域作为试题区域上传,此外,服务器端接收整张图片,并以上传的试题区域为起始窗口,在不同尺度和方向上滑动窗口,并不断地识别窗口内容进行搜索。在返回结果时,只返回最多次重复出现的搜索结果。通过摄像头采集试题信息是目前搜题类应用软件的主流方式,但无一例外都需要用户手动选取试题区域。由于屏幕大小、题目文字间距过窄等因素,用户体验较差。此外,框题的完整与否直接影响到后续识别、搜索步骤的准确性,而手动选取的方式则存在太多差别,难以统一处理,需要设计相应的预处理步骤。现有主流技术中,通过栅格的方法粗略自动分割图片区域,这种方法实际上是将拍照后的手动调整工序转移到了拍照之前,并没有改变用户体验差的问题。而通过服务器端多窗口冗余搜索的方式,虽然在一定程度上提高了识别率,但付出了极大的运算资源消耗以及额外上传流量的代价。此外,由于准确性的原因,这些产品都没有完全去掉用户手动框选的步骤。即使自动分割正确,仍需要用户手动确认后再上传,并没有从本质上解决用户体验的问题。
技术实现思路
本专利技术针对现有技术的缺点,提供一种自动识别并分割文本图像的方法、系统及装置。用户只需将屏幕中心准星对准文本图像中希望搜索的试题,按下拍照键,程序即可自动分割指定试题区域并上传,从而实现完整流畅的用户体验。根据本专利技术的一个方面,提供一种自动识别并分割文本图像的方法,包括步骤:S1、通过移动终端上的摄像头获取输入文本图像,并进行预处理;S2、对经过预处理后的文本图像进行分割,并基于准星位置确定第一目标区域;S3、在第一目标区域内运行标号检测器,以检测是否存在标号,若标号检测器检测成功,则将检测结果输出至判别器以进行确认,并执行步骤S4,若标号检测器检测失败,则执行步骤S5;S4、基于判别器最终判定的标号位置以及第一目标区域信息,拟合出第二目标区域,并截取第二目标区域信息以用于输出;S5、当步骤S3中没有检测到标号时,则使用图像处理技术处理以拟合出第三目标区域,并截取第三目标区域信息以用于输出。优选地,所述输入文本图像获取方式还包括通过屏幕拷贝、网络下载以及通过其它终端发送。优选地,所述预处理包括白平衡、亮度补偿以及灰度化处理。优选地,步骤S2包括:S21、提取文本图像的梯度信息;S22、对梯度信息进行形态学闭运算处理,将每一行的像素值作水平方向投影;S23、基于准星位置,对投影结果进行搜索,以确定第一目标区域。优选地,所述标号检测包括步骤:S31、在第一目标区域内获取多个疑似标号区域;S32、将每一疑似标号区域分别缩放至固定大小,提取其统计特征,并将所提取的统计特征输出至判别器以进行确认。优选地,所述拟合包括对第一目标区域进行边界裁剪以及对裁剪后的目标区域内的文本信息进行缩进处理,以形成第二目标区域。优选地,所述边界裁剪包括通过分析第一目标区域内经过二值化处理后的梯度信息,确定第一目标区域内文本的最大宽度和最大高度。优选地,步骤S5中,所述使用图像处理技术处理包括步骤:S51、获取第一目标区域内经过二值化处理后的梯度信息;S52、基于所获取的梯度信息,在第一目标区域内进行最大轮廓提取,并将所提取轮廓的外接矩形作为第三目标区域输出。根据本专利技术的另一方面,提供一种自动识别并分割文本图像的系统,所述系统包括:第一模块,用于通过移动终端上的摄像头获取输入文本图像,并进行预处理;第二模块,用于对经过预处理后的文本图像进行分割,并基于准星位置确定第一目标区域;第三模块,用于在第一目标区域内运行标号检测器,以检测是否存在标号,若标号检测器检测成功,则将检测结果输出至判别器以进行确认,并运行第四模块,若标号检测器检测失败,则运行第五模块;第四模块,用于基于判别器最终判定的标号位置以及第一目标区域信息,拟合出第二目标区域,并截取第二目标区域信息以用于输出;第五模块,用于当在第三模块中没有检测到标号时,则使用图像处理技术处理以拟合出第三目标区域,并截取第三目标区域信息以用于输出。根据本专利技术的再一方面,提供一种自动识别并分割文本图像的装置,所述装置包括:存储器,用于存储一应用程序;处理器,用于运行所述程序执行以下步骤:S01、通过移动终端上的摄像头获取输入文本图像,并进行预处理;S02、对经过预处理后的文本图像进行分割,并基于准星位置确定第一目标区域;S03、在第一目标区域内运行标号检测器,以检测是否存在标号,若标号检测器检测成功,则将检测结果输出至判别器以进行确认,并执行步骤S04,若标号检测器检测失败,则执行步骤S05;S04、基于判别器最终判定的标号位置以及第一目标区域信息,拟合出第二目标区域,并截取第二目标区域信息以用于输出;S05、当步骤S03中没有检测到标号时,则使用图像处理技术处理以拟合出第三目标区域,并截取第三目标区域信息以用于输出。本专利技术的有益效果:本专利技术公开了一种自动识别并分割文本图像的方法、系统及装置,整个识别分割过程全自动完成,鲁棒性好;无需用户手动干预,完全可以去掉用户确认的步骤,用户体验好;由于分割是自动生成的,是有规律的,因此在服务器端可以不做裁剪等预处理而直接进行识别,服务端处理效率高;自动分割最大限度地减少了因为用户主观因素造成的试题信息损失,识别准确率更高。附图说明下面结合附图和实例对本专利技术作进一步说明:图1是根据本专利技术的一种自动识别并分割文本图像的方法流程示意图;图2是根据本专利技术的一种自动识别并分割文本图像的装置框图;图3是根据本专利技术实施例所使用的本文档来自技高网
...

【技术保护点】
一种自动识别并分割文本图像的方法,其特征在于,包括步骤:S1、通过移动终端上的摄像头获取输入文本图像,并进行预处理;S2、对经过预处理后的文本图像进行分割,并基于准星位置确定第一目标区域;S3、在第一目标区域内运行标号检测器,以检测是否存在标号,若标号检测器检测成功,则将检测结果输出至判别器以进行确认,并执行步骤S4,若标号检测器检测失败,则执行步骤S5;S4、基于判别器最终判定的标号位置以及第一目标区域信息,拟合出第二目标区域,并截取第二目标区域信息以用于输出;S5、当步骤S3中没有检测到标号时,则使用图像处理技术处理以拟合出第三目标区域,并截取第三目标区域信息以用于输出。

【技术特征摘要】
1.一种自动识别并分割文本图像的方法,其特征在于,包括步骤:
S1、通过移动终端上的摄像头获取输入文本图像,并进行预处理;
S2、对经过预处理后的文本图像进行分割,并基于准星位置确定第一目标区域;
S3、在第一目标区域内运行标号检测器,以检测是否存在标号,若标号检测器检测成功,则将检测结果输出至判别器以进行确认,并执行步骤S4,若标号检测器检测失败,则执行步骤S5;
S4、基于判别器最终判定的标号位置以及第一目标区域信息,拟合出第二目标区域,并截取第二目标区域信息以用于输出;
S5、当步骤S3中没有检测到标号时,则使用图像处理技术处理以拟合出第三目标区域,并截取第三目标区域信息以用于输出。
2.根据权利要求1所述的自动识别并分割文本图像的方法,其特征在于,步骤S1中,所述输入文本图像获取方式还包括通过屏幕拷贝、网络下载以及通过其它终端发送。
3.根据权利要求1所述的自动识别并分割文本图像的方法,其特征在于,步骤S1中,所述预处理包括白平衡、亮度补偿以及灰度化处理。
4.根据权利要求1所述的自动识别并分割文本图像的方法,其特征在于,步骤S2包括:
S21、提取文本图像的梯度信息;
S22、对梯度信息进行形态学闭运算处理,将每一行的像素值作水平方向投影;
S23、基于准星位置,对投影结果进行搜索,以确定第一目标区域。
5.根据权利要求1所述的自动识别并分割文本图像的方法,其特征在于,步骤S3中,所述标号检测包括步骤:
S31、在第一目标区域内获取多个疑似标号区域;
S32、将每一疑似标号区域分别缩放至固定大小,提取其统计特征,并将所提取的统计特征输出至判别器以进行确认。
6.根据权利要求1所述的自动识别并分割文本图像的方法,其特征在于,所述拟合包括对第一目标区域进行边界裁剪以及对裁剪后的目标区域内的文本信息进行缩进处理,以形成第二目标区域。
7.根据权利要求6所述的自动识别并分割文本图像的方法,其特征在于,所述边界裁剪包括通过分析第一目标区域内经过二值化处理后的梯度...

【专利技术属性】
技术研发人员:熊祎林建文
申请(专利权)人:珠海全志科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1