一种自动识别并分割文本图像的方法、系统及装置制造方法及图纸

技术编号：14984240 阅读：124 留言：0更新日期：2017-04-03 15:21

本发明专利技术公开了一种自动识别并分割文本图像的方法，包括步骤：S1、获取输入文本图像并进行预处理；S2、对文本图像进行分割以确定第一目标区域；S3、在第一目标区域内运行标号检测器，若标号检测器检测成功，则将检测结果输出至判别器以进行确认，并执行步骤S4，若标号检测器检测失败，则执行步骤S5；S4、基于判别器最终判定的标号位置以及第一目标区域信息，拟合出第二目标区域并截取；S5、使用图像处理技术处理以拟合出第三目标区域并截取。还公开了一种自动识别并分割文本图像的系统及装置。用户只需将屏幕中心准星对准文本图像中希望搜索的试题，按下拍照键，程序即可自动分割指定试题区域并上传，从而实现完整流畅的用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像识别领域，特别是涉及一种自动识别并分割文本图像的方法、系统及装置。
技术介绍
传统教育中关于习题的辅导往往依赖于教师的参与，这在夜间或休息日会对学生的学习造成极大的困扰。随着移动设备的普及，网络搜题技术受到学生群体的广泛欢迎。其技术概括来讲就是通过终端设备（如手机、平板电脑等）采集试题信息，上传至云端服务器。服务器对输入信息进行分析处理，经过和数据库中海量的习题资料比对后将匹配度高的结果返回至终端。现有的搜题系统在终端采集方面主要分为两大路线：1、通过特殊设备采集试题信息，如点读笔就是通过读取事先印刷在纸张上的隐形编码记号来识别当前指向位置的内容；2、通过移动设备自带的摄像头，以照片的形式获取试题图片，再通过模式识别技术转换成对应的试题信息。其中方案1大多用在早教机、学习机等特殊设备中，因为它的技术实现需要硬件上的配合。方案2则多以软件的形式实现，主要应用在手机、平板等一般的移动便携式终端上。目前用户较多的拍照搜题类应用有：北京贞观雨科技有限公司开发的小猿搜题、北京东方皆冠科技有限公司开发的学习宝等产品。这些产品在终端采集时都应用了一种半自动的方法：首先将拍摄区域人为划分成若干固定栅格，用户按下拍照键后，程序会自动识别判断出包含试题的部分栅格，并将这些栅格组成的矩形区域作为试题区域上传，此外，服务器端接收整张图片，并以上传的试题区域为起始窗口，在不同尺度和方向上滑动窗口，并不断地识别窗口内容进行搜索。在返回结果时，只返回最多次重复出现的搜索结果。通过摄像头采集试题信息是目前搜题类应用软件的...

【技术保护点】
一种自动识别并分割文本图像的方法，其特征在于，包括步骤：S1、通过移动终端上的摄像头获取输入文本图像，并进行预处理；S2、对经过预处理后的文本图像进行分割，并基于准星位置确定第一目标区域；S3、在第一目标区域内运行标号检测器，以检测是否存在标号，若标号检测器检测成功，则将检测结果输出至判别器以进行确认，并执行步骤S4，若标号检测器检测失败，则执行步骤S5；S4、基于判别器最终判定的标号位置以及第一目标区域信息，拟合出第二目标区域，并截取第二目标区域信息以用于输出；S5、当步骤S3中没有检测到标号时，则使用图像处理技术处理以拟合出第三目标区域，并截取第三目标区域信息以用于输出。

【技术特征摘要】
1.一种自动识别并分割文本图像的方法，其特征在于，包括步骤：
S1、通过移动终端上的摄像头获取输入文本图像，并进行预处理；
S2、对经过预处理后的文本图像进行分割，并基于准星位置确定第一目标区域；
S3、在第一目标区域内运行标号检测器，以检测是否存在标号，若标号检测器检测成功，则将检测结果输出至判别器以进行确认，并执行步骤S4，若标号检测器检测失败，则执行步骤S5；
S4、基于判别器最终判定的标号位置以及第一目标区域信息，拟合出第二目标区域，并截取第二目标区域信息以用于输出；
S5、当步骤S3中没有检测到标号时，则使用图像处理技术处理以拟合出第三目标区域，并截取第三目标区域信息以用于输出。
2.根据权利要求1所述的自动识别并分割文本图像的方法，其特征在于，步骤S1中，所述输入文本图像获取方式还包括通过屏幕拷贝、网络下载以及通过其它终端发送。
3.根据权利要求1所述的自动识别并分割文本图像的方法，其特征在于，步骤S1中，所述预处理包括白平衡、亮度补偿以及灰度化处理。
4.根据权利要求1所述的自动识别并分割文本图像的方法，其特征在于，步骤S2包括：
S21、提取文本图像的梯度信息；
S22、对梯度信息进行形态学闭运算处理，将每一行的像素值作水平方向投影；
S23、基于准星位置，对投影结果进行搜索，以确定第一目标区域。
5.根据权利要求1所述的自动识别并分割文本图像的方法，其特征在于，步骤S3中，所述标号检测包括步骤：
S31、在第一目标区域内获取多个疑似标号区域；
S32、将每一疑似标号区域分别缩放至固定大小，提取其统计特征，并将所提取的统计特征输出至判别器以进行确认。
6.根据权利要求1所述的自动识别并分割文本图像的方法，其特征在于，所述拟合包括对第一目标区域进行边界裁剪以及对裁剪后的目标区域内的文本信息进行缩进处理，以形成第二目标区域。
7.根据权利要求6所述的自动识别并分割文本图像的方法，其特征在于，所述边界裁剪包括通过分析第一目标区域内经过二值化处理后的梯度...

【专利技术属性】
技术研发人员：熊祎，林建文，
申请(专利权)人：珠海全志科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人