A test paper segmentation algorithm in complex scenes is presented in the following steps: 1) image edge is obtained from original image by gray level transformation and edge detection algorithm; 2) connected area and its outer rectangle are calculated by image edge; 3) connected area is merged according to IOU of outer rectangle of different connected area; 4) character discrimination model is constructed based on convolutional neural network to guide the merging of connected area. After merging, the connected area is divided into character areas by rectangular contours; 5) the text line is constructed to segment the text line area by using the result of step 4; 6) the question number discrimination model is constructed based on convolutional neural network, and the test area is segmented by combining the result of step 5). The segmentation algorithm provided by the invention has good segmentation effect in the task of test paper segmentation under complex scenes, and can well segment character area, text line area and test question area.
【技术实现步骤摘要】
一种复杂场景下的试卷分割算法
本专利技术属于电子图像分割技术以及卷积神经网络领域,特别涉及一种复杂场景下的试卷分割算法。
技术介绍
随着智慧教育以及人工智能的发展,在诸多应用场景中,移动设备拍摄的试卷图像分割是其中一个关键环节。由于移动设备拍摄场景和角度不固定,图像的尺寸、清晰度、局部曝光程度往往具有不确定性,试卷本身存在手写体打印体混合等复杂场景。目前已经出现了上千种图像分割的方法,但是在复杂场景下的试卷分割任务中,对于字符区域、文本行区域、试题区域分割效果往往难以满足需求。
技术实现思路
为了解决上述问题,本专利技术针对复杂场景下的试卷图像,提供一种能够很好的将字符区域、文本行区域、试题区域分割出来的复杂场景下的试卷分割算法。为了实现上述目的,本专利技术创造采用的技术方案为:一种复杂场景下的试卷分割算法,其特征在于,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。所述的步骤1)中,具体方法为:1.1)将原始图像O通过颜色图像空间转换为灰度图像G;1.2)通过边缘检测算法提取G的图像边缘E。所述的步骤2)中,具体方法为:2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠ ...
【技术保护点】
1.一种复杂场景下的试卷分割算法,其特征在于,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。
【技术特征摘要】
1.一种复杂场景下的试卷分割算法,其特征在于,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。2.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤1)中,具体方法为:1.1)将原始图像O通过颜色图像空间转换为灰度图像G;1.2)通过边缘检测算法提取G的图像边缘E。3.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤2)中,具体方法为:2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠Aj;2.2)计算Ai的外接矩形Di,记作Di=F(Ai),其中Di=(Xi,Yi,Wi,Hi),Xi,Yi,Wi,Hi分别表示Di左上顶点横坐标、左上顶点纵坐标、Di的宽度、Di的高度。4.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤3)中,具体方法为:3.1)计算Di与Dj的IOU,其中Dj∈{Di|i∈[1,n],i≠j};3.2)设置阀值α,如果IOU>α,则Di←F(Ai∪...
【专利技术属性】
技术研发人员:李晓光,王麟腾,高猛,王世禹,
申请(专利权)人:辽宁大学,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。