当前位置: 首页 > 专利查询>辽宁大学专利>正文

一种复杂场景下的试卷分割算法制造技术

技术编号:21225278 阅读:26 留言:0更新日期:2019-05-29 06:01
一种复杂场景下的试卷分割算法,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。本发明专利技术提供的分割算法,在复杂场景下的试卷分割任务中具有很好的分割效果,可以很好的把字符区域、文本行区域、试题区域分割出来。

A Test Paper Segmentation Method in Complex Scene

A test paper segmentation algorithm in complex scenes is presented in the following steps: 1) image edge is obtained from original image by gray level transformation and edge detection algorithm; 2) connected area and its outer rectangle are calculated by image edge; 3) connected area is merged according to IOU of outer rectangle of different connected area; 4) character discrimination model is constructed based on convolutional neural network to guide the merging of connected area. After merging, the connected area is divided into character areas by rectangular contours; 5) the text line is constructed to segment the text line area by using the result of step 4; 6) the question number discrimination model is constructed based on convolutional neural network, and the test area is segmented by combining the result of step 5). The segmentation algorithm provided by the invention has good segmentation effect in the task of test paper segmentation under complex scenes, and can well segment character area, text line area and test question area.

【技术实现步骤摘要】
一种复杂场景下的试卷分割算法
本专利技术属于电子图像分割技术以及卷积神经网络领域,特别涉及一种复杂场景下的试卷分割算法。
技术介绍
随着智慧教育以及人工智能的发展,在诸多应用场景中,移动设备拍摄的试卷图像分割是其中一个关键环节。由于移动设备拍摄场景和角度不固定,图像的尺寸、清晰度、局部曝光程度往往具有不确定性,试卷本身存在手写体打印体混合等复杂场景。目前已经出现了上千种图像分割的方法,但是在复杂场景下的试卷分割任务中,对于字符区域、文本行区域、试题区域分割效果往往难以满足需求。
技术实现思路
为了解决上述问题,本专利技术针对复杂场景下的试卷图像,提供一种能够很好的将字符区域、文本行区域、试题区域分割出来的复杂场景下的试卷分割算法。为了实现上述目的,本专利技术创造采用的技术方案为:一种复杂场景下的试卷分割算法,其特征在于,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。所述的步骤1)中,具体方法为:1.1)将原始图像O通过颜色图像空间转换为灰度图像G;1.2)通过边缘检测算法提取G的图像边缘E。所述的步骤2)中,具体方法为:2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠Aj;2.2)计算Ai的外接矩形Di,记作Di=F(Ai),其中Di=(Xi,Yi,Wi,Hi),Xi,Yi,Wi,Hi分别表示Di左上顶点横坐标、左上顶点纵坐标、Di的宽度、Di的高度。所述的步骤3)中,具体方法为:3.1)计算Di与Dj的IOU,其中Dj∈{Di|i∈[1,n],i≠j};3.2)设置阀值α,如果IOU>α,则Di←F(Ai∪Aj)且D←D-{Dj}。所述的步骤4)中,具体方法为:4.1)通过卷积神经网络构建二分类字符判别模型M1;4.2)M1判别结果4.3)设置参数β,如果R1=M1(Di)=0且K={Aj|j∈[1,n],i≠j,Di与Dj中心距离<β},则计算R'1=M1(F(Ai∪K));其中,K为:与元素Ai外接矩形Di中心距离<β的元素Aj的集合;如果R'1=0,则D←D-{Di},否则Di←F(Ai+K)且D←D-K。所述的步骤5)中,具体方法为:5.1)D中每两个相近的元素Di与Dj形成一组,合并不同组直到无法合并为止,将合并结果记为L,即L←D;5.2)设置参数γ和δ,Di与Dj形成一组需要DiΘDj且DjΘDi成立,其中DiΘDj需要满足:①Di是D中距离Dj最小元素,且距离小于γ,②Di和Dj的垂直重合度大于δ。所述的步骤6)中,具体方法为:6.1)通过卷积神经网络构建二分类题号判别模型M2;6.2)M2判别结果6.3)按照Yi由小到大排序,以(Xi,Yi)为左上顶点,取Hi×Hi大小矩形区域记为Ti,计算R2=M2(Ti),如果R2=1,则合并{Lk|k∈[1,i-1]}且L←L-{Lk|k∈[1,i-1]},合并结果记为Q。本专利技术创造的有益效果为:本专利技术提供的基于卷积神经网络的字符判别模型指导连通区域合并以及基于卷积神经网络的题号判别模型划分试题区域的方法,在复杂场景下的试卷分割任务中具有很好的分割效果,可以很好的把字符区域、文本行区域、试题区域分割出来。附图说明图1:本专利技术创造算法流程图。图2:本专利技术创造提出的复杂场景下的试卷图像。图3:本专利技术创造提出的复杂场景下的试卷图像字符区域分割效果图。图4:本专利技术创造提出的复杂场景下的试卷图像文本行区域分割效果图。图5:本专利技术创造提出的复杂场景下的试卷图像试题区域分割效果图。具体实施方式1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘,具体方法为:1.1)将原始图像O通过颜色图像空间转换为灰度图像G;1.2)通过边缘检测算法提取G的图像边缘E。2)通过图像边缘计算连通区域以及其外接矩形,具体方法为:2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠Aj;2.2)计算Ai的外接矩形Di,记作Di=F(Ai),其中Di=(Xi,Yi,Wi,Hi),Xi,Yi,Wi,Hi分别表示Di左上顶点横坐标、左上顶点纵坐标、Di的宽度、Di的高度。3)根据不同连通区域外接矩形的IOU合并连通区域,具体方法为:3.1)计算Di与Dj的IOU,其中Dj∈{Di|i∈[1,n],i≠j};3.2)设置阀值α,如果IOU>α,则Di←F(Ai∪Aj)且D←D-{Dj}。4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域,具体方法为:4.1)通过卷积神经网络构建二分类字符判别模型M1;4.2)M1判别结果4.3)设置参数β,β代表Di与Dj中心允许最大距离,通常设置为10;如果R1=M1(Di)=0且K={Aj|j∈[1,n],i≠j,Di与Dj中心距离<β},则计算R'1=M1(F(Ai∪K));其中K为:与元素Ai外接矩形Di中心距离<β的元素Aj的集合;如果R'1=0,则D←D-{Di},否则Di←F(Ai∪K)且D←D-K。5)利用步骤4)分割结果,通过文本线构造法分割文本行区域,具体方法为:5.1)D中每两个相近的元素Di与Dj形成一组,合并不同组直到无法合并为止,将合并结果记为L,即L←D;5.2)设置参数γ和δ,Di与Dj形成一组需要DiΘDj且DjΘDi成立,其中DiΘDj需要满足:①Di是D中距离Dj最小元素,且距离小于γ,②Di和Dj的垂直重合度大于δ。γ代表文本线构造时,Di与Dj之间最小距离的最大值,通常设置为10;δ代表文本线构造时,Di与Dj垂直方向重叠度最小值,通常设置为0.7;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域,具体方法为:6.1)通过卷积神经网络构建二分类题号判别模型M2;6.2)M2判别结果6.3)按照Yi由小到大排序,以(Xi,Yi)为左上顶点,取Hi×Hi大小矩形区域记为Ti,计算R2=M2(Ti),如果R2=1,则合并{Lk|k∈[1,i-1]}且L←L-{Lk|k∈[1,i-1]},合并结果记为Q。实施例1:下面结合附图对本专利技术作进一步描述。以下实施仅用于更加清楚的说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。图2为本专利技术提出的复杂场景下的试卷图像,经过灰度变换以及边缘检测算法得到图像边缘;通过图像边缘计算连通区域以及其外接矩形;根据不同连通区域外接矩形的IOU合并连通区域;基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;利用字符区域分割结果通过文本线构造法分割文本行区域;基于卷积神经网络构建题号判别模型,结合文本行分割结果分割试题区域。本专利技术提出的复杂场景下的试卷图像分割算法流程图如图1所示,该算法具体实施包括以下步骤:步骤一:将图2通过本文档来自技高网...

【技术保护点】
1.一种复杂场景下的试卷分割算法,其特征在于,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。

【技术特征摘要】
1.一种复杂场景下的试卷分割算法,其特征在于,其步骤为:1)由原始图像通过灰度变换以及边缘检测算法得到图像边缘;2)通过图像边缘计算连通区域以及其外接矩形;3)根据不同连通区域外接矩形的IOU合并连通区域;4)基于卷积神经网络构建字符判别模型,指导连通区域合并,合并后连通区域外接矩形分割字符区域;5)利用步骤4)分割结果,通过文本线构造法分割文本行区域;6)基于卷积神经网络构建题号判别模型,结合步骤5)分割结果分割试题区域。2.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤1)中,具体方法为:1.1)将原始图像O通过颜色图像空间转换为灰度图像G;1.2)通过边缘检测算法提取G的图像边缘E。3.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤2)中,具体方法为:2.1)提取E的连通区域集A,其中A由n个小连通区域Ai组成,即A={Ai},i∈[1,n],且当i≠j时Ai≠Aj;2.2)计算Ai的外接矩形Di,记作Di=F(Ai),其中Di=(Xi,Yi,Wi,Hi),Xi,Yi,Wi,Hi分别表示Di左上顶点横坐标、左上顶点纵坐标、Di的宽度、Di的高度。4.根据权利要求1所述的一种复杂场景下的试卷分割算法,其特征在于:所述的步骤3)中,具体方法为:3.1)计算Di与Dj的IOU,其中Dj∈{Di|i∈[1,n],i≠j};3.2)设置阀值α,如果IOU>α,则Di←F(Ai∪...

【专利技术属性】
技术研发人员:李晓光王麟腾高猛王世禹
申请(专利权)人:辽宁大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1